본문 바로가기

R

R 데이터프레임(DF) grep & gsub 이번에는 grep함수와 gsub함수 기능에 대해서 알아보자grep은 해당 조건에 대한 검색으로 데이터프레임에서 like 검색 시 사용할 수 있으며gsub은 문자열 치환 replace기능과 같다. 우선 샘플 데이터프레임을 생성하자model.df 더보기
R evel함수활용 : String Source Code Execute R에서 eval함수를 활용하여 문자열 소스 코드를 실행하는 방법을 알아보자. R에서도 javascript의 eval함수와 동일한 기능을 제공하는 eval함수가 존재한다.이 함수가 필요한 이유는 몇가지 있을 수 있겠지만 나는 아래와 같은 이유로 해당 함수를 사용하게 되었다. 회귀분석을 진행하던 중 여러변수를 가지고 regression할 필요가 생겼다.lm(PRICE ~ VALUE1, data = df)lm(PRICE ~ VALUE1 + VALUE2, data = df).... 반복 .... 그래서 처음에는 아래와 같이 시도를 하였다.var 더보기
R 데이터프레임(DF) Select Column Distinct R에서 lm(linear regression)와 같은 분석을 할 경우 해당 데이터프레임 종속변수(관측변수)를 제외한 값이 모두 동일할 경우가 있다. 이와 같은 데이터프레임을 체크 확인하는 방법을 알아보자. 우선 샘플 데이터프레임을 생성하자model.df levels(as.factor(rowMeans(model.df))) [1] "998951.2" "1208963.6" "1315293.2"> length(levels(as.factor(rowMeans(model.df)))) [1] 3결국 해당 데이터프레임의 반복되는 값의 level갯수는 3건 이상이다. 여기서 문제는 분석할 대상의 종속변수 PRICE가 포함되어 있음이다.PRICE값을 제외할 필요가 있다.그렇다면 위 코드를 아래와 같이 수정할 필요가 있다.r.. 더보기
R 데이터프레임(DF) Select Column R에서 lm(linear regression)와 같은 분석을 할 경우 해당 데이터프레임에서 제외할 컬럼이 있을 수 있다.만약 컬럼내의 값이 모두 같으면 분석 대상에서 제외해야 한다.제외하지 않고 lm분석을 할 경우 에러를 발생시킨다. 분석할 데이터프레임에서 분석 대상이 되는 컬럼만 선택하거나 분석 대상에서 제외되는 컬럼을 제거하는 방법을 알아 보자. 우선 샘플 데이터프레임을 생성하자model.df 더보기
R 데이터프레임(DF) Group By Sum R에서 데이터프레임을 Group by Sum하는 방법이다. 우선 샘플 데이터프레임을 생성하자data 더보기
R 데이터프레임(DF) 조건 검색 R에서 데이터프레임을 조건 검색하는 방법이다. 우선 샘플 데이터프레임을 생성하자data 더보기
R PDF생성 시 한글폰트 깨짐 문제 ggplot2로 차트를 생성 후 PDF를 저장하니 차트내 한글폰트가 깨지는 현상이 발생하였다.(png나 svg등 타 파일형식은 문제 없이 동작했다.) 물론 한글폰트 문제라 생각하고 접근하였지만 당최 폰트도 설치하고 폰트설정도 해봤지만 문제는 해결되지 않았다. > chart ggsave(file="/home/y2kpooh/save/test.pdf", plot=chart) 위와 같이 실행하여 pdf를 생성하게 되면 한글폰트에 대하여 warning가 뜨게 된다.warning()을 실행하여 메세지를 확인하면 한글폰트 생성 시 에러가 발생하여 위 그림 처럼 한글폰트가 깨지게 된다. 위 증상을 해결하기 위하여 device에서 pdf생성을 담당(?)하는 pdf(grDevices)를 확인해보니 폰트지정이 가능하더라.그.. 더보기
R을 이용한 중심극한정리 1. 중심극한정리? 중심극한정리(Central Limit Theorem, CLT)는 동일한 확률분포를 가진 독립 확률 변수 n개의 평균값은 n이 적당히 크다면 정규분포에 가까워진다는 정리이다. 수학자 피에르시몽 라플라스는 1774년에서 1786년 사이의 일련의 논문에서 이러한 정리의 발견과 증명을 시도하였다. 확률과 통계학에서 큰 의미가 있으며 실용적인 면에서도 품질관리, 식스 시그마에서 많이 이용된다.(위키 발췌) 2. R로 증명하기 데이터 샘플을 만들어보면...1~6의 수를 가진 주사위를 5번씩 던지며 그 작업을 500번 반복하는 데이터를 R에서 제공하는 sample 함수를 통해서 만들어보면 아래와 같다. sample 더보기
rChart 1. rChart란?rChart는 R에서 자바스크립트 그래프를 그려주는 라이브러리이다. 2. rChart설치 R console에서 아래와 같이 설치할 수 있다.> install.package('devtools') 혹시 아래와 같은 실패 메세지가 나올 경우가 있다. 현재 R버전에서는 지원이 되지 않을 수도 있다.Warning in install.packages : package ‘devtools’ is not available (for R version 2.15.2) 그렇다면 아래와 같이 devtool 이전버전을 설치하면 된다.> dl fl download.file( dl , fl ) > install.packages( fl , lib = .libPaths()[1] , repos = NULL , type .. 더보기
[JRI] R Parsing data.frame to JSON R에서 제공하는 DataSet을 이용하여 JSON형태로 변환해보자. R에는 다양한 DataSet(data.frame 형태)이 내장되어있다.DataSet 목록은 아래의 명령어로 확인 가능하다. > library(help=datasets) iris DataSet의 일부를 head 메소드로 확인해보면 아래와 같다.> head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 여러 D.. 더보기