본문 바로가기

R 데이터프레임(DF) grep & gsub 이번에는 grep함수와 gsub함수 기능에 대해서 알아보자grep은 해당 조건에 대한 검색으로 데이터프레임에서 like 검색 시 사용할 수 있으며gsub은 문자열 치환 replace기능과 같다. 우선 샘플 데이터프레임을 생성하자model.df 더보기
R evel함수활용 : String Source Code Execute R에서 eval함수를 활용하여 문자열 소스 코드를 실행하는 방법을 알아보자. R에서도 javascript의 eval함수와 동일한 기능을 제공하는 eval함수가 존재한다.이 함수가 필요한 이유는 몇가지 있을 수 있겠지만 나는 아래와 같은 이유로 해당 함수를 사용하게 되었다. 회귀분석을 진행하던 중 여러변수를 가지고 regression할 필요가 생겼다.lm(PRICE ~ VALUE1, data = df)lm(PRICE ~ VALUE1 + VALUE2, data = df).... 반복 .... 그래서 처음에는 아래와 같이 시도를 하였다.var 더보기
R 데이터프레임(DF) Select Column Distinct R에서 lm(linear regression)와 같은 분석을 할 경우 해당 데이터프레임 종속변수(관측변수)를 제외한 값이 모두 동일할 경우가 있다. 이와 같은 데이터프레임을 체크 확인하는 방법을 알아보자. 우선 샘플 데이터프레임을 생성하자model.df levels(as.factor(rowMeans(model.df))) [1] "998951.2" "1208963.6" "1315293.2"> length(levels(as.factor(rowMeans(model.df)))) [1] 3결국 해당 데이터프레임의 반복되는 값의 level갯수는 3건 이상이다. 여기서 문제는 분석할 대상의 종속변수 PRICE가 포함되어 있음이다.PRICE값을 제외할 필요가 있다.그렇다면 위 코드를 아래와 같이 수정할 필요가 있다.r.. 더보기