덴하덴하♬
오늘은 boxplot그리는 것에 대해서 알아 볼거예유
boxplot은 보통 연속형 변수들의 기본 통계를 보기 위해서 사용하는데
평균값과 outlier들의 분포를 보기 위해서 R에서 자주 사용되는 그래프 중에 하나예유
보통 하나의 연속형 변수를 이용해서 하나의 boxplot을 그리긴 하는데
가끔씩 두가지 이상의 변수를 한번에 비교하기 위해서 multiple boxplot이 필요할때도 있어유
저 같은 경우에는 이번에 다른 식을 이용해서 기본 통계량들을 비교하기 위해서 사용했는데
1. 데이터 형식
아래의 그림과 같이 wide로 되어 있다면 long형식으로 변환을 해주어야 해유
저는 tidyr 패키지에서 gather, spread 함수를 보통 사용하는데유
wide → long : gather(), long → wide : spread()
ex) gather(data, "new_column_name1", "new_column_name2", transformation column)
fin_gather <- gather(fin_mu, eGFR_type, value, 12:13)
2. boxplot
보통 single boxplot은 아주 간단하게 boxplot(data)로 그리면 되유
multiple boxplot도 여기에 fomula option 하나만 추가해서 간단하게 그릴 수 있어유
ex) boxplot(formula=value~type, data=df) 끝!
boxplot(formula=value~eGFR_type, data=df_eGFR,
col=c("blue", "red"))
multiple boxplot 그리기 참 쉽쥬 ?? 쫄지 말고 그려 보라구~