본문 바로가기
Data Insider

[R] boxplot, multiple boxplot 간단하게 그리기

by Chandler.j 2020. 1. 22.
반응형

덴하덴하♬

오늘은 boxplot그리는 것에 대해서 알아 볼거예유

 

boxplot은 보통 연속형 변수들의 기본 통계를 보기 위해서 사용하는데

평균값outlier들의 분포를 보기 위해서 R에서 자주 사용되는 그래프 중에 하나예유

 

기본적인 boxplot graph

보통 하나의 연속형 변수를 이용해서 하나의 boxplot을 그리긴 하는데

가끔씩 두가지 이상의 변수를 한번에 비교하기 위해서 multiple boxplot이 필요할때도 있어유

 

저 같은 경우에는 이번에 다른 식을 이용해서 기본 통계량들을 비교하기 위해서 사용했는데

 

1. 데이터 형식

아래의 그림과 같이 wide로 되어 있다면 long형식으로 변환을 해주어야 해유

citation: https://statkclee.github.io/r-novice-gapminder/14-tidyr-kr.html

저는 tidyr 패키지에서 gather, spread 함수를 보통 사용하는데유

wide → long : gather(), long → wide : spread()

 

ex) gather(data, "new_column_name1", "new_column_name2", transformation column)

fin_gather <- gather(fin_mu, eGFR_type, value, 12:13)

 

2. boxplot

보통 single boxplot은 아주 간단하게 boxplot(data)로 그리면 되유

multiple boxplot도 여기에 fomula option 하나만 추가해서 간단하게 그릴 수 있어유

 

ex) boxplot(formula=value~type, data=df) 끝!

boxplot(formula=value~eGFR_type, data=df_eGFR,
        col=c("blue", "red"))
        

multiple boxplot 그리기 참 쉽쥬 ?? 쫄지 말고 그려 보라구~


TOP

Designed by 티스토리