text mining이나 NLP를 하다보면 문장을 단어 수로 나눠 보는 경우가 생길 수 있는 데유 그중 R에서 간단하게 하는 방법을 알려드리쥬
방법은 sapply와 strsplit을 이용해서 간단하게 만들 수 있어유
1) 우선 텍스트 string data를 불러오고
df_rec_work <- read.csv(
"D:/google/workground/datasea/text_mining/clear_version/df_exam_result_v3_2.csv",
fileEncoding = "utf-8", stringsAsFactors = F)
2) "word_count" column 추가 value = sapply + strsplit 을 이용
df_rec_work$word_count <- sapply(strsplit(df_rec_work$rec, " "), length)
아래와 같이 word_count column 이 추가 된것을 확인 할 수 있음,,,