R

R

[R][stringdist]Approximate matching and string distance

1. stringdist 2. Tutorial 1. stringdist - stringdist 라이브러리는 문자열 간의 거리를 계산하는 다양한 함수를 제공합니다. - Levenshtein, Jaro-Winkler, Damerau-Levenshtein 등의 거리 측정 방법을 지원하며, 이를 통해 문자열 유사도를 측정할 수 있습니다. - 텍스트 마이닝, 자연어 처리 등의 분야에서 활용되며, 데이터 분석 및 시각화에도 유용하게 사용됩니다. - Github - RDocumentation - Docs: PDF 2. Tutorial - library library(data.table) library(stringdist) - sample data cat("================================st..

R

[R][SQL][Adherence]다중 처방에서 복약 순응도,Multiple Medication Adherence

1. Adherence, Method (MPR, PDC) 2. Multiple Medication 3. Code (R, SQL) 1. Adherence, Method (MPR, PDC) Adherence, 복약순응도, 치료지속도, 관련 자강두천 Method MPR, Medication Possession Ratio 겹치는 기간 고려 상관없이 모든 약물 처방일 수를 분자로 사용 PDC, Proportion of Days Covered 겹치는 기간을 shift 해서 일수를 보장해줌 분모는 설정하기 나름으로 보임 끝나는 날짜를 커스텀 study end date나 exposure 또는 era end date등으로 설정 ex) drug_era로 하면 MPR = sum(days supply) / end_date -..

R

[R][metafor][Meta Analysis]메타분석, 고정 효과 모형,임의 효과 모형,Fixed effects model, Random effects model

1. Meta Analysis 2. Effects model 3. metafor (R, package) 1. Meta Analysis - from chatGPT 메타 분석(Meta-analysis)은 다양한 연구나 실험 결과를 통합하여 통계적으로 종합하는 분석 기법입니다. 이를 통해 개별 연구의 결과를 넘어 다수의 연구 결과를 종합적으로 평가할 수 있으며, 보다 정확하고 강력한 결론을 도출하는 데 도움이 됩니다. 메타 분석은 주로 의학, 사회과학, 교육, 경영, 공학 등 다양한 분야에서 사용됩니다. 메타 분석의 주요 특징과 단계는 다음과 같습니다: 1. 연구 선택 및 검색: 메타 분석의 시작 단계는 연구를 선택하고 관련 문헌을 검색하는 것입니다. 연구의 선정 기준과 검색 전략을 정의하고 관련 문헌을 수집..

R

[R][package][moonBook][mytable()] moonBook package로 R data 쉽게 정리하기

1. moonBook pacakges 2. Explore a mytable() function 3. Densityplot 4. ORplot 5. HRplot 1. moonBook pacakges - library and sample dataset require(moonBook) data(acs) str(acs) 2. Explore a mytable() function - basic fuction mytable(acs) mytable(~.,data=acs) # select + variables mytable(~age+sex, data=acs) # select - variables mytable(~.-age-sex, data=acs) - by group mytable(sex~., data=acs) mytab..

R

[R][Survival Analysis] 심화: 생존 분석, 메타 분석, Kaplan-Meier curve, Cox-hazard, Hazard Ratio, Forestplot, Meta analysis

0. Previous posting 1. Sample data 2. Coxph model 3. Hazard Ratio Table 4. Meta analysis 5. Forestplot 6. Kaplan-Meier 0. Previous posting - Survival 기본 학습 2023.04.10 - [R] - [R][Survival Analysis] 생존 분석, Kaplan-Meier curve, Cox-hazard, Hazard Ratio [R][Survival Analysis] 생존 분석, Kaplan-Meier curve, Cox-hazard, Hazard Ratio 1. 생존 분석 이론 2. Tutorial 3. Advanced 1.생존 분석 이론 - From ChatGPT Survival An..

R

[R][ARR] Absolute Risk Reduction, confidence interval

0. Reference 1. Sample dataset 2. ARR 3. Interpretation 0. Reference - https://en.wikipedia.org/wiki/Risk_difference Risk difference - Wikipedia From Wikipedia, the free encyclopedia The adverse outcome (black) risk difference between the group exposed to the treatment (left) and the group unexposed to the treatment (right) is −0.25 (RD = −0.25, ARR = 0.25). The risk difference (RD), excess ris ..

R

[R][Survival Analysis] 생존 분석, Kaplan-Meier curve, Cox-hazard, Hazard Ratio

1. 생존 분석 이론 2. Tutorial 3. Advanced 1.생존 분석 이론 - From ChatGPT Survival Analysis는 시간에 따른 사건(예: 사망, 질병 발생 등)이 일어날 확률을 계산하는 분석 방법입니다. [2] 이를 위해 전문 회귀 모형을 사용하여 실패가 발생하기 전까지의 시간의 길이에 영향을 미치는 다양한 요인들의 기여도를 계산합니다. 이 분석 방법은 생존 곡선을 통해 결과를 시각화할 수 있으며, 이는 시간에 따른 생존율을 보여줍니다. [3] Survival Analysis는 종양학 분야에서 널리 사용되며, Kaplan-Meier 방법을 사용하여 생존 분석을 수행하는 경우가 많습니다. [1] - Censoring(중도절단) 데이터의 측정값이나 관찰치가 부분적으로만 알려진 ..

R

[R] dplyr, data.table, dtplyr, speed check

0. data analysis in R 1. dplyr 2. data.table 3. dtplyr 4. speed test 0. data analysis in R - R에서 데이터 분석을 할때 가장 많이 사용하는 것은 아마 dplyr일 것임 (아무튼 필자는 그럼) - 데이터 규모가 커지게 되면 느려지는데 data.table은 확실히 dplyr 보다 빨라서 big data에서는 data.table 사용 - dplyr과 data.table을 혼용해서 필요에 따라(?) 사용중 - dtplyr이라는 패키지가 있다는 소식을 들음 - dplyr vs data.table vs dtplyr 에 대해 알아보자 1. dplyr - data analysis의 기본: documentation https://cran.r-pro..

Chandler.j
'R' 카테고리의 글 목록