1. Meta Analysis
2. Effects model
3. metafor (R, package)
1. Meta Analysis
- from chatGPT
메타 분석(Meta-analysis)은 다양한 연구나 실험 결과를 통합하여 통계적으로 종합하는 분석 기법입니다. 이를 통해 개별 연구의 결과를 넘어 다수의 연구 결과를 종합적으로 평가할 수 있으며, 보다 정확하고 강력한 결론을 도출하는 데 도움이 됩니다. 메타 분석은 주로 의학, 사회과학, 교육, 경영, 공학 등 다양한 분야에서 사용됩니다.
메타 분석의 주요 특징과 단계는 다음과 같습니다:
1. 연구 선택 및 검색: 메타 분석의 시작 단계는 연구를 선택하고 관련 문헌을 검색하는 것입니다. 연구의 선정 기준과 검색 전략을 정의하고 관련 문헌을 수집합니다.
2. 데이터 추출: 선정된 연구에서 필요한 데이터를 추출합니다. 이 데이터는 효과 크기(effect size), 표준 오차(standard error), 연구 특성 등을 포함할 수 있습니다.
3. 효과 크기 추정: 추출한 데이터를 기반으로 각 연구의 효과 크기를 추정합니다. 효과 크기는 연구 결과의 핵심적인 측정 값으로, 예를 들면 평균 차이, 상관 관계 계수, 혹은 위험 비율 등이 될 수 있습니다.
4. 가중치 계산: 각 연구의 효과 크기에 가중치를 부여합니다. 이 가중치는 연구의 크기, 품질, 불확실성 등을 고려하여 정해집니다. 더 큰 연구나 더 정확한 연구는 더 높은 가중치를 받게 됩니다.
5. 통계 분석: 추정된 효과 크기와 가중치를 사용하여 메타 분석 모델을 적합시킵니다. 이 모델은 연구 간의 변이(효과 크기의 차이)를 설명하고, 종합적인 효과 크기를 계산합니다. 주로 고정 효과 모델과 랜덤 효과 모델을 사용합니다.
6. 결과 해석: 메타 분석의 결과를 해석하고 종합적인 효과 크기와 신뢰 구간을 확인합니다. 이를 통해 특정 가설이나 연구 문제에 대한 결론을 도출합니다.
7. 통계적 검토 및 불확실성 고려: 메타 분석 결과에 대한 통계적 검토를 수행하고 불확실성을 고려합니다. 이는 메타 분석 결과의 신뢰성을 높이는데 도움이 됩니다.
8. 보고 및 발표: 메타 분석 결과를 학술 논문이나 보고서로 정리하고 발표합니다. 결과를 과학적인 공동체와 공유하며, 정확한 정보 전달과 의사 결정에 도움을 줍니다.
메타 분석은 다양한 연구 결과를 종합적으로 분석하여 합리적인 결론을 도출하는 강력한 도구로, 연구 결과의 일반화와 의사 결정에 큰 도움을 줍니다.
- 요약
* 다양한 연구들로 부터 얻은 값들을 이용하여 대표값을 산출하고 그 결과를 해석하는 것
* HR, RR, OR 같은 비례값들을 이용하여 메타분석시 log 값(+se)을 이용해서 가중치 계산
> 대부분의 통계분석은 정규분포를 가정하기 때문에 이것에 맞추어 해석하려는 경향이 있음.
> 비례값들은 0 하위를 포함하지 못하기 때문에 정규 분포 가정을 위배 > log 값을 이용함.
2. Effects model
- 대표값을 산출하는 통계분석 방법에 따른 weight를 계산하는 과정이 핵심
- from chatGPT
1. 고정 효과 모델 (Fixed Effect Model):
1) 가정: 고정 효과 모델은 모든 연구가 동일한 효과 크기를 가진다고 가정합니다. 즉, 각 연구의 차이는 오차에 해당하며, 진정한 효과 크기는 모든 연구에서 동일합니다.
2) 가중치 계산: 가중치는 주로 연구의 크기(표본 크기)에 비례하여 계산됩니다. 큰 연구는 더 많은 가중치를 받고, 작은 연구는 적은 가중치를 받습니다.
3) 적용: 고정 효과 모델은 진정한 효과 크기가 일정하다고 가정하기 때문에 연구 간 효과 크기의 차이가 작을 때 사용됩니다. 이 모델은 연구 간 효과 크기가 크게 다를 경우 정확한 결과를 얻지 못할 수 있습니다.
2. 랜덤 효과 모델 (Random Effects Model):
1) 가정: 랜덤 효과 모델은 연구 간에 효과 크기가 다를 수 있다고 가정합니다. 즉, 연구 간의 차이가 모집단 내의 다양성을 반영한다고 봅니다.
2) 가중치 계산: 가중치는 고정 효과 모델처럼 연구의 크기를 고려하면서도 추가적으로 연구 간의 변동성을 반영하는 항목이 포함됩니다. 이 변동성 항목은 연구 간 효과 크기의 다양성을 고려하여 가중치를 조절합니다.
3) 적용: 랜덤 효과 모델은 연구 간 효과 크기가 크게 다를 가능성이 있거나 연구 자체가 다양한 모집단에서 추출되었을 때 사용됩니다. 이 모델은 고정 효과 모델보다 보수적이며, 연구 간의 다양성을 고려하여 결과를 종합합니다.
랜덤 효과 모델은 일반적으로 더 현실적이며 유연한 모델로 간주됩니다. 그러나 연구 간의 효과 크기의 차이가 작을 때는 고정 효과 모델도 유용할 수 있습니다. 메타 분석을 수행할 때 모델을 선택하는 것은 연구 데이터와 연구 질에 따라 다를 수 있으며, 연구 간의 효과 크기의 다양성을 고려하여 모델을 선택하는 것이 중요합니다.
- TIP
고정 효과 모델과 랜덤 효과 모델의 결과가 동일할 수 있는데, 이것은 연구간분산이 0이라서 나오는 현상이다.
메타분석에서 분산을 계산할 때 연구간의 차이(변량)를 만들고 이것을 타우라고 하며 분산으로 사용된다.
고정 효과 모델은 연구내 변량만을 사용해서 분산으로 사용하며
랜덤 효과 모델은 연구내 변량 + 연구간 변량을 계산해서 분산으로 사용하는데, 연구간 변량이 0이면 두 결과는 같다.
3. metafor (R, package)
- Meta Analysis package in R: metafor
https://www.metafor-project.org/doku.php/metafor
- Model Type
rma 기능 사용시 method="FE", method="REML", method="ML" 옵션을 줄 수 있다.
"FE"의 경우 고정 효과 모형이며
"REML", "ML"은 임의 효과 모형이다.
- REML vs ML
REML과 ML에 따라서 미세한 차이가 존재하기는 하나 둘다 임의 효과 모형으로 메타분석을 진행했다고 볼 수 있다.
- "REML" (Restricted Maximum Likelihood):
- 추정 방법: "REML" 방법은 제한된 최대 우도 방법입니다. 이 방법은 모델 파라미터를 추정할 때 랜덤 효과를 고려하면서도, 이러한 랜덤 효과가 모델에 포함될 때 나타나는 편향을 보정합니다. 따라서 "REML"은 랜덤 효과 모델의 추정에 특히 유용하며, 잡음 효과를 고려한 모델의 파라미터를 추정하는 데 사용됩니다.
- 용도: "REML" 방법은 주로 메타 분석에서 랜덤 효과 모델을 사용할 때 권장됩니다. 이 방법은 효과 크기와 잡음 효과(랜덤 효과)의 분리된 추정을 제공하며, 효과 크기에 대한 더 안정적인 추정치를 제공합니다.
- "ML" (Maximum Likelihood):
- 추정 방법: "ML" 방법은 최대 우도 방법으로, 모델 파라미터를 추정할 때 랜덤 효과의 효과를 고려하지 않고 추정합니다. 따라서 "ML"은 효과 크기와 잡음 효과를 함께 추정하는 방법이며, 추정치에 약간의 편향이 있을 수 있습니다.
- 용도: "ML" 방법은 주로 고정 효과 모델에서 사용되며, 랜덤 효과를 무시하고 모델 파라미터를 추정하는 데 사용됩니다. 메타 분석에서는 일반적으로 "ML" 보다는 "REML" 방법이 더 권장되는 경향이 있습니다.
sample size가 비교적 클때 "ML" 이 적절하며
sample size가 비교적 작을때 "REML"이 적절하다는 의견이 있다.
ref
https://stats.stackexchange.com/questions/48671/what-is-restricted-maximum-likelihood-and-when-should-it-be-used
https://stats.stackexchange.com/questions/99895/why-does-one-have-to-use-reml-instead-of-ml-for-choosing-among-nested-var-cova/171529#171529
https://aitechtrend.com/choosing-the-right-statistical-method-maximum-likelihood-vs-reml/
- Tutorial 이전글 참고