반응형 Threshold2 [python][binary classification][Probability][threshold][performance]Best threshold Method 1. 요약이진 분류 모델을 사용하여 결과를 예측할 때, 모델은 주로 확률값을 출력합니다. 이 확률값을 바탕으로 예측을 양성(Positive) 또는 음성(Negative)으로 변환할 때, 임계값(threshold)을 선택해야 합니다. 기본적으로 0.5를 많이 사용하지만, 데이터의 불균형이나 문제의 특성에 따라 0.5는 최적의 임계값이 아닐 수 있습니다. 따라서 임계값을 올바르게 선택하면 모델의 성능을 크게 향상시킬 수 있습니다.2. 방법론최적의 임계값을 선택하는 방법은 다양하며, 각각의 방법은 모델이 달성하려는 목표에 따라 다르게 적용됩니다.1) ROC Curve와 Youden's J StatisticROC (Receiver Operating Characteristic) 곡선은 TPR(진양성률, True .. 2024. 9. 6. [python] best threshold & roc-curveBest threshold를 찾고 roc curve에 표시하기 binary classification에서 best threshold를 찾고 roc-curve에 표시해보자 best threshold는 Youden’s J statistic를 이용한다. 참고: en.wikipedia.org/wiki/Youden%27s_J_statistic Youden's J statistic - Wikipedia From Wikipedia, the free encyclopedia Jump to navigation Jump to search Index that describes the performance of a dichotomous diagnostic test Youden's J statistic (also called Youden's index) is a single statisti.. 2021. 1. 18. 이전 1 다음