이론

이론

[신약 개발] IC50_nM 값 예측을 위한 손실 함수 선택 가이드

IC50_nM 값의 예측 모델을 만들 때,손실 함수를 어떻게 선택하느냐에 따라 모델의 성능과 결과가 크게 달라질 수 있습니다. 이번 글에서는 IC50_nM 값 분포에 적합한 손실 함수 세 가지, 즉 MSLE(Mean Squared Logarithmic Error), MAE(Mean Absolute Error), 그리고 Huber Loss에 대해 알아보고, 각 손실 함수의 장단점을 비교하여 어떤 상황에서 사용하면 좋을지 설명드리겠습니다.1. MSLE (Mean Squared Logarithmic Error)MSLE는 예측 값과 실제 값의 로그 차이의 제곱을 구하는 손실 함수입니다.값의 절대적인 차이보다 비율을 중시하므로, IC50_nM처럼 값이 크게 변동하는 데이터에 적합합니다. 공식:$$ MSLE = \..

이론

[Loss function][Regression][MAE][MSE][L1 loss][L2 loss][Huber loss]Regression loss function,회귀에서 손실함수

1. Regression, Loss function회귀 모델을 학습할 때, 모델이 예측한 값과 실제 값 사이의 차이를 측정하는**손실 함수(Loss Function)**는 매우 중요한 역할을 합니다.손실 함수는 모델이 학습하는 방향을 결정하고, 그 성능을 좌우합니다.회귀 분석에서 자주 사용되는 손실 함수로는MAE(Mean Absolute Error),MSE(Mean Squared Error),그리고 Huber Loss가 있습니다.이번 글에서는 이 세 가지 손실 함수의 차이점과 특징을 살펴보겠습니다.1) 평균 절대 오차 (MAE: Mean Absolute Error, L1 loss)MAE는 예측 값과 실제 값의 차이의 절대값을 평균내는 방식으로,오차가 클수록 손실이 선형적으로 증가하는 특징을 가지고 있습니..

이론

[SMILES][분자 구조][신약 개발]Simplified Molecular Input Line Entry System

SMILES(Simplified Molecular Input Line Entry System)SMILES란?정의: SMILES는 분자 구조를 문자열 형태로 표현하는 표기법입니다.사용 목적: 분자의 정보를 간단히 표현하여 데이터로 관리하고, 컴퓨터 알고리즘에 활용할 수 있습니다.SMILES의 구성 요소원자(Atom): 각 원소를 기호로 표기.결합(Bond): 단일(-), 이중(=), 삼중(#) 결합 등으로 표기.고리(Ring): 고리의 시작과 끝을 숫자로 표시.방향족(Aromaticity): 벤젠과 같은 방향족 고리를 소문자로 표기.가지(Branch): 가지는 괄호()로 표현.SMILES의 예시Aspirin: CC(=O)OC1=CC=CC=C1C(O)=O비슷한 구조의 화합물: CCC1=CC=C(OC(C)=O..

이론

[Sensitivity analysis][Subgroup analysis]민감도 분석,하위그룹 분석

Intro - 민감도 분석 및 하위 그룹 분석은 데이터 분석 및 연구 조사에 사용되는 두 가지 통계 방법 - 두 방법 모두 분석 결과에 대한 서로 다른 변수의 영향을 탐색하는 데 사용되지만 초점과 목적이 다름 Sensitivity analysis - 민감도 분석은 분석에 사용된 가정, 방법 또는 매개변수의 변화에 ​​대한 연구 결과의 견고성을 테스트하는 데 사용되는 방법 - 분석에서 하나 이상의 변수를 변경하여 결과가 어떻게 변경되는지 확인함 - 민감도 분석의 목적은 결과의 주요 동인을 식별하고 결과의 불확실성을 평가하며 연구의 타당성과 신뢰성을 보장하는 것 Subgroup analysis - 하위 그룹 분석은 인구의 여러 하위 그룹에 걸쳐 치료 또는 개입 효과의 차이를 탐색하는 데 사용되는 방법 - 인..

이론

[API][REST API][RESTful API] API, REST API 이론

0. API 1. REST API 2. RESTful API 3. get vs post 0. API - 프로그램 간 상호작용 촉진, 정보교환 - 호출(client) > 응답(server) - 규격: JSON, XML, HTML 등 - application 분리 1. REST API(Representational State Transfer API) - REST 기반으로 API 구현 - 최근 open API의 대부분이 REST API 형식 - micro 서비스, 하나의 Application을 작은 단위로 쪼개어 통합하여 구현 - 시스템 분산 > 확장성, 재사용성 ↑ > 유지보수 및 운용, 운영의 편리성 ↑ - HTTP 표준으로 구현 설계 기본 규칙 도큐먼트: 객체 인스턴스나 데이터베이스 레코드와 유사한 개념..

이론

[MLOps] MLOps 정리

MLOps(Machine Learning Operations) - AI 기반의 서비스를 효율적으로 관리하기 위한 통합 관리 원칙 - 학술계에서는 큰 필요성을 못느끼나 서비스를 지속관리해야하는 산업계에서는 필수적 AI 개발의 스포트라이트 ‘MLOps’ A to Z 알아보기(NVIDIA) ref: https://blogs.nvidia.co.kr/2020/09/11/what-is-mlops/ MLOps: 머신러닝의 지속적 배포 및 자동화 파이프라인(Google Cloud) MLOps 수준 0: 수동 프로세스 MLOps 수준 1: ML 파이프라인 자동화 MLOps 수준 2: CI/CD 파이프라인 자동화 ref: https://cloud.google.com/architecture/mlops-continuous-d..

이론

[ML][performance matrics] Performance matrics, imbalanced dataset

Performance matrics Confusion matrix Accuracy Precision, Recall F1-score TPR, FPR ROC curve imbalanced dataset Confusion matrix Accuracy (TP+TN)/(TP+TN+FP+FN) Precision, Recall Precision: TP/(TP+FP) Recall: (TP)/(TP+FN) F1-score 2 * (precision*recall)/(precision+recall) TPR, FPR TPR = (TP)/(TP+FN) = Recall FPR = (FP)/(FP+TN) ROC curve imbalanced dataset 1. negative class(0) > positive class(1) h..

Chandler.j
'이론' 카테고리의 글 목록 (2 Page)