본문 바로가기
반응형

Data Science243

[OMOP CDM][PostgreSQL]OMOP CDM Local 에 구현하기 DatasetCMS dataset https://redivis.com/datasets/ye2v-6skh7wdr7 - 회원 가입 후 해당 자료 무료 다운로드 가능 (아래의 8개 테이블만 사용) EnviromentsOS: Window 11PostgreSQL: 16.4 https://www.enterprisedb.com/downloads/postgres-postgresql-downloads- PostgreSQL 설치할 때 pgAdmin도 함께 설치Create Database- pgAdmin 에서 데이터베이스 마우스 우클릭 Create > Database- Database name: ex) omopCreate Table (column name and type)- Tables에서 마우스 우클릭 Create > T.. 2024. 10. 8.
KHF 2024 (K-HOSPITAL HEALTH TECH FAIR) 행사 개요명칭: KHF 2024일시: 2024년 10월 2일(수) ~ 10월 4일(금), 3일간장소: 코엑스 1층 A, B홀주최: 대한병원협회주관: (주)메쎄이상, 미래의료산업협의회참석 포럼포럼명: 환자 및 의료진의 의료서비스 경험을 혁신하는 AI 에이전트 사례 소개삼성서울병원 & 하해호 & 네이버클라우드네이버클라우드의 CLOVA healthcare 및 디지털 헬스케어 랩 발표음성 EMR, AI 에이전트를 통한 만성질환 관리 등 소개주목할 만한 참가 기업 및 제품인지 건강 관련MINIMUM STUDIO브레인 피트니스: 웹 기반 치매 예방 인지 능력 개선 게임브레인아카데미MindRx: 치매 예방 및 치료LEMON: 아동 두뇌계발과 발달지연 치료emotiv인지 모델링 기술 기반 멘탈 헬스 DTx주요 제품: .. 2024. 10. 7.
[Vector DB][Knowledge Graph] 지식 그래프 vs 벡터 데이터베이스: 데이터 표현의 두 가지 접근법 1. 소개빅데이터 시대에 접어들면서 효율적인 데이터 표현과 처리 방식의 중요성이 더욱 부각되고 있습니다. 이러한 배경 속에서 지식 그래프와 벡터 데이터베이스라는 두 가지 혁신적인 접근법이 주목받고 있습니다. 이 두 기술은 각각 고유한 방식으로 데이터를 표현하고 처리하며, 다양한 분야에서 활용되고 있습니다.2. 지식 그래프란?지식 그래프는 실세계의 개체와 그들 사이의 관계를 그래프 구조로 표현하는 데이터 모델입니다. 노드(개체)와 엣지(관계)로 구성되며, 복잡한 정보를 직관적이고 의미론적으로 표현할 수 있습니다.주요 특징:의미론적 관계 표현유연한 스키마추론 및 지식 발견 용이활용 사례:검색 엔진 개선 (Google Knowledge Graph)추천 시스템금융 사기 탐지3. 벡터 데이터베이스란?벡터 데이터베.. 2024. 9. 27.
[2024][경진대회] 2024 연구데이터 분석활용 경진대회 (DataON) 후기 대회소개 국가 연구데이터 플랫폼국가연구데이터플랫폼서비스 Data ONdataon.kisti.re.kr최종발표자료 요약2024 연구데이터 분석 활용 경진대회 팀명: 5po프로젝트명: "멍의" 헬스케어대회 기간: 2024년 8월 – 2024년 9월팀 구성원:바이오메디컬 데이터 사이언티스트, 팀 리드의료 인공지능 엔지니어프로젝트 개요목표:반려동물 건강 관리에 필요한 빠르고 정확한 상담 도구 개발대형 언어 모델(LLM) 기반 반려동물 건강 챗봇 구축시장 상황:2020년 기준, 반려동물 시장 약 3조 원 규모로 성장반려동물을 가족처럼 여기는 ‘펫팸족’ 트렌드 확산반려동물 건강 관리에 대한 수요 증가사용된 데이터DataON:한국과학기술정보연구원(KISTI) 제공 동물 질병 텍스트 데이터 활용AI-Hub:반려동물(개.. 2024. 9. 27.
[2024][경진대회] 제 2회 AI 신약개발 경진대회: JUMP AI 2024 후기 프로젝트 개요참여 경진대회: 제2회 신약개발 AI 경진대회 (DACON)프로젝트 목표: IRAK4(Interleukin-1 Receptor-Associated Kinase 4) 단백질의 IC50 활성 값을 예측하는 AI 모델 개발예측 대상: IC50 값은 약물의 특정 생물학적 기능을 50% 억제하는 데 필요한 농도를 의미하며, 이를 기반으로 약물의 효능을 평가팀 구성: 5명의 팀원과 함께 데이터 분석, 모델 개발, 선행 연구 조사 담당데이터 처리 및 모델 개발데이터 구성:SMILES 데이터로 분자 구조를 표현약물-단백질 상호작용을 나타내는 IC50 데이터RDKit, Mordred 등을 사용하여 분자의 descriptors를 계산 (예: Molecule Weight, Hydrogen Bond Donors/.. 2024. 9. 27.
[신약 개발] IC50_nM 값 예측을 위한 손실 함수 선택 가이드 IC50_nM 값의 예측 모델을 만들 때,손실 함수를 어떻게 선택하느냐에 따라 모델의 성능과 결과가 크게 달라질 수 있습니다. 이번 글에서는 IC50_nM 값 분포에 적합한 손실 함수 세 가지, 즉 MSLE(Mean Squared Logarithmic Error), MAE(Mean Absolute Error), 그리고 Huber Loss에 대해 알아보고, 각 손실 함수의 장단점을 비교하여 어떤 상황에서 사용하면 좋을지 설명드리겠습니다.1. MSLE (Mean Squared Logarithmic Error)MSLE는 예측 값과 실제 값의 로그 차이의 제곱을 구하는 손실 함수입니다.값의 절대적인 차이보다 비율을 중시하므로, IC50_nM처럼 값이 크게 변동하는 데이터에 적합합니다. 공식:$$ MSLE = \.. 2024. 9. 12.

TOP

Designed by 티스토리