본문 바로가기
반응형

Data Science233

[Bash][Git Bash] conda activate in git bash 1. conda init bashconda init bash2. git bash restart and conda activateconda activate conda_env 2024. 10. 23.
[DACON] 2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문 1. 개요[배경] 인공지능(AI) 기술을 활용하여 주어진 바이오 데이터를 기반으로 한 문제 해결을 목표로 하는 '2024 생명연구자원 AI활용 경진대회'를 개최합니다. 이번 대회의 목표는 바이오 분야에서 AI 활용의 저변을 확대하고, 복잡한 바이오 데이터를 효율적으로 분석 및 해석할 수 있는 AI 알고리즘을 개발하는 것입니다. 이 대회는 바이오 데이터의 활용도를 높이고, 이를 통해 바이오 분야에서의 AI 기술 적용 가능성을 극대화하기 위해 기획되었습니다. 바이오 데이터의 활용을 통해 인공지능 기술이 실제 문제 해결에 어떻게 기여할 수 있는지 탐구하는 것이 목적입니다. [주제]암환자 유전체 데이터의 변이 정보를 활용한 암종 분류 AI 모델 개발[설명]학습데이터로 제공되는 암환자 유전체 변이 정보 데이터를 .. 2024. 10. 21.
[Graph DB] 그래프 데이터 베이스 Neo4j 란 무엇인가? 1. Neo4j란 무엇인가요?Neo4j는 그래프 데이터베이스 관리 시스템으로, 데이터 간의 관계를 노드(Node)와 관계(Relationship)로 표현하여 저장하고 관리합니다. 전통적인 관계형 데이터베이스와 달리, Neo4j는 데이터의 연결성과 복잡한 관계를 효율적으로 처리하도록 설계되었습니다.2. Neo4j의 핵심 개념노드(Node):엔티티나 객체를 나타냅니다.예: 사람, 장소, 제품 등.관계(Relationship):노드 간의 연관성을 나타냅니다.방향성이 있으며, 관계의 유형을 정의할 수 있습니다.예: "친구이다", "구매했다", "작업한다".속성(Properties):노드나 관계에 부가적인 정보를 제공하는 키-값 쌍입니다.예: 노드의 '이름', '나이', 관계의 '시작일', '역할'.라벨(Labe.. 2024. 10. 21.
Knowledge Graph (Graph DB) 지식 그래프란 ? 1. 지식 그래프의 정의지식 그래프란 무엇인가?*지식 그래프(Knowledge Graph)**는 실세계의 엔티티(객체)와 그들 간의 관계를 노드(점)와 에지(선)로 표현한 그래프 데이터 구조입니다.엔티티는 사람, 장소, 사물, 개념 등이며, 관계는 이들 간의 연관성을 나타냅니다.지식 그래프는 데이터를 의미론적으로 풍부하게 표현하여 컴퓨터가 데이터를 이해하고 추론할 수 있도록 돕습니다.예시:'스티브 잡스'는 '애플'의 '창립자'이다.'애플'은 '아이폰'을 '생산한다'.이러한 정보들을 그래프로 표현하여 서로 연결하면 지식 그래프가 됩니다.2. 지식 그래프의 구성 요소노드(Node):*엔티티(Entity)**를 나타냅니다.예: 사람, 회사, 제품, 장소 등.에지(Edge):노드 간의 **관계(Relations.. 2024. 10. 18.
Ontology in Data Science 데이터 과학에서 온톨리지란? 1. 온톨로지의 정의철학적 배경:온톨로지는 원래 철학에서 존재론을 의미하며, '존재하는 것들의 본질과 구조'를 연구하는 학문입니다.컴퓨터 과학에서의 온톨로지:정보학과 컴퓨터 과학에서는 온톨로지를 특정 도메인에 대한 개념과 그들 간의 관계를 명시적으로 표현한 형식적인 명세라고 정의합니다.즉, 특정 분야의 지식을 구조화하고, 그 지식을 컴퓨터가 이해하고 처리할 수 있도록 표현한 것입니다.2. 온톨로지의 구성 요소개념(Class 또는 Concept):도메인 내의 객체나 아이디어를 일반화한 것입니다.예: '사람', '의사', '약물' 등.개체(Instance 또는 Individual):클래스의 특정한 사례를 의미합니다.예: '홍길동'은 '사람' 클래스의 개체.속성(Property 또는 Attribute):개념이.. 2024. 10. 17.
유전체 & 인공지능 LLM과 함께 공부해보기 Part2: 4장-5장 제 1장-3장2024.10.10 - [이론] - 유전체 & 인공지능 LLM과 함께 공부해보기 Part1: 1장-3장제 4장: 분류 모델의 평가 지표유전체학 연구에서 기계 학습 모델, 특히 분류 모델의 성능을 정확하게 평가하는 것은 매우 중요합니다. 이 장에서는 분류 모델의 성능을 평가하는 데 사용되는 주요 지표들을 살펴보겠습니다.4.1 정확도 (Accuracy)정확도는 가장 기본적이고 직관적인 평가 지표입니다. 전체 예측 중 올바르게 분류된 비율을 나타냅니다.정확도 = (올바르게 분류된 샘플의 수) / (전체 샘플의 수)하지만 정확도만으로는 불균형한 데이터셋에서 모델의 성능을 제대로 평가하기 어려울 수 있습니다.4.2 정밀도 (Precision)정밀도는 모델이 양성으로 예측한 샘플 중 실제 양성인 비율을.. 2024. 10. 15.

TOP

Designed by 티스토리