본문 바로가기
반응형

Data Science243

[Graph DB] 그래프 데이터 베이스 Neo4j 란 무엇인가? 1. Neo4j란 무엇인가요?Neo4j는 그래프 데이터베이스 관리 시스템으로, 데이터 간의 관계를 노드(Node)와 관계(Relationship)로 표현하여 저장하고 관리합니다. 전통적인 관계형 데이터베이스와 달리, Neo4j는 데이터의 연결성과 복잡한 관계를 효율적으로 처리하도록 설계되었습니다.2. Neo4j의 핵심 개념노드(Node):엔티티나 객체를 나타냅니다.예: 사람, 장소, 제품 등.관계(Relationship):노드 간의 연관성을 나타냅니다.방향성이 있으며, 관계의 유형을 정의할 수 있습니다.예: "친구이다", "구매했다", "작업한다".속성(Properties):노드나 관계에 부가적인 정보를 제공하는 키-값 쌍입니다.예: 노드의 '이름', '나이', 관계의 '시작일', '역할'.라벨(Labe.. 2024. 10. 21.
Knowledge Graph (Graph DB) 지식 그래프란 ? 1. 지식 그래프의 정의지식 그래프란 무엇인가?*지식 그래프(Knowledge Graph)**는 실세계의 엔티티(객체)와 그들 간의 관계를 노드(점)와 에지(선)로 표현한 그래프 데이터 구조입니다.엔티티는 사람, 장소, 사물, 개념 등이며, 관계는 이들 간의 연관성을 나타냅니다.지식 그래프는 데이터를 의미론적으로 풍부하게 표현하여 컴퓨터가 데이터를 이해하고 추론할 수 있도록 돕습니다.예시:'스티브 잡스'는 '애플'의 '창립자'이다.'애플'은 '아이폰'을 '생산한다'.이러한 정보들을 그래프로 표현하여 서로 연결하면 지식 그래프가 됩니다.2. 지식 그래프의 구성 요소노드(Node):*엔티티(Entity)**를 나타냅니다.예: 사람, 회사, 제품, 장소 등.에지(Edge):노드 간의 **관계(Relations.. 2024. 10. 18.
Ontology in Data Science 데이터 과학에서 온톨리지란? 1. 온톨로지의 정의철학적 배경:온톨로지는 원래 철학에서 존재론을 의미하며, '존재하는 것들의 본질과 구조'를 연구하는 학문입니다.컴퓨터 과학에서의 온톨로지:정보학과 컴퓨터 과학에서는 온톨로지를 특정 도메인에 대한 개념과 그들 간의 관계를 명시적으로 표현한 형식적인 명세라고 정의합니다.즉, 특정 분야의 지식을 구조화하고, 그 지식을 컴퓨터가 이해하고 처리할 수 있도록 표현한 것입니다.2. 온톨로지의 구성 요소개념(Class 또는 Concept):도메인 내의 객체나 아이디어를 일반화한 것입니다.예: '사람', '의사', '약물' 등.개체(Instance 또는 Individual):클래스의 특정한 사례를 의미합니다.예: '홍길동'은 '사람' 클래스의 개체.속성(Property 또는 Attribute):개념이.. 2024. 10. 17.
유전체 & 인공지능 LLM과 함께 공부해보기 Part2: 4장-5장 제 1장-3장2024.10.10 - [이론] - 유전체 & 인공지능 LLM과 함께 공부해보기 Part1: 1장-3장제 4장: 분류 모델의 평가 지표유전체학 연구에서 기계 학습 모델, 특히 분류 모델의 성능을 정확하게 평가하는 것은 매우 중요합니다. 이 장에서는 분류 모델의 성능을 평가하는 데 사용되는 주요 지표들을 살펴보겠습니다.4.1 정확도 (Accuracy)정확도는 가장 기본적이고 직관적인 평가 지표입니다. 전체 예측 중 올바르게 분류된 비율을 나타냅니다.정확도 = (올바르게 분류된 샘플의 수) / (전체 샘플의 수)하지만 정확도만으로는 불균형한 데이터셋에서 모델의 성능을 제대로 평가하기 어려울 수 있습니다.4.2 정밀도 (Precision)정밀도는 모델이 양성으로 예측한 샘플 중 실제 양성인 비율을.. 2024. 10. 15.
밀집 행렬 vs 희소 행렬 (Dense Matrix Vs Sparse Matrix) 밀집 행렬 vs 희소 행렬: 데이터 구조의 효율성과 응용1. 서론행렬은 데이터 과학, 기계 학습, 컴퓨터 그래픽스 등 다양한 분야에서 핵심적인 역할을 합니다. 그러나 모든 행렬이 동일하게 생성되거나 처리되는 것은 아닙니다. 이 글에서는 두 가지 주요 행렬 유형인 희소 행렬(Sparse Matrix)과 밀집 행렬(Dense Matrix)에 대해 깊이 있게 살펴보겠습니다.2. 정의2.1 밀집 행렬 (Dense Matrix)밀집 행렬은 대부분의 요소가 0이 아닌 값을 가지는 행렬입니다. 일반적으로 우리가 흔히 접하는 행렬의 형태입니다.예시:Copy[1 2 3][4 5 6][7 8 9]2.2 희소 행렬 (Sparse Matrix)희소 행렬은 대부분의 요소가 0인 행렬입니다. 일반적으로 0이 아닌 요소의 수가 전.. 2024. 10. 15.
유전체 & 인공지능 LLM과 함께 공부해보기 Part1: 1장-3장 제 1장: 유전체학과 생물정보학 입문1.1 기본 유전체 개념유전체학은 생물체의 모든 유전자 집합, 그 기능 및 상호작용을 연구하는 학문입니다. 유전체학을 이해하기 위해서는 먼저 몇 가지 기본 개념을 파악해야 합니다:1.1.1 DNA (Deoxyribonucleic Acid)DNA는 모든 알려진 생물체의 발달, 기능, 성장, 재생산에 필요한 유전 정보를 담고 있는 분자입니다. DNA는 네 가지 화학 염기로 구성되어 있습니다:Adenine (A)Guanine (G)Cytosine (C)Thymine (T)이 염기들은 서로 쌍을 이루는데, A는 T와, C는 G와 결합하여 염기쌍을 형성합니다. 이 염기들의 순서 또는 서열이 생물체의 구성과 유지에 필요한 정보를 결정합니다.1.1.2 RNA (Ribonucleic.. 2024. 10. 14.

TOP

Designed by 티스토리