반응형 이론19 밀집 행렬 vs 희소 행렬 (Dense Matrix Vs Sparse Matrix) 밀집 행렬 vs 희소 행렬: 데이터 구조의 효율성과 응용1. 서론행렬은 데이터 과학, 기계 학습, 컴퓨터 그래픽스 등 다양한 분야에서 핵심적인 역할을 합니다. 그러나 모든 행렬이 동일하게 생성되거나 처리되는 것은 아닙니다. 이 글에서는 두 가지 주요 행렬 유형인 희소 행렬(Sparse Matrix)과 밀집 행렬(Dense Matrix)에 대해 깊이 있게 살펴보겠습니다.2. 정의2.1 밀집 행렬 (Dense Matrix)밀집 행렬은 대부분의 요소가 0이 아닌 값을 가지는 행렬입니다. 일반적으로 우리가 흔히 접하는 행렬의 형태입니다.예시:Copy[1 2 3][4 5 6][7 8 9]2.2 희소 행렬 (Sparse Matrix)희소 행렬은 대부분의 요소가 0인 행렬입니다. 일반적으로 0이 아닌 요소의 수가 전.. 2024. 10. 15. 유전체 & 인공지능 LLM과 함께 공부해보기 Part1: 1장-3장 제 1장: 유전체학과 생물정보학 입문1.1 기본 유전체 개념유전체학은 생물체의 모든 유전자 집합, 그 기능 및 상호작용을 연구하는 학문입니다. 유전체학을 이해하기 위해서는 먼저 몇 가지 기본 개념을 파악해야 합니다:1.1.1 DNA (Deoxyribonucleic Acid)DNA는 모든 알려진 생물체의 발달, 기능, 성장, 재생산에 필요한 유전 정보를 담고 있는 분자입니다. DNA는 네 가지 화학 염기로 구성되어 있습니다:Adenine (A)Guanine (G)Cytosine (C)Thymine (T)이 염기들은 서로 쌍을 이루는데, A는 T와, C는 G와 결합하여 염기쌍을 형성합니다. 이 염기들의 순서 또는 서열이 생물체의 구성과 유지에 필요한 정보를 결정합니다.1.1.2 RNA (Ribonucleic.. 2024. 10. 14. [Vector DB][Knowledge Graph] 지식 그래프 vs 벡터 데이터베이스: 데이터 표현의 두 가지 접근법 1. 소개빅데이터 시대에 접어들면서 효율적인 데이터 표현과 처리 방식의 중요성이 더욱 부각되고 있습니다. 이러한 배경 속에서 지식 그래프와 벡터 데이터베이스라는 두 가지 혁신적인 접근법이 주목받고 있습니다. 이 두 기술은 각각 고유한 방식으로 데이터를 표현하고 처리하며, 다양한 분야에서 활용되고 있습니다.2. 지식 그래프란?지식 그래프는 실세계의 개체와 그들 사이의 관계를 그래프 구조로 표현하는 데이터 모델입니다. 노드(개체)와 엣지(관계)로 구성되며, 복잡한 정보를 직관적이고 의미론적으로 표현할 수 있습니다.주요 특징:의미론적 관계 표현유연한 스키마추론 및 지식 발견 용이활용 사례:검색 엔진 개선 (Google Knowledge Graph)추천 시스템금융 사기 탐지3. 벡터 데이터베이스란?벡터 데이터베.. 2024. 9. 27. [신약 개발] IC50_nM 값 예측을 위한 손실 함수 선택 가이드 IC50_nM 값의 예측 모델을 만들 때,손실 함수를 어떻게 선택하느냐에 따라 모델의 성능과 결과가 크게 달라질 수 있습니다. 이번 글에서는 IC50_nM 값 분포에 적합한 손실 함수 세 가지, 즉 MSLE(Mean Squared Logarithmic Error), MAE(Mean Absolute Error), 그리고 Huber Loss에 대해 알아보고, 각 손실 함수의 장단점을 비교하여 어떤 상황에서 사용하면 좋을지 설명드리겠습니다.1. MSLE (Mean Squared Logarithmic Error)MSLE는 예측 값과 실제 값의 로그 차이의 제곱을 구하는 손실 함수입니다.값의 절대적인 차이보다 비율을 중시하므로, IC50_nM처럼 값이 크게 변동하는 데이터에 적합합니다. 공식:$$ MSLE = \.. 2024. 9. 12. [Loss function][Regression][MAE][MSE][L1 loss][L2 loss][Huber loss]Regression loss function,회귀에서 손실함수 1. Regression, Loss function회귀 모델을 학습할 때, 모델이 예측한 값과 실제 값 사이의 차이를 측정하는**손실 함수(Loss Function)**는 매우 중요한 역할을 합니다.손실 함수는 모델이 학습하는 방향을 결정하고, 그 성능을 좌우합니다.회귀 분석에서 자주 사용되는 손실 함수로는MAE(Mean Absolute Error),MSE(Mean Squared Error),그리고 Huber Loss가 있습니다.이번 글에서는 이 세 가지 손실 함수의 차이점과 특징을 살펴보겠습니다.1) 평균 절대 오차 (MAE: Mean Absolute Error, L1 loss)MAE는 예측 값과 실제 값의 차이의 절대값을 평균내는 방식으로,오차가 클수록 손실이 선형적으로 증가하는 특징을 가지고 있습니.. 2024. 9. 9. [SMILES][분자 구조][신약 개발]Simplified Molecular Input Line Entry System SMILES(Simplified Molecular Input Line Entry System)SMILES란?정의: SMILES는 분자 구조를 문자열 형태로 표현하는 표기법입니다.사용 목적: 분자의 정보를 간단히 표현하여 데이터로 관리하고, 컴퓨터 알고리즘에 활용할 수 있습니다.SMILES의 구성 요소원자(Atom): 각 원소를 기호로 표기.결합(Bond): 단일(-), 이중(=), 삼중(#) 결합 등으로 표기.고리(Ring): 고리의 시작과 끝을 숫자로 표시.방향족(Aromaticity): 벤젠과 같은 방향족 고리를 소문자로 표기.가지(Branch): 가지는 괄호()로 표현.SMILES의 예시Aspirin: CC(=O)OC1=CC=CC=C1C(O)=O비슷한 구조의 화합물: CCC1=CC=C(OC(C)=O.. 2024. 8. 7. 이전 1 2 3 4 다음