1. 회사 소개WhyHow.AI는 스타트업과 기업이 비정형 데이터를 구조화된 지식 표현으로 변환하도록 지원하여, 정확하고 설명 가능한 결정론적 AI 솔루션을 제공합니다.2. 제품 및 서비스2.1 오픈 소스 도구Knowledge Table: 자연어 프롬프트와 추적 가능한 워크플로우를 통해 비정형 텍스트에서 구조화된 데이터를 추출하는 도구입니다.Knowledge Graph Studio: 모듈형 지식 그래프를 생성하고 관리할 수 있는 직관적인 API와 규칙을 제공합니다.2.2 서비스Agentic/RAG 시스템 설계 및 구축: 정확하고 최첨단의 Agentic 및 RAG 시스템 개발을 가속화합니다.지식 그래프 구현: 팀이 지식 그래프를 채택하고 오픈 소스 도구를 기존 워크플로우에 통합하도록 지원합니다.데이터 구조..
1. 데이터 요약 및 기본 통계 확인EDA의 첫 단계는 데이터의 전반적인 구조와 특성을 이해하는 것입니다.1.1. 전체 노드 및 관계 수 확인// cypher// 노드 수 확인MATCH (n)RETURN COUNT(n) AS TotalNodes;// 관계 수 확인MATCH ()-[r]->()RETURN COUNT(r) AS TotalRelationships;설명: 전체 노드와 관계의 개수를 파악하여 데이터 규모를 이해합니다.1.2. 노드별 레이블 분포 확인// cypherMATCH (n)RETURN labels(n) AS NodeLabels, COUNT(*) AS CountORDER BY Count DESC;설명: 각 노드 레이블별로 노드가 얼마나 있는지 확인하여 데이터의 구성 요소를 파악합니다.1.3...
1. 개요프로젝트 목표: 이 프로젝트는 ChemBERTa 모델을 활용하여 분자 구조(SMILES 문자열)와 관련된 예측을 수행하는 것입니다. 주어진 데이터셋에서 분자 구조를 학습하고, 이를 바탕으로 IC50 값을 예측하는 모델을 개발합니다.2. 주요 라이브러리 및 모델 로드사용된 라이브러리: transformers, torch, pandas, sklearn모델 및 토크나이저 로드:모델 이름: seyonec/ChemBERTa-zinc-base-v1RobertaTokenizer와 RobertaForSequenceClassification을 사용하여 ChemBERTa 모델과 토크나이저를 로드합니다.model_name = "seyonec/ChemBERTa-zinc-base-v1"tokenizer = Robert..
개요과학 연구와 약물 발견 분야에서 중요한 도구 중 하나인 Discovery Studio가 2024년 버전으로 업데이트되었습니다. Discovery Studio 2024는 다양한 새로운 기능과 향상된 성능을 통해 연구자들에게 더욱 강력한 분석 및 시뮬레이션 도구를 제공합니다. 이번 블로그 글에서는 Discovery Studio 2024의 주요 기능과 장점에 대해 살펴보겠습니다.주요 특징1. 향상된 분자 시뮬레이션Discovery Studio 2024는 분자 동역학 시뮬레이션과 관련된 알고리즘을 대폭 개선하여 더욱 정확하고 신뢰할 수 있는 결과를 제공합니다. 특히, 새로운 포스필드와 시뮬레이션 기법이 추가되어 다양한 분자 시스템에 대한 예측이 더욱 정밀해졌습니다.2. 통합 데이터 분석새로운 버전에서는 데이..
1. 실어증이란?실어증의 개념뇌 손상으로 인해 언어 능력이 손상되는 상태.말하기, 이해하기, 읽기, 쓰기 등의 언어 기능에 장애가 발생.정의 및 현황주요 원인: 뇌졸중, 외상성 뇌 손상, 뇌종양 등.한국 내 실어증 환자의 수: 2020년 기준, 뇌졸중으로 인한 실어증 환자는 약 3만 명 추정 (출처: 대한신경과학회).실어증은 남녀노소를 불문하고 발생 가능.실어증의 원인에 따른 종류브로카 실어증 (운동 실어증)위치: 좌측 대뇌 반구의 브로카 영역.증상: 유창하지 못한 말투, 단어 찾기 어려움, 문법 오류.이해 능력은 비교적 양호하지만 복잡한 문장은 이해하기 어려움.베르니케 실어증 (감각 실어증)위치: 좌측 대뇌 반구의 베르니케 영역.증상: 유창한 말투지만 의미 없는 말, 이해력 저하.자신이 말하는 내용을 ..
1. 프로테오믹스란?정의: 단백질체(Proteome)와 이를 연구하는 학문적 방법론(Proteomics)의 결합어.목적: 세포 내 단백질의 발현, 변형, 상호작용 등을 대규모로 분석하여 생리적 변화와 질병의 진행 과정을 이해.2. 연구 방법총 단백질 분리: 2D 전기영동법을 이용하여 단백질을 분리.펩타이드 질량 지문법 (Peptide Mass Fingerprinting): MALDI-TOF MS를 통해 단백질을 특성화.단백질 동정: 데이터베이스를 통해 분석된 펩타이드를 비교하여 단백질을 식별.3. 최신 연구 동향샘플 준비: 단백질 용해를 돕는 다양한 버퍼 및 조제 방법이 개발 중.2차 전기영동 기술: IPG-DALT 시스템 등 다양한 pH 범위별 isoelectric focusing strip 사용.질량..
1. SAS OnDemand for Academicshttps://www.sas.com/ko_kr/software/on-demand-for-academics.html SAS OnDemand for AcademicsSAS OnDemand for Academics provides a no-cost online delivery model to professors for teaching and to students for learning data management and analytics.www.sas.com2. Sign in / log in3. SAS studio Launch