본문 바로가기
LLM

[LLM][Python] Auto-Analyst Review

by Chandler.j 2025. 1. 10.
반응형

1. 배경

 - Medium 에서 LLM을 활용한 agentic auto-analyst 관련 포스팅을 봤음.

https://medium.com/firebird-technologies/auto-analyst-2-0-the-ai-data-analytics-system-26aec602928e

 

Auto-Analyst 2.0 — The AI data analytics system

Overview and open-sourcing the project

medium.com

 

- 내용 요약을 하면 아래와 같음.

Auto-Analyst 2.0은 데이터 분석 과정을 간소화하고 향상시키기 위해 다양한 AI 에이전트를 통합한 AI 기반 데이터 분석 시스템입니다. 이 시스템은 데이터 전처리, 통계 분석, 머신러닝, 시각화를 포함한 복잡한 데이터 분석 작업을 보다 쉽게 수행할 수 있도록 설계되었습니다. 사용자는 Streamlit 기반의 직관적인 웹 인터페이스를 통해 시스템과 상호 작용하며, CSV 파일을 업로드하거나 샘플 데이터를 활용하여 분석을 진행할 수 있습니다. 또한, 이 프로젝트는 MIT 라이선스 하에 오픈 소스로 공개되어 있어, 누구나 GitHub에서 소스 코드를 확인하고 활용할 수 있습니다.

 

- 한번 테스트 해보는 것이 좋겠다 싶었음.


2. 튜토리얼

- Git-hub

https://github.com/ArslanS1997/Auto-Analyst/tree/main

 

GitHub - ArslanS1997/Auto-Analyst: AI data scientist

AI data scientist. Contribute to ArslanS1997/Auto-Analyst development by creating an account on GitHub.

github.com


1) Clone the Repository

git clone https://github.com/ArslanS1997/Auto-Analyst.git
cd your-repository

2) Install Dependencies

pip install -r requirements.txt

*여기서 window의 경우 error가 발생하는데 그 이유는 matplotlib의 경우 3.9 이상 부터는 Meson 빌드 시스템을 사용하기 때문이다. 해결법은 두가지로 2-1) Meson 및 빌드 백엔드 설치 2-2) conda로 matplotlib 설치

 

 2-1) Meson 및 빌드 백엔드 설치 

python -m pip install --upgrade pip setuptools wheel
python -m pip install --upgrade pip setuptools wheel

 

2-2) conda로 matplotlib 설치 후 나머지 pip install (requirements.txt에서 matplotlib 제외)

conda install -c conda-forge matplotlib==3.9.1

 

3) Set Up Environment Variables

- OPENAI API를 사용하기 때문에 API key가 필요하며 해당 설정을 해주는 부분이다.

- 두가지 방법이 있다 3-1) .env file 생성 3-2) 환경 변수로 설정

 

3-1) .env file 생성

- root 디렉토리 안에 .env 파일 생성 후 텍스트 입력

OPENAI_API_KEY=your_openai_api_key_here

 

3-2) 환경 변수로 설정

- linux

export OPENAI_API_KEY=your_openai_api_key_here

 

- windows

set OPENAI_API_KEY=your_openai_api_key_here

4) Run the Streamlit App

- Streamlit과 flask로 구성되어 있어 마지막은 Streamlit 명령어를 입력하면 웹페이지가 뜬다.

streamlit run new_frontend.py


5) Analysis

- 사용할 csv 파일을 올려준다. 

- 데이터가 올라가면 데이터를 확인할 수 있는 창이 활성화 된다.

- 데이터 분석 관련 자유롭게 질의하여 테스트한다


3. 총평

- 아주 흥미로운 간단한 웹 어플리케이션이다.

- 조금 더 발전시키면 개인 맞춤형 data analyst를 만들 수 있을 것 같다.

- Agentic RAG, LLM 발전의 경이로움을 느끼고 있는 현생이다.


TOP

Designed by 티스토리