이전글 참고
- Part1
- Part2
1. mljar
- AutoML framework
- 지속적인 업데이트로 아주 쓸만한 프레임워크
- 거의 모든 ML 관련 업무 처리에 용이함
2. install
pip install mljar-supervised
3. data and modeling
import pandas as pd
from supervised.automl import AutoML
# 데이터 로드
df = pd.read_csv('titanic.csv')
# AutoML 객체 생성
automl = AutoML(mode="Explain", total_time_limit=3600)
# 모델 학습
automl.fit(X=df.drop(columns=["Survived"]), y=df["Survived"])
- output
- 여러가지 설정에 따라 다른 결과들이 출력됨
- 가장 간단한 튜토리얼임
4. interpretation
- VS Code와 호환이 좋다.
- model fit이 끝나면 설정해놓은 디렉토리가 생성되고 결과를 볼 수 있다.
- README.md 에 전체적인 요약이 있다.
- Best model의 README.md 로 이동하면 모델에 대한 요약이 있다.
5. 결론
- mljar & VS Code를 적절히 잘 활용하면 많은 양의 ML 관련 TASK를 쉽게 관리하며 피드백 할 수 있다.
- 얼마 전까지만 해도 일단 초안잡는 역할이었지만 현재는 성능 자체도 우수하게 뽑히는 경우도 있어 ML modeling 전주기를 관리하는 프레임워크로 유용하게 사용된다.