[ML] 머신러닝 문제해결 프로세스(머신러닝 딥러닝 문제해결 전략)
문제 이해 - 문제 배경, 목적, 유형 - 평가 지표 파악 탐색적 데이터 분석(EDA) 어떤 피처가 중요한지, 어떤 피처를 조합할지, 어떤 점을 주의할지 등 인사이트 얻기 - 데이터 구조 탐색 - 데이터 시각화(중요 피처 파악) 데이터 전처리 - 결측치 처리 - 이상치 처리 모델 성능 개선 1. 다양한 모델 시도 2. 데이터 가공 - 새로운 피처 만들기 및 제거 - 데이터 인코딩 - 피처 스케일링 - 이상치 제거 및 결측치 처리 3. 하이퍼 파라미터 최적 - 그리드 서치 - 랜덤 서치 - 베이지안 최적화 성능 검증 - 교차검증 EDA 체크리스트 데이터 탐색 - 데이터 양(레코드 수, 피처 수, 전체 용량 등) - 피처 이해(이름, 의미, 데이터 타입, 결측치 개수, 고윳값 개수, 실제값, 데이터 종류 등..
2022. 11. 9.