2 Stage model을 사용하여 효과적으로 결로를 예측하고과 서비스를 구축하였다.
- 2020.07~2020.08(2개월)
- Pandas, Sklearn, Numpy, Matplotlib, Django
- 현대 제철소 철강 보관소에 있는 철강의 24시간, 28시간 후의 결로 발생 확률 예측 과제
- 외부 기상 관측소의 데이터를 기반으로 공장 내부 온도을 예측하는 모델과 이를 기반으로 철강의 결로를 예측하는 2 Step 구조 고안
- 결로에 영향을 주는 계절적 요인(봄, 가을)과 시간적 요인(새벽)을 고려한 예측을 수행하기 위해 군집화를 통한 피쳐 생성
- 데이터 불균형, 일반화 성능, 해석 가능성 등을 고려하여 Extra Tree 모델 사용
- 피어슨 상관계수, 크레머 상관계수를 사용하여 변수 선택
- 평균 AUC 0.9831을 갖는 모델 구현
- 최종적으로 Django 서버에 모델 탑재후, inference 시연