2 Stage model을 사용하여 효과적으로 결로를 예측하고과 서비스를 구축하였다.

  • 2020.07~2020.08(2개월)
  • Pandas, Sklearn, Numpy, Matplotlib, Django
  • 현대 제철소 철강 보관소에 있는 철강의 24시간, 28시간 후의 결로 발생 확률 예측 과제
  • 외부 기상 관측소의 데이터를 기반으로 공장 내부 온도을 예측하는 모델과 이를 기반으로 철강의 결로를 예측하는 2 Step 구조 고안
  • 결로에 영향을 주는 계절적 요인(봄, 가을)과 시간적 요인(새벽)을 고려한 예측을 수행하기 위해 군집화를 통한 피쳐 생성
  • 데이터 불균형, 일반화 성능, 해석 가능성 등을 고려하여 Extra Tree 모델 사용
  • 피어슨 상관계수, 크레머 상관계수를 사용하여 변수 선택
  • 평균 AUC 0.9831을 갖는 모델 구현
  • 최종적으로 Django 서버에 모델 탑재후, inference 시연

Project

Result