항공기의 운행을 따라가는 Schedule이라는 변수를 사용하여 높은 정확도로 지연편을 검출할 수 있었다.

github

  • 2019.07~2019.11(4개월)
  • Pandas, Numpy, Lightgbm, sklearn
  • 항공기 지연 예측 과제
  • 100만건의 데이터 핸들링
  • 클래스 불균형 문제를 해결하고자 의사결정나무 기반이자 부스팅 모델인 Lightgbm 모델 사용
  • 지연에 가장 영향을 끼치는 문제는 비행기 노선에 있어서 연이어 발생하는 A/C 문제(항공기 연결 문제)라고 판단
  • 주어진 데이터에서 비행기의 노선은 정해져있다는 가정을 도입하고, 이를 검증 후 스케쥴이라는 변수 생성
  • 지연이 아니라 예측했으나 실제로 지연인 경우(FN)가 현장 도입시 치명적이기 때문에 이를 반영하도록 재현율에 초점을 맞춰 Threshold 조절
  • “스케쥴” 변수를 통해 정확도 13% 개선, 최종적으로 76%에서 89%의 정확도를 갖는 모델 구축

빅콘테스트 퓨처스리그 결과보고서-01 빅콘테스트 퓨처스리그 결과보고서-02 빅콘테스트 퓨처스리그 결과보고서-03 빅콘테스트 퓨처스리그 결과보고서-04 빅콘테스트 퓨처스리그 결과보고서-05 빅콘테스트 퓨처스리그 결과보고서-06 빅콘테스트 퓨처스리그 결과보고서-07 빅콘테스트 퓨처스리그 결과보고서-08 빅콘테스트 퓨처스리그 결과보고서-09 빅콘테스트 퓨처스리그 결과보고서-10 빅콘테스트 퓨처스리그 결과보고서-11 빅콘테스트 퓨처스리그 결과보고서-12 빅콘테스트 퓨처스리그 결과보고서-13 빅콘테스트 퓨처스리그 결과보고서-14 빅콘테스트 퓨처스리그 결과보고서-15 빅콘테스트 퓨처스리그 결과보고서-16 빅콘테스트 퓨처스리그 결과보고서-17 빅콘테스트 퓨처스리그 결과보고서-18 빅콘테스트 퓨처스리그 결과보고서-19 빅콘테스트 퓨처스리그 결과보고서-20 빅콘테스트 퓨처스리그 결과보고서-21 빅콘테스트 퓨처스리그 결과보고서-22 빅콘테스트 퓨처스리그 결과보고서-23 빅콘테스트 퓨처스리그 결과보고서-24 빅콘테스트 퓨처스리그 결과보고서-25 빅콘테스트 퓨처스리그 결과보고서-26 빅콘테스트 퓨처스리그 결과보고서-27 빅콘테스트 퓨처스리그 결과보고서-28 빅콘테스트 퓨처스리그 결과보고서-29 빅콘테스트 퓨처스리그 결과보고서-30 빅콘테스트 퓨처스리그 결과보고서-31 빅콘테스트 퓨처스리그 결과보고서-32 빅콘테스트 퓨처스리그 결과보고서-33 빅콘테스트 퓨처스리그 결과보고서-34 빅콘테스트 퓨처스리그 결과보고서-35 빅콘테스트 퓨처스리그 결과보고서-36 빅콘테스트 퓨처스리그 결과보고서-37 빅콘테스트 퓨처스리그 결과보고서-38 빅콘테스트 퓨처스리그 결과보고서-39 빅콘테스트 퓨처스리그 결과보고서-40 빅콘테스트 퓨처스리그 결과보고서-41 빅콘테스트 퓨처스리그 결과보고서-42 빅콘테스트 퓨처스리그 결과보고서-43