이 포스팅은 Kaggle::Titanic 시리즈 10 편 중 1 번째 글 입니다.

  • Part 1 - This Post
  • Part 2 - 02: 데이터 수집
  • Part 3 - 03: 라이브러리 로드
  • Part 4 - 04: 데이터 미리보기
  • Part 5 - 05: 데이터 정제
  • Part 6 - 06: EDA (Exploratory Data Analysis)
  • Part 7 - 07: 모델링
  • Part 8 - 08: 모델링 평가하기
  • Part 9 - 09: Hyper Parameter Tuning
  • Part 10 - 10: Ensemble
▼ 목록 보기

Kaggle에 있는 Titanic Prediction 문제를 정의한다.

문제 정의

타이타닉에 승선한 객원들 중 생존/사망 여부를 예측한다.

프로젝트 요약

타이타닉 침몰은 역사상 가장 악명 높은 난파선 중 하나이다. 1912 년 4 월 15 일, 첫 여행 중에 타이타닉은 빙산과 충돌하여 침몰하여 2224 명의 승객과 승무원 중 1502 명이 사망했다.

인명 손실이 발생한 이유 중 하나는 승객과 승무원을 위한 구명 보트가 충분하지 않았기 때문이다. 일부 그룹의 사람들은 여성, 어린이 및 상류층과 같은 다른 그룹보다 생존 할 가능성이 더 컸다.

어떤 종류의 사람들이 살아남을 가능성에 대한 분석을 수행한다. 특히 기계 학습 도구를 적용하여 어떤 승객이 비극에서 살아남 았는지 예측하는 것이 목표이다.

Reference

kaggle Notebook