이 포스팅은 통계개념 정리 시리즈 13 편 중 4 번째 글 입니다.

  • Part 1 - 01: 주요 개념
  • Part 2 - 02: 중심을 나타내는 방법
  • Part 3 - 03: 변동성의 척도
  • Part 4 - This Post
  • Part 5 - 05: 선형관계의 척도
  • Part 6 - 06: 표본 추출 방법
  • Part 7 - 07: 확률
  • Part 8 - 08: 확률 변수
  • Part 9 - 09: 다양한 확률 분포
  • Part 10 - 10: 정규 분포
  • Part 11 - 11: 통계적 추론
  • Part 12 - 11: 표본 분포
  • Part 13 - 12: 가설 검정
▼ 목록 보기

데이터를 설명하는 상대위치와 이를 나타내는 box plot에 대해 알아본다.

상대위치

중앙값이 50%에 위치하는 분위수라면, 이에 대응하는 다양한 분위수가 존재한다.

백분위수

분포를 100개로 쪼개어 생각하는 것이다.

사분위수

분위수 개념중에서 가장 많이 사용하는 개념이며, 25%, 50%, 75%, 100%로 구성된다. 각각을 1, 2, 3, 4분위수라 하며, 2분위수는 중앙값과 대응된다.

사분위수간 범위(Interquartile Range)

$Q_3 - Q_1$

사분위수간 범위는 관측치들의 중간 50%가 흩어져 있는 정도를 측정한다.

Box Plots

boxplot에 대한 글

mean-median

outliers

box가 그려지는 부분의 하한, 상한은 $Q_1, Q_3$ 이다. 그 좌우로 선이 나타내는 상한은 수염(Whisker)라 불리며, 사분위수간 범위의 1.5배 범위까지 포함하는 점을 나타낸다. 이 후의 점은 그 범위를 넘어가는 점중 이상치가 아닌 점 중의 마지노선을 나타낸다.

Reference

boxplot에 대한 글