이 포스팅은 통계개념 정리 시리즈 13 편 중 4 번째 글 입니다.
목차
데이터를 설명하는 상대위치와 이를 나타내는 box plot에 대해 알아본다.
상대위치
중앙값이 50%에 위치하는 분위수라면, 이에 대응하는 다양한 분위수가 존재한다.
백분위수
분포를 100개로 쪼개어 생각하는 것이다.
사분위수
분위수 개념중에서 가장 많이 사용하는 개념이며, 25%, 50%, 75%, 100%로 구성된다. 각각을 1, 2, 3, 4분위수라 하며, 2분위수는 중앙값과 대응된다.
사분위수간 범위(Interquartile Range)
$Q_3 - Q_1$
사분위수간 범위는 관측치들의 중간 50%가 흩어져 있는 정도를 측정한다.
Box Plots
box가 그려지는 부분의 하한, 상한은 $Q_1, Q_3$ 이다. 그 좌우로 선이 나타내는 상한은 수염(Whisker)라 불리며, 사분위수간 범위의 1.5배 범위까지 포함하는 점을 나타낸다. 이 후의 점은 그 범위를 넘어가는 점중 이상치가 아닌 점 중의 마지노선을 나타낸다.