이 포스팅은 통계개념 정리 시리즈 13 편 중 3 번째 글 입니다.
목차
데이터를 설명하는 또 다른 척도인 변동성에 대해 알아본다.
변동성
데이터의 분포를 나타냄에 있어 퍼진 정도를 측정한다.
범위
range = 최대 관측치 - 최소 관측치
해당 데이터의 값이 어디서 부터 어디까지인지 나타낸다.
분산, 표준 편차
얼마나 퍼져있는지에 대한 척도이다. 통계적으로 매우 중요한 역할을 수행한다.
경험 법칙(Empirical Rule)
가정 : 데이터의 히스토그램(분포)가 종모양이다.
- 모든 관측치의 68%는 $\pm \sigma$ 에 속한다.
- 모든 관측치의 95%는 $\pm 2\sigma$ 에 속한다.
- 모든 관측치의 99.7%는 $\pm 3\sigma$ 에 속한다.
체비셰프의 정리
위의 경험 법칙을 보다 일반화한 정리이다.
\[1 - \frac 1 k^2\]평균으로 부터 $k\sigma$ ($k > 1$) 이내에 속하는 관측치들의 비율은 적어도 다음과 같다.
변동 계수(Coefficient of Variation)
표준 편차를 평균으로 나눈 척도
무차원수에 대응되는 값이다. 차원을 갖게 해주어, 어떠한 의미를 갖게하기 위함이다.