이 포스팅은 통계개념 정리 시리즈 13 편 중 3 번째 글 입니다.

  • Part 1 - 01: 주요 개념
  • Part 2 - 02: 중심을 나타내는 방법
  • Part 3 - This Post
  • Part 4 - 04: 상대 위치와 boxplot
  • Part 5 - 05: 선형관계의 척도
  • Part 6 - 06: 표본 추출 방법
  • Part 7 - 07: 확률
  • Part 8 - 08: 확률 변수
  • Part 9 - 09: 다양한 확률 분포
  • Part 10 - 10: 정규 분포
  • Part 11 - 11: 통계적 추론
  • Part 12 - 11: 표본 분포
  • Part 13 - 12: 가설 검정
▼ 목록 보기

데이터를 설명하는 또 다른 척도인 변동성에 대해 알아본다.

변동성

데이터의 분포를 나타냄에 있어 퍼진 정도를 측정한다.

범위

range = 최대 관측치 - 최소 관측치

해당 데이터의 값이 어디서 부터 어디까지인지 나타낸다.

분산, 표준 편차

얼마나 퍼져있는지에 대한 척도이다. 통계적으로 매우 중요한 역할을 수행한다.

경험 법칙(Empirical Rule)

가정 : 데이터의 히스토그램(분포)가 종모양이다.

  1. 모든 관측치의 68%는 $\pm \sigma$ 에 속한다.
  2. 모든 관측치의 95%는 $\pm 2\sigma$ 에 속한다.
  3. 모든 관측치의 99.7%는 $\pm 3\sigma$ 에 속한다.

체비셰프의 정리

위의 경험 법칙을 보다 일반화한 정리이다.

평균으로 부터 $k\sigma$ ($k > 1$) 이내에 속하는 관측치들의 비율은 적어도 다음과 같다.

\[1 - \frac 1 k^2\]

변동 계수(Coefficient of Variation)

표준 편차를 평균으로 나눈 척도

무차원수에 대응되는 값이다. 차원을 갖게 해주어, 어떠한 의미를 갖게하기 위함이다.