데이터를 설명하는 또 다른 척도인 변동성에 대해 알아본다.
변동성
데이터의 분포를 나타냄에 있어 퍼진 정도를 측정한다.
범위
range = 최대 관측치 - 최소 관측치
해당 데이터의 값이 어디서 부터 어디까지인지 나타낸다.
분산 (Variance), 표준 편차 (Standard Deviation)
얼마나 퍼져있는지에 대한 척도이다. 통계적으로 매우 중요한 역할을 수행한다.
경험 법칙(Empirical Rule)
가정 : 데이터의 히스토그램(분포)가 종모양이다.
- 모든 관측치의 68%는 에 속한다.
- 모든 관측치의 95%는 에 속한다.
- 모든 관측치의 99.7%는 에 속한다.
체비셰프의 정리
위의 경험 법칙을 보다 일반화한 정리이다.
평균으로 부터 () 이내에 속하는 관측치들의 비율은 적어도 다음과 같다.
변동 계수(Coefficient of Variation)
표준 편차를 평균으로 나눈 척도
무차원수에 대응되는 값이다. 차원을 갖게 해주어, 어떠한 의미를 갖게하기 위함이다.