정보이론에서 확률 변수(Random Variable) 의 불확실성을 정량화하는 척도
Shannon Entropy
이산 확률 변수 의 섀넌 엔트로피 는 다음과 같이 정의된다.
- : 확률 변수 의 Self Information
- X$의 평균 정보량
- : 확률 변수 의 확률 질량 함수
- : 확률변수 가 취할 수 있는 값들의 집합
성질
- : 에 대해 최대 엔트로피를 갖는 확률 분포는 균등 분포이다.
- 임의의 확률분포 에 대해 는 오목함수(Convex)이다.
- 로그의 밑은 보통 2이며, 섀넌 엔트로피의 단위는 비트
개념
- Self Information의 평균이다.
- 즉, 각 사건의 발생에서 얻을 수 있는 정보량의 평균을 의미한다.
- 사건의 발생 확률이 균등할수록(즉, 모든 사건이 발생할 가능성이 동일할 때), 엔트로피가 최대가 된다.
- 특정 사건의 발생 확률이 매우 높거나 낮다면, 엔트로피는 낮아진다. 이는 시스템이 더 예측 가능하다는 것을 의미한다.

- 위 그림은 이진 엔트로피의 예시이다.
- 즉, 인 확률 분포일 경우의 이진 엔트로피를 나타내고 있다.
- 위 경우 정보 엔트로피는 로 계산된다.
- 해당 그래프를 그려보면 위와 같은 볼록함수가 나온다.
- 결정론적인 분포일 수록 엔트로피가 0에 가깝다. (X축이 0이거나 1)
- 반대로 확률 분포가 고르게 분포할 수록 엔트로피가 최대가 된다. (X축이 0.5))
예시
동전 던지기
- 공정한 동전의 앞면과 뒷면이 나올 확률은 각각 0.5이다.
- 엔트로피를 계산해 보면:
- 이 경우, 엔트로피는 최대값인 1 비트이다. 이는 결과를 예측하기 어려운 상태를 의미한다.
편향된 동전 던지기
- 만약 동전이 편향되어 앞면이 나올 확률이 0.9, 뒷면이 나올 확률이 0.1이라면:
- 엔트로피가 1 비트보다 작아졌다. 이는 동전 던지기의 결과를 더 예측하기 쉬운 상태를 나타낸다.
주사위 던지기
- 공정한 6면체 주사위의 각 면이 나올 확률은 이다.
- 이 경우 엔트로피는:
- 이처럼 가능한 경우의 수가 많아지면 엔트로피도 증가하여, 더 예측하기 어려운 상태가 된다.