Surprise
"Surprise"는 말 그대로 "깜짝 놀라다"라는 의미이다.
어떤 사건 x가 일어날 확률 p(x)가 있을 때
▷ p(x) = 1 이라면, 이 사건은 반드시 일어나기 때문에
이후에 일어난다고 하더라도 "전혀 놀랍지 않다".
즉, Surprise = 0 이다.
▷ p(x) = 0 이라면, 이 사건은 절대 일어나지 않기 때문에
이후에 이 사건이 일어난다면, "엄청나게 놀랍다".
즉, Surprise = 무한대 (매우 큼) 이다.
그리고 이 Surprise는, "정보량"의 의미도 갖고 있다.
Entropy (엔트로피)
Entropy는 결국 Surprise의 기댓값이다.
Entropy를 그냥 불순도의 정도를 나타내는 값 정도로 알고 있었는데,
이렇게도 해석된다는 것이 정말 새로웠다.
Entropy에 대해 좀 더 이해할 수 있게 된 것 같다.
◎ References
< StatQuest, Entropy (for data science) Clearly Explained!!! >
< 순록킴의 블로그, 초보를 위한 정보이론 안내서 - Entropy란 무엇일까 >
'Data Science' 카테고리의 다른 글
Gradient Boosting (그래디언트 부스팅) for regression (0) | 2023.04.28 |
---|---|
Conditional Entropy (0) | 2023.04.27 |
Adaboost (0) | 2023.04.25 |
Regularization - L1 norm & L2 norm (0) | 2023.04.24 |
Batch Normalization (배치 정규화) (0) | 2023.04.24 |