통계를 공부하면서 "표본공간" / "근원사건" / "사건" / "확률변수" 등등
별 생각없이 당연하게 받아들이고 넘어갔던 개념들이 많았다.
하지만 통계 공부를 다시 시작해보니,
정확히 이해하고 넘어가지 않으면
언젠가는 발목을 잡게된다는 사실을 깨달았다.
그래서 기초를 다지는 의미로 이런 통계 기본 개념들을 정리해봤다.
표본공간 / 근원사건 / 사건
개념
☆ 표본공간 (Sample Space) : 한 실험에서 나올 수 있는 모든 결과들의 모임
☆ 근원사건 (Elementary Outcomes) : 표본공간을 구성하는 개개의 결과
☆ 사건 (Event) : 표본공간의 부분집합으로 어떤 특성을 갖는 결과들의 모임 (= 근원사건들로 이뤄진 집합)
예시
△ 10대의 승용차 중 속도위반에 걸린 차의 대수를 조사하는 경우 나타날 수 있는 결과
- 표본공간 : { 0대 / 1대 / 2대 / ... / 8대 / 9대 / 10대 }
- 근원사건 : x대
- 사건 : 속도위반 차량 8대 이상인 사건 = { 8대 / 9대 / 10대 }
△ 주사위를 던져서 나오는 값
- 표본공간 : { 1, 2, 3, 4, 5, 6 }
- 근원사건 : 1~6 사이의 값
- 사건 : 값이 3 이상인 사건 = { 3, 4, 5, 6 }
확률변수
그렇다면 "확률변수"란 어떤 의미일까?
개념
☆ 확률변수 (Random Variable) : 각각 근원사건들에 실숫값을 대응시키는 함수
예시
△ 3명의 사람에게 A, B 두 회사 제품 중 어느회사 제품을 갖고 있는지 조사하는 경우
(A회사 제품을 갖고있는 사람 수를 X로 설정한다.)
근원사건 (실험의 결과) | 대응되는 X 값 |
AAA | 3 |
AAB | 2 |
ABA | 2 |
BAA | 2 |
ABB | 1 |
BAB | 1 |
BBA | 1 |
BBB | 0 |
위처럼 8가지의 근원사건이 존재하는데,
각각의 근원사건이 확률변수 X를 통해 대응되는 값으로 변환된다.
(ex. AAB → 2)
확률변수 X 값 | X에 대응되는 근원사건 |
0 | { BBB } |
1 | { ABB, BAB, BBA } |
2 | { AAB, ABA, BAA } |
3 | { AAA } |
이산확률변수 / 연속확률변수
☆ 이산확률변수 (Discrete) : 확률변수의 값을 셀 수 있다. (ex. 자연수)
☆ 연속확률변수 (Continuous) : 확률변수의 값이 연속적이라 셀 수 없다. (ex. 0과 1 사이의 실수)
◎ References
- 통계학 : 파이썬을 이용한 분석 (인하대학교 통계학과 저)
'Data Science' 카테고리의 다른 글
CRM 마케팅 이해하기 (인프런) (0) | 2024.01.20 |
---|---|
RNN (0) | 2023.10.09 |
FastText (1) | 2023.10.08 |
GloVe (0) | 2023.10.07 |
Word2Vec (0) | 2023.10.06 |