본문 바로가기

Data Science

통계 기초 개념 (01)

통계를 공부하면서 "표본공간" / "근원사건" / "사건" / "확률변수" 등등

별 생각없이 당연하게 받아들이고 넘어갔던 개념들이 많았다.

 

하지만 통계 공부를 다시 시작해보니,

정확히 이해하고 넘어가지 않으면

언젠가는 발목을 잡게된다는 사실을 깨달았다.

 

그래서 기초를 다지는 의미로 이런 통계 기본 개념들을 정리해봤다.

 


 

표본공간 / 근원사건 / 사건

 

개념

 

☆ 표본공간 (Sample Space) : 한 실험에서 나올 수 있는 모든 결과들의 모임

☆ 근원사건 (Elementary Outcomes) : 표본공간을 구성하는 개개의 결과

☆ 사건 (Event) : 표본공간의 부분집합으로 어떤 특성을 갖는 결과들의 모임 (= 근원사건들로 이뤄진 집합)

 

예시

 

△ 10대의 승용차 중 속도위반에 걸린 차의 대수를 조사하는 경우 나타날 수 있는 결과

- 표본공간 : { 0대 / 1대 / 2대 / ... / 8대 / 9대 / 10대 }

- 근원사건 : x대

- 사건 : 속도위반 차량 8대 이상인 사건 = { 8대 / 9대 / 10대 }

 

△ 주사위를 던져서 나오는 값

- 표본공간 : { 1, 2, 3, 4, 5, 6 }

- 근원사건 : 1~6 사이의 값

- 사건 : 값이 3 이상인 사건 = { 3, 4, 5, 6 }

 


 

확률변수

 

그렇다면 "확률변수"란 어떤 의미일까?

 

개념

 

 확률변수 (Random Variable) : 각각 근원사건들에 실숫값을 대응시키는 함수

 

예시

 

 3명의 사람에게 A, B 두 회사 제품 중 어느회사 제품을 갖고 있는지 조사하는 경우

(A회사 제품을 갖고있는 사람 수를 X로 설정한다.)

 

근원사건 (실험의 결과) 대응되는 X 값
AAA 3
AAB 2
ABA 2
BAA 2
ABB 1
BAB 1
BBA 1
BBB 0

 

위처럼 8가지의 근원사건이 존재하는데,

각각의 근원사건이 확률변수 X를 통해 대응되는 값으로 변환된다.

(ex. AAB → 2)

 

확률변수 X 값 X에 대응되는 근원사건
0 { BBB }
1 { ABB, BAB, BBA }
2 { AAB, ABA, BAA }
3 { AAA }

 

 

이산확률변수 / 연속확률변수

 

 이산확률변수 (Discrete) : 확률변수의 값을 셀 수 있다. (ex. 자연수)

연속확률변수 (Continuous) : 확률변수의 값이 연속적이라 셀 수 없다. (ex. 0과 1 사이의 실수)

 


 

◎ References

- 통계학 : 파이썬을 이용한 분석 (인하대학교 통계학과 저)

 

'Data Science' 카테고리의 다른 글

CRM 마케팅 이해하기 (인프런)  (0) 2024.01.20
RNN  (0) 2023.10.09
FastText  (1) 2023.10.08
GloVe  (0) 2023.10.07
Word2Vec  (0) 2023.10.06