통계를 처음 공부할 때 가장 먼저 마주치는 개념이 바로 표본공간(Sample Space)과 사건(Event)이다. 이 개념들이 잡히면 그 뒤의 확률과 통계 이론이 훨씬 더 쉽게 다가온다. 이 글에서는 이 두 개념과 그 배경이 되는 집합 이론(Set Theory)에 대해 간단하고 명확하게 정리해보겠다.
표본공간(Sample Space)이란?
표본공간(sample space)은 어떤 확률 실험에서 가능한 모든 결과들의 집합을 말한다.
예시 상황:
한 개의 퓨즈가 정상(Not defective, N)인지 불량(Defective, D) 인지 검사하는 실험
1. 한 개의 퓨즈 검사
- 이 실험의 결과는 두 가지 중 하나다
- N: 정상
- D: 불량
- 따라서 표본공간(Sample Space)는 다음과 같이 나타낼 수 있다
S = {N, D}
2. 세 개의 퓨즈를 차례대로 검사하는 경우
세 개의 퓨즈를 순서대로 검사하고 각각의 검사 결과를 기록한다면, 하나의 실험 결과는 N 또는 D로 이루어진 3개의 문자열이 된다.
- 가능한 모든 조합을 나열하면
S = {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}
- 이 표본공간은 길이 3의 이진 문자열(binary string)과 비슷한 구조를 가지며, 총 2^3 = 8개의 원소를 포함한다.
사건(Event)이란 무엇인가?
사건(Event)은 표본공간의 부분 집합으로, 우리가 관심을 가지는 특정한 결과들의 집합이다.
예시:
고속도로 출구를 나오는 세 대의 차량이 각각 출구 끝에서 좌회전(Left, L) 또는 우회전(Right, R)을 선택한다고 가정
각 차량의 방향은 독립적으로 결정되므로, 가능한 모든 조합을 고려한 표본공간(sample space)은 다음과 같이 구성된다
표본공간 S = {LLL, LLR, LRL, LRR, RLL, RLR, RRL, RRR}
단순사건 (Simple Events)
단순사건이란, 표본공간 내의 단 하나의 결과만 포함하는 사건이.
- E₁ = {LLL}: 세 차량이 모두 좌회전한 경우
- E₅ = {LRR}: 첫 번째 차량은 좌회전, 두 번째·세 번째 차량은 우회전한 경우
복합사건 (Compound Events)
복합사건은 둘 이상의 결과를 포함하는 사건이다.
- A = {RLL, LRL, LLR}
집합 이론과 사건 간의 관계
사건은 결국 집합이기 때문에, 집합 연산을 통해 사건 간 관계를 표현할 수 있다.
- 합집합 A ∪ B: A 또는 B가 일어나는 사건
- 교집합 A ∩ B: A와 B가 동시에 일어나는 사건
- 여집합 A': A가 일어나지 않는 사건
예를 들어 A = {0, 1, 2, 3, 4}
B = {3, 4, 5, 6}
C = {1, 3, 5}
일 때
A ∪ B = {0, 1, 2, 3, 4, 5, 6}
A ∪ C = {0, 1, 2, 3, 4, 5}
A ∩ B = {3, 4}
A ∩ C = {1, 3}
A' = {5, 6}
{A ∪ C}' = {6}
이다.
서로소 사건 (Disjoint or Mutually Exclusive Events)
두 사건 A와 B가 서로소(disjoint) 또는 상호 배타(mutually exclusive) 라고 할 때, 이는 두 사건이 동시에 발생할 수 없다는 의미이다. 즉, 공통되는 결과가 없다.
A와 B가 서로소 사건이면,
- A ∩ B = ∅
- 따라서 P(A ∩ B) = 0
벤 다이어그램으로 표현하면 밑과 같다
이전 글 보러가기
확률과 통계 | 산포도 이해하기: 표준편차부터 박스플롯까지
통계에서 데이터의 중심(평균, 중앙값 등)을 파악하는 것만으로는 부족하다. 데이터가 얼마나 퍼져 있는지, 즉 산포(variability)를 함께 이해해야 데이터 전체의 특성을 제대로 해석할 수 있다. 이
olivecodelab.tistory.com
확률과 통계 | 평균(mean), 중앙값(median), 절사평균(trimmed mean) 쉽게 이해하기
평균(mean)과 중앙값(median)은 데이터가 어디쯤 중심을 이루는지 보여주는 수치이다. 이번 글에서는 이 두 가지 중심 위치 척도뿐만 아니라, 극단값(outlier)에 대한 민감도, 그리고 이를 보완해주는
olivecodelab.tistory.com
확률과 통계 | 통계 시각화 기초 쉽게 이해하기: 줄기-잎 그림부터 히스토그램까지
통계에서 데이터의 분포를 파악하는 것은 매우 중요하다. 이번 글에서는 대표적인 시각적 도구인 줄기-잎 그림(Stem-and-Leaf Plot), 점 그래프(Dotplot), 그리고 히스토그램(Histogram)에 대해 공부해보려
olivecodelab.tistory.com
'Statistics > Probability & Statistics' 카테고리의 다른 글
확률과 통계 | 산포도 이해하기: 표준편차부터 박스플롯까지 (4) | 2025.07.11 |
---|---|
확률과 통계 | 평균(mean), 중앙값(median), 절사평균(trimmed mean) 쉽게 이해하기 (10) | 2025.06.29 |
확률과 통계 | 통계 시각화 기초 쉽게 이해하기: 줄기-잎 그림부터 히스토그램까지 (4) | 2025.06.28 |
확률과 통계 | 꼭 알아야 할 핵심 개념: 모집단부터 추론통계까지 (3) | 2025.06.27 |
확률과 통계 | 모집단(Population), 표본(Sample), 확률변수(Random Variable) 개념 정리 (1) | 2025.06.26 |