확률과 통계 | 통계 시각화 기초 쉽게 이해하기: 줄기-잎 그림부터 히스토그램까지
·
Statistics/Probability & Statistics
통계에서 데이터의 분포를 파악하는 것은 매우 중요하다. 이번 글에서는 대표적인 시각적 도구인 줄기-잎 그림(Stem-and-Leaf Plot), 점 그래프(Dotplot), 그리고 히스토그램(Histogram)을 소개하고, 특히 히스토그램은 Python과 R 코드로 직접 그리는 방법까지 살펴보려 한다.줄기-잎 그림(Stem-and-Leaf Plot)줄기-잎 그림은 각 수치를 줄기(stem)와 잎(leaf)으로 나누어 데이터를 정렬된 형태로 표현한다. 실제 값을 그대로 보존하면서 분포를 쉽게 파악할 수 있어, 소규모 정수형 데이터에 자주 사용된다. 줄기-잎 그림 만드는 5단계줄기(Stem)로 사용할 숫자 자릿수를 정한다관측값에서 한 개 또는 여러 개의 앞자리 숫자를 줄기 값으로 선택한다.나머지 뒷자리 숫자..
확률과 통계 | 꼭 알아야 할 핵심 개념: 모집단부터 추론통계까지
·
Statistics/Probability & Statistics
통계를 공부하다 보면 처음부터 낯선 개념들이 쏟아져 들어온다. Population, Sample, Variable같은 용어부터 Descriptive vs Inferential Statistics까지. 이 글에서는 통계의 기초가 되는 핵심 개념을 간단하게 정리해보려고 한다. Data (데이터)란 무엇인가?데이터(Data)란 관찰이나 측정을 통해 얻은 정보다. 숫자일 수도 있고, 분류된 텍스트일 수도 있다. 예를 들어 “키 170cm”, “성별: 여자”, “지역: 토론토” 모두 데이터에 해당한다. Population, Census, Sample, Variable Population (모집단)조사의 출발점이자 중심이 되는 것이 바로 모집단이다. 정의하자면, 어떤 조사가 집중하는 명확하게 정의된 대상 전체를 말..
확률과 통계 | 모집단(Population), 표본(Sample), 확률변수(Random Variable) 개념 정리
·
Statistics/Probability & Statistics
우리가 어떤 문제를 다룰 때, 모집단의 분포와 그 파라미터(매개변수)가 이미 주어진 경우가 있습니다. 예를 들어, 확률변수가 밑과 같다고 하면 해당 분포의 성질들을 그대로 이용하면 됩니다. 이는 이론적인 상황이며, 기본 공식들도 대부분 이 전제하에서 설명됩니다. 하지만 실제 상황에서는 모집단 전체를 알 수 없고, 오직 표본(sample)만 관측할 수 있습니다. 즉, 모집단의 분포 형태는 추정할 수 있지만, 그 안에 있는 매개변수(μ, σ² 등)는 알려지지 않습니다. 따라서 우리의 목표는 알 수 없는 모집단의 특성을, 한정된 표본을 통해 추정하는 것입니다.✅ 모집단(Population)과 분포모집단(Population)이란, 우리가 관심을 가지는 전체 집단을 말합니다. 이 모집단은 어떤 분포를 따른다고 가..
올리브한입
'확률과 통계' 태그의 글 목록