본문 바로가기

통계3

신뢰 구간(Confidence Interval)의미와 직관 그리고 오해 : 구간 추정, 신뢰 수준, 오차 한계, 신뢰도 95%의 개념 글의 목표1. 신뢰구간의 정확한 의미를 이해할 수 있다.2. 신뢰구간을 해석할 때 어떻게 생각하고 접근해야 하는지를 알 수 있다3. 가설검정 관점에서의 신뢰구간을 도입하여 설명이 가능하다. 4. 신뢰구간에서 흔히 발생할 수 있는 오해와 진실을 알 수 있다. (신뢰구간 안에 있을 확률?)  서론이번 포스팅에서는 많은 사람들이 헷갈리고 어디에 어떻게 해석해야 할지 잘 모르는 '신뢰구간' 주제를 가져왔다. 통계학 추정이란? 통계학의 주요 목표는 추정이다. 특히, 우리가 일반적으로 사용하는 통계는 빈도주의 통계의 하위 분야인 모수 통계학으로, 여기에서는 모집단의 분포를 가정하고 평균, 분산과 같은 모수도 특정 값으로 정해져 있다고 가정한다. 우리가 평균,  분산을 구하는 것은 모두 모수(모집단)를 추정하는 행위.. 2024. 10. 13.
가설검정 이해: 검정통계량, 귀무가설, 대립가설, p-value, 유의수준 (significance level), 임계값 (critical value) 개념 정리 (본질) 글의 목표1. 가설검정이 무엇인지 직관적으로 이해할 수 있다2. 검정통계량이 왜 도입됐는지 그리고 무엇인지를 이해할 수 있다.3. 귀무가설, 대립가설에 대한 정확한 정의를 알 수 있다.4. p-value, 유의수준, 임계값에 대한 정확한 개념을 이해할 수 있다.5. 최종적으로 가설검정에 있어 위의 용어들이 어떻게 매핑되고 사용되는지 알 수 있다. 가설검정이란? 통계학에서의 가설검정은 모집단(전체 집단)에 대한 어떤 주장(가설)을 세우고, 표본(부분 집단)을 관찰하여 그 주장이 맞는지 틀린지 판단하는 방법이다.   본론 (스토리 : 평균치 검정 One-sample t-test 예시)* 요약된 결론만 보고싶다면 마지막, 결론만 봐도 된다 * 위에서 정의한 가설검정이 무엇인지 직관적인 그림으로 한 번 나타내보.. 2024. 10. 6.
자유도(Degree Of Freedom)란 & 모분산 추정과 자유도 (n-1) 여담 최근 데이터분석 플랫폼을 만들면서 2019년, 2020년 학부 인턴과 대학원 시절에 했었던 데이터 분석을 다시 한 번 상기시키면서 정리하는 글입니다. 또한 기존에 잘 알지 못했던 자유도 개념을 정리하는 글입니다. 글의 목표이번 포스팅에서는 모수통계학에서의 모분산 추정과 자유도 관련해서 얘기해보고자 한다.이번 글을 읽고나면 이해가 가야할 포인트를 다음과 같이 정리할 수 있다.1) 자유도의 개념2) 표본에서의 모집단 분산 추정량에서 n-1로 나누는 이유 - 과소추정량의 관점의 설명    : n-1로 나눈 이유를 모집단 분포에서의  - 자유도의 관점의 설명 (분산에 대한 본질적 의미의 이해)    : 표본에서의 분산 추정량에서 자유도로 나눈 이유와 그에 대한 본질을 이해할 수 있다  본론 위의 수식1과 .. 2024. 9. 30.