머신러닝과 데이터 분석 A-Z 올인원 패키지 - 회귀분석_수학적 개념 이해(2) - 통계적 추론과 검정통계

2020. 12. 8. 10:57·AI Study/ML_Basic
반응형

위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다.

 

통계적 추론

모집단에 대해 알고싶은데 정보가 부족한 경우, 표본으로부터 모집단의 모수를 알아내고자 하는 과정.

  • 점추정(Point estimation)

    • 추정량을 통해 모수를 추정
    • ex) ${\bar{X}, s^2 \to \mu, \sigma^2}$
  • 구간 추정(Interval estimation)

    • 일정 신뢰수준 하에서 모수를 포함할 것으로 예상되는 구간을 제시
    • 신뢰수준유의수준($\alpha$)과 구간의 길이는 반비례

  • 대립가설(H1)

    • 입증하여 주장하고자 하는 가설
  • 귀무가설(H0)
    • 대립가설의 반대가설
    • 귀무가설이 아니라는 충분한 증거를 데이터로부터 보임으로써 대립가설을 입증
    • 귀무가설 하에서 통계량의 분포를 아는 것이 검정의 핵심

오류의 종류

  • 1종 오류
    • 귀무가설이 맞을 때, 귀무가설을 기각하는 오류
    • 1종오류를 더욱 엄격하게 봄(최대한 범하지 않으려고 함)
  • 2종오류
    • 귀무가설이 틀렸을 때, 귀무가설을 기각하지 않는 오류
  실제 진리
검정 결과 $H_0$ 참 $H_0$ 거짓
$H_0$ 채택 참 2종오류($\beta$)
$H_0$ 기각 1종오류($\alpha$) 참

 

검정통계량, 기각역

  • 검정통계량
    • 표본에서 구해낼 수 있는 함수, 이 값을 기준으로 귀무가설 기각여부를 결정
  • 기각역

    • 검정통계량이 취하는 구간 중 귀무가설을 기각하는 구간
  • 단측검정

    • ${H_1 : \mu > \mu_0}$
  • 양측검정
    • ${H_1 : \mu \ne \mu_0}$

 

유의확률

  • 유의확률(P-value)

    • 주어진 검정통계량값을 기준으로 해당 값보다 대립가설을 더 선호하는 검정통계량 값이 나올 확률
    • 이 값이 유의수준보다 낮으면 귀무가설을 기각
  • 검정통계량이 기각역보다 오른쪽에 있으면 기각한다.

  • 우리가 설정해 놓은 유의수준보다 p_value가 더 낮으면 기각한다.

검정통계량과 관련된 분포

  • Z통계량

    • 귀무가설 : X의 평균이 ${\mu_0}$이다.
    • ${Z = \frac{\bar{X} - \mu_0}{\sqrt{\frac{\sigma^2}{n}}} ~ N(0, 1)}$
      • 이 때 관측의 수가 충분하다면(30 개 이상) ${\sigma^2}$을 ${s^2}$으로 대체 가능.
  • t분포

    • 자유도가 충분하지 않을 때 사용하는 분포
    • ${t = \frac{\bar{X} - \mu_0}{sqrt{\frac{s^2}{n}}}~t(n-1)}$
    • ${f(x;k) = \frac{1}{2^{k/2}\gamma(k/2)}x^{k/2-1}e^{-x/2}, x \ge 0}$
    • 자유도가 커질수록 정규분포에 근사
  • 카이제곱 분포

    • ${Z ~ N(0, 1)}$일 때,
    • ${Z^2 \sim X_(1)^2, \sum_{i = 1}^kZ^2 \sim X_(k)^2}$
    • 확률변수의 제곱합으로 이루어진 통계량
  • F분포

    • 두 확률변수 ${V_1, V_2}$가 자유도 ${k_1, k_2}$이고 서로 독립인 카이제곱 분포를 따를 때,
    • ${F = \frac{V_1/k_1}{V_2/k_2} ~ F(k_1, k_2)}$
    • 확률변수의 제곱합을 관측치로 나눈것의 비율로 이루어진 통계량
반응형

'AI Study > ML_Basic' 카테고리의 다른 글

머신러닝과 데이터 분석 A-Z 올인원 패키지 - 회귀분석_수학적 개념 이해(1) - 확률과 통계  (0) 2020.12.03
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (3)  (0) 2020.09.30
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (2)  (0) 2020.09.30
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (1)  (0) 2020.09.30
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 처리를 위한 Python(Numpy)(2)  (0) 2020.09.30
'AI Study/ML_Basic' 카테고리의 다른 글
  • 머신러닝과 데이터 분석 A-Z 올인원 패키지 - 회귀분석_수학적 개념 이해(1) - 확률과 통계
  • 머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (3)
  • 머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (2)
  • 머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (1)
자동화먹
자동화먹
많은 사람들에게 도움이 되는 생산적인 기록하기
    반응형
  • 자동화먹
    자동화먹의 생산적인 기록
    자동화먹
  • 전체
    오늘
    어제
    • 분류 전체보기 (144)
      • 생산성 & 자동화 툴 (30)
        • Notion (24)
        • Obsidian (0)
        • Make.com (1)
        • tips (5)
      • Programming (37)
        • Python (18)
        • Oracle (6)
        • Git (13)
      • AI Study (65)
        • DL_Basic (14)
        • ML_Basic (14)
        • NLP (21)
        • Marketing&Recommend (4)
        • chatGPT (0)
        • etc (12)
      • 주인장의 생각서랍 (10)
        • 생각정리 (4)
        • 독서기록 (6)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    자연어처리
    머신러닝
    notion
    python기초
    Google Cloud Platform
    파이토치
    데이터분석
    GPT
    dl
    Python
    기초
    노션
    데이터베이스
    gcp
    Github
    빅데이터분석
    빅데이터
    LSTM
    cnn
    git commit
    git
    ML
    nlp
    pytorch
    Jupyter notebook
    파이토치로 시작하는 딥러닝 기초
    seq2seq
    Transformer
    노션첫걸음
    딥러닝
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
자동화먹
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 회귀분석_수학적 개념 이해(2) - 통계적 추론과 검정통계
상단으로

티스토리툴바