AI Bootcamp 여섯번째

Updated:

AI Bootcamp

여섯번째 Diary


1. Flow

  1. Estimation / Sampling의 목적과 방법에 대해서 이해한다.
  2. 가설검정에 대해서 이해한다.
  3. T-test의 목적과 사용예시를 설명할 수 있다.

2. Result & Info

  1. 특히 오늘 배운 내용중에 T-test가 가장 중요하다.
    T-test란 주어진 데이터의 평균값에 대해서 가설검정을 하는 것이다.
  2. T-test의 결과값 중에 P-value값에 따라 가설검정을 하는데
    $H_0$ : 두 집단 간의 평균 차이는 없을 것이다.
    $H_1$ : 두 집단 간의 평균 차이가 있을 것이다.
    라고 일반적으로 가설을 세우고, P-value = 0 ~ 0.05 : 귀무가설 기각
    P-value = 0.1 ~ : 귀무가설 채택 한다.
  3. P-value값은 data수가 너무 많게 되면 오차에 대해서 잘못된 결과가 나오기도 한다. 이는 T-test의 가정이 완전히 충족하지 않았는데 T-test로 검정을 했던것으로 판단 할 수있다.

3. Etc

  1. 나름 수학과라 정확한 통계적내용을 모르면 부끄럽긴 하지만 졸업한지 오래라 많이도 까먹었다. 참… 안타깝지만, 처음부터 다시 차근차근히 봐야 겠다. 이번주는 통계, 다음주는 선대를 하는데 일단은 다 까먹었다 생각하고 학습을 하자.
  2. Data Science를 하는 입장에서 단순히 통계학적 지식도 중요하겠지만 당연히 Python을 적용하는 모습이 더 중요할수 있기 때문에 충분히 손으로 노력을 해야겠다.
  3. 단측검정과 양측검정에 대해서 더 봐야겠다.

codestates

Leave a comment