AI Bootcamp 여섯번째
Updated:
여섯번째 Diary
1. Flow
- Estimation / Sampling의 목적과 방법에 대해서 이해한다.
- 가설검정에 대해서 이해한다.
- T-test의 목적과 사용예시를 설명할 수 있다.
2. Result & Info
- 특히 오늘 배운 내용중에
T-test
가 가장 중요하다.
T-test
란 주어진 데이터의 평균값에 대해서 가설검정을 하는 것이다.T-test
의 결과값 중에P-value
값에 따라 가설검정을 하는데
$H_0$ : 두 집단 간의 평균 차이는 없을 것이다.
$H_1$ : 두 집단 간의 평균 차이가 있을 것이다.
라고 일반적으로 가설을 세우고,P-value
= 0 ~ 0.05 : 귀무가설 기각
P-value
= 0.1 ~ : 귀무가설 채택 한다.- P-value값은 data수가 너무 많게 되면 오차에 대해서 잘못된 결과가 나오기도 한다. 이는 T-test의 가정이 완전히 충족하지 않았는데 T-test로 검정을 했던것으로 판단 할 수있다.
3. Etc
- 나름 수학과라 정확한 통계적내용을 모르면 부끄럽긴 하지만 졸업한지 오래라 많이도 까먹었다. 참… 안타깝지만, 처음부터 다시 차근차근히 봐야 겠다. 이번주는 통계, 다음주는 선대를 하는데 일단은 다 까먹었다 생각하고 학습을 하자.
- Data Science를 하는 입장에서 단순히 통계학적 지식도 중요하겠지만 당연히 Python을 적용하는 모습이 더 중요할수 있기 때문에 충분히 손으로 노력을 해야겠다.
- 단측검정과 양측검정에 대해서 더 봐야겠다.
Leave a comment