t-검정이란?
t-검정은 가설 검정을 사용하여 하나 또는 모집단의 평균을 평가하는 도구입니다. 한 그룹이 알려진 값과 다른지 여부(1표본 t-검정), 두 그룹이 서로 다른지 여부 (독립 2표본 t-검정), 쌍체 측정값에 유의한 차이가 있는지 여부(쌍체 또는 종속 표본 t-검정)를 평가하는 데 t-검정을 사용할 수 있습니다.
어떤 방법으로 사용하는가?
먼저 검정할 가설을 정의하고, 잘못 내린 결론을 용인할 수 있는 위험률을 지정합니다. 두 모집단을 비교하는 예를 들어보면, 두 모집단 평균이 같다는 가설을 세우고, 차이가 없을 때 차이가 존재한다는 결론을 내릴 위험을 용인할 수 있는 확률을 결정할 수 있습니다.
그런 다음, 데이터에서 검정 통계량을 계산해서 t분포의 이론적 값과 비교하고, 비교 결과에 따라 귀무가설을 기각하거나 인정합니다.
그룹이 그럼 세 개 이상일 때는 어떻게 할까?
t-검정을 사용할 수 없습니다. 다중 비교 방법을 사용합니다. 다중 비교의 예로는 분산분석(ANOVA),Tukey-Kramer 쌍벌비교, Dunnett의 대조군 비교, 평균 분석(ANOM)방법 등이 있습니다.
단측 검정과 양측 검정 비교
가설을 세울 때 단측 검정인지 아니면 양측 검정인지 여부도 정해야 합니다. 데이터를 수집하거나 계산을 수행하기 전에 이 결정을 내려야 합니다. 평균에 대한 세 가지 t-검정 모두에 대해 결정을 내립니다.
1표본 t-검정을 이용해서 설명을 해보면, 단백질바의 랜덤 표본이 있고 단백질바의 라벨에 개당 단백질 함량이 20그램으로 광고되어 있다고 가정합니다.
귀무가설은 알 서 없는 모집단 평균이 20이라는 것입니다. 단순히 데이터에 다른 모집단 평균도 있는지 확인하려 한다고 가정합니다. 이 경우에 가설은 아래와 같이 표현됩니다.
Ho : μ = 20
Ha : μ ≠ 20
양측 검정이 있습니다. 데이터를 이용하여 표본 평균의 차이가 유효한지_(즉, 20보다 높거나 낮은지)여부를 확인함으로써 알 수 없는 모집단 평균이 20이 아니라는 결론을 도출해 보겠습니다.
대신 라벨의 광고가 정확한지 알고 싶다면, 데이터가 알 수 없는 모집단 평균이 최소 20이라는 가정을 뒷받침할까요? 그렇지 않을까요? 이 경우에 가설은 다음과 같이 표현됩니다.
Ho : μ >= 20
Ha : μ < 20
단측 검정이 있습니다. 모집단 평균이 20 이상이라는 가설을 기각하기 위해 데이터를 이용하여 알 수 없는 표본 평균이 20보다 유의하게 작은지 확인해봅니다.
1-표본 t 검정 예시
한 경제학자가 가정의 월간 에너지 비용이 작년($200)과 달라졌는지 확인하려고 합니다. 경제학자는 25개 가정을 랜덤으로 추출하고 올해의 에너지 비용을 기록합니다.
경제학자는 월간 에너지 비용이 $200와 다른지 확인하기 위해 1-표본 t 검정을 수행합니다.
- 미니탭을 열고, 표본 데이터가정에너지비용 아래 내용을 타이핑 합니다.
- 통계분석 > 기초 통계 > 1-표본 t 검정을 선택합니다.
- 드롭다운 리스트에서 하나 이상의 표본, 한 열에 하나씩을 선택하고 에너지 비용을 입력합니다.
- 가설 검정 수행을 선택합니다.
- 가설 평균에 200을 입력합니다.
- 확인을 클릭합니다.
결과해석
귀무 가설은 평균 에너지 비용이 $200이라는 것입니다. p-값이 0.000으로, 유의 수준 0.05보다 작기 때문에 경제학자는 귀무 가설을 기각하고 가족의 월 평균 에너지 비용이 $200과 다르다는 결론을 내립니다. 95% CI는 모평균이 $200보다 클 가능성이 있다는 것을 나타냅니다.
생각보다 쉽지 않나요? 이렇게 결과 해석이 중요하기 때문에 결과 해석을 잘 보시고 판단을 하시기 바랍니다. 항상 데이터를 잘 만들고 결과해석을 잘못해서 판단의 오류가 생길 경우가 종종 생기기 때문입니다.
어떤 툴이든 자신의 일한 결과물에 대해서 편리하게 정리를 해주는 역할을 하는 것이지 결국 판단과 결론은 일하는 사람들의 몫이기 때문에 꼭 자신만의 노하우와 공부를 해야 하기를 당부드립니다.
저 또한 꾸준히 공부를 하고 있고, 많은 자료는 있지 않지만, 적어도 큐레이터 역할을 여러분들에게 제대로 한번 해볼려고 노력중이니 많은 방문 부탁드립니다.
쉬운 내용부터 저도 이해하는 차원에서 자료를 정리하고 있기 때문에 여러분들에게도 도움이 될 것이라고 확신합니다.
그럼 다들 일하고 분석하는데 조금이나마 도움이 되셨길 바라면서 다음 시간에 뵈요.
2021.11.17 - [[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석] - 신뢰성 검사 평가 분석 어떻게 이루어질까?
2021.11.09 - [[몽상쟁이] DFSS 6 시그마] - 6sigma DMAIC 사례를 통해서 알아보자!!
2021.11.08 - [[몽상쟁이] DFSS 6 시그마] - six sigma 뜻 통계적 의미 DMAIC 추진절차 Part.2
2021.11.05 - [[몽상쟁이] DFSS 6 시그마] - six sigma 뜻 통계적 의미 흐름을 알아보자!!! Part.1
2021.10.29 - [[몽상쟁이] DFSS 6 시그마/TRIZ] - DOE 실험계획법으로 강건설계 해보자!!!
'[몽상쟁이] DFSS 6 시그마 > 미니탭 활용 및 신뢰성분석' 카테고리의 다른 글
미니탭 예제 '신뢰성 분포 ID그림' 간략 예시와 모델링 해보기 (0) | 2021.11.20 |
---|---|
미니탭 교육 사용법 2표본 t-검정 이란? (0) | 2021.11.19 |
신뢰성 검사 평가 분석 어떻게 이루어질까? (0) | 2021.11.17 |
미니탭 체험판 설치 및 다운로드 방법!!! (0) | 2021.10.06 |
minitab 실험계획법(DOE)에 대해서 알아보자!! PART.3 (2) | 2020.06.13 |
댓글