본문 바로가기
[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석

미니탭 교육 사용법 2표본 t-검정 이란?

by 몽상쟁이 2021. 11. 19.
반응형

2표본 t-검정이란?

2표본 t-검정(독립 표본 t-검정이라고도 함)은 알 수 없는 두 그룹 모집단 평균이 같은지 여부를 검정하는 데 사용되는 방법입니다.

A/B 검정과 동일한가?

그렇습니다. 2표본 t-검정은 A/B 검정의 결과를 분석하는 데 사용됩니다.

카이제곱 적합도 검정은 언제 사용할 수 있는가?

데이터 값이 독립적이고 두 정규 모집단에서 랜덤 표집되며, 두 독립 그룹의 분산이 동일한 경우에 사용할 수 있는 검정입니다.

그룹이 세 개 이상일 때는 어떻게 하는가?

다중 비교 방법을 사용합니다. 이러한 방법 중 하나가 분산 분석(ANOVA)입니다. 그 밖의 다중 비교 방법으로는 Tukey-Kramer 전체 쌍별 차이 검정, 그룹 평균을 전체 평균과 비교하는 평균 분석(ANOM) 또는 그룹별 평균을 관리 평균과 비교하는 Dunnett 검정 등이 있습니다.

두 그룹의 분산이 같지 않으면 어떻게 하는가?

2표본 t-검정을 계속 사용할 수 있습니다. 표준편차의 다른 추정값을 사용합니다.

데이터가 정규 분포를 제대로 따르지 않으면 어떻게 하는가?

표본 크기가 매우 작으면 정규성을 검정하지 못할 수도 있습니다. 본인의 데이터 이해력에 의존해야 할 수 있습니다. 정규성을 가정하는 것이 안전하지 않을 경우 비모수 검정을 수행할 수 있습니다.

 

유효한 검정을 수행하려면:

  • 데이터 값들이 독립적이어야 합니다. 한 관측 대상의 측정값은 다른 관측 대상의 측정값에 영향을 주지 않습니다.
  • 각 그룹의 데이터는 모집단에서 랜덤 표본을 추출해야 합니다.
  • 각 그룹의 데이터는 정규 분포를 따릅니다.
  • 데이터 값은 연속형입니다.
  • 독립적인 두 그룹에 대한 분산은 동일합니다.

데이터 그룹이 너무 작으면 이러한 요구 사항을 검정하기 어려울 수 있습니다. 아래에서 소프트웨어를 사용하여 요구 사항을 확인하는 방법과 요구 사항이 충족되지 않을 때 수행할 작업에 대해 설명합니다.


2-표본 t-검정에 대한 주요 결과 해석

- 1단계 : 모집단 평균의 차이에 대한 신뢰 구간 결정

- 2단계 : 차이가 통계적으로 유의한지 여부를 확인

- 3단계 : 데이터의 문제 확인

 

1단계: 모집단 평균의 차이에 대한 신뢰 구간 결정

먼저 표본 평균의 차이를 고려한 다음 신뢰 구간을 조사합니다.

차이는 모평균 차이의 추정치입니다. 차이는 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 차이가 모집단 차이와 같을 가능성은 없습니다. 모집단 차이를 더 잘 추정하려면 차이에 대한 신뢰 구간을 사용하십시오.

신뢰 구간은 두 모평균의 차이가 될 수 있는 값의 범위를 제공합니다. 

 

예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본이 모집단 차이가 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다.

 

해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오

차이 추정치

주요 결과: 차이 추정치, 차이에 대한 95% CI

이 결과에서 병원 등급의 평균 모집단 차이의 추정치는 21입니다. 차이에 대한 모평균이 14.22와 27.78 사이에 있다고 95% 확신할 수 있습니다.


2단계: 차이가 통계적으로 유의한지 여부를 확인

 

모평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하면 됩니다.

일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다.

0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.

 

p-값 ≤ α: 평균 간의 차이가 통계적으로 유의함(H0 기각)

p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모평균 간의 차이가 귀무 가설에서의 차이와 같지 않다는 결론을 내릴 수 있습니다. 귀무 가설에서의 차이를 지정하지 않은 경우 Minitab에서는 평균 간에 차이가 없는지 여부(귀무 가설에서의 차이 = 0)를 검정합니다. 

 

p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않음(H0 기각 실패)

p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다. 검정에 실제로 유의한 차이를 탐지할 만한 충분한 검정력이 있는지 확인해야 합니다. 

p-값 주요결과 확인

주요 결과: p-값

이 결과에서 귀무 가설은 두 병원 간 평균 등급의 차이가 0이라는 것입니다. p-값이 0.00 미만으로, 유의 수준 0.05보다 작기 때문에 귀무 가설을 기각하고 병원의 등급이 다르다는 결론을 내립니다.


3단계: 데이터의 문제 확인

왜도 및 특이치와 같은 데이터의 문제는 결과에 부정적인 영향을 미칠 수 있습니다. 각 표본의 산포를 조사하여 왜도를 확인하고 잠재적 특이치를 식별하려면 그래프를 사용하십시오.

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다.

데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉬운 경우가 많습니다.

(왼) 왼쪽으로 치우침 (우) 오른쪽으로 치우침

오른쪽으로 치우친 데이터의 상자 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 상자 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

 

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 15보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

표본출력

표본 출력 이 상자 그림에서 병원 B의 데이터는 심하게 치우쳐 있는 것으로 보입니다.

특이치 식별

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

*가 특이치를 나타낸다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건에 대한 데이터 값을 삭제해 보십시오(특수 원인이라고도 함). 그런 다음 분석을 반복하십시오.  

표본출력 특이치 확인

표본 출력 이 상자 그림에서 병원 B의 데이터에는 두 개의 특이치가 있습니다.


2-표본 t-검정 예시

한 건강 관리 컨설턴트가 두 병원의 환자 만족도 등급을 비교하려고 합니다. 이 컨설턴트는 각 병원에 대해 환자 20명의 만족도 점수를 수집합니다.

컨설턴트는 병원 간의 환자 등급에 차이가 있는지 여부를 확인하기 위해 2-표본 t 검정을 수행합니다.

  1. 아래 표 내용을 워크시트에 입력합니다.
  2. 통계분석 > 기초 통계 > 2-표본 t 검정을 선택합니다.
  3. 드롭다운 리스트에서 두 표본이 모두 한 열에 있음을 선택합니다.
  4. 표본에 등급을 입력합니다.
  5. 표본 ID에 병원을 입력합니다.
  6. 확인을 클릭합니다.

병원등급 결과 워크시트
기초통계 - 2-표본 t검정 선택
2-표본 t검정 예시
2-표본 t-검정 등급상자 및 개별 값 그림
2-표본 t검정 결과

결과 해석

귀무 가설은 두 병원 간 등급의 차이가 0이라는 것입니다. p-값이 0.000으로, 유의 수준 0.05보다 작기 때문에 컨설턴트는 귀무 가설을 기각하고 두 병원의 등급이 다르다는 결론을 내립니다.


2-표본 t검정에 대한 예시와 어떨때 사용하는지를 알아봤는데, 조금 이해가 되시는지, 이런 기본적인 기초통계에 대해서 지식을 쌓아놓다보면 이후 회귀분석등 많은 분석들을 쉽게 할 수 있을 것입니다.

 

꾸준히 공부하는게 답이며, 사람은 망각의 동물이라고 하죠. 오늘 공부한 내용이 몇 시간후면 30%도 기억을 못한다고 합니다. 그렇기 때문에 복습이 중요하며, 꾸준히 노출을 시켜줘야 장기기억으로 지식이 습득이되어 자신의 것이 되는 것입니다.

 

2-표본 t검정에 대해서 다른 예시파일을 이용해서 많이들 해보시고, 충분히 이해를 하고 넘어가는 것이 좋을 것입니다. 그렇지 않으면 또 이런 비슷한 일이 발생했을때 어떻게 적용을 해야하는지를 까먹기 때문이죠.

 

그럼 오늘도 조금이나마 미니탭 사용하는데 도움이 되셨길 바라면서, 글을 마무리 하도록 하겠습니다.

2021.11.18 - [[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석] - 미니탭 t-검정 이란_(1표본 t-검정)?

2021.11.17 - [[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석] - 신뢰성 검사 평가 분석 어떻게 이루어질까?

2021.11.09 - [[몽상쟁이] DFSS 6 시그마] - 6sigma DMAIC 사례를 통해서 알아보자!!

2021.11.08 - [[몽상쟁이] DFSS 6 시그마] - six sigma 뜻 통계적 의미 DMAIC 추진절차 Part.2

2021.11.05 - [[몽상쟁이] DFSS 6 시그마] - six sigma 뜻 통계적 의미 흐름을 알아보자!!! Part.1

2021.10.29 - [[몽상쟁이] DFSS 6 시그마/TRIZ] - DOE 실험계획법으로 강건설계 해보자!!!

반응형

댓글