본문 바로가기
[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석

분산분석_(ANOVA) 미니탭 사용방법

by 몽상쟁이 2019. 7. 31.
반응형

분산 분석이란...??

두개 이상 집단들의 평균을 비교하는 통계분석 기법입니다.

다시 말해, 분산분석은 두 개 이상 집단들의 평균 간 차이에 대한 통계적 유의성을 검증하는 방법이며,

기본적으로 분산분석은 회귀분석의 특별한 형태이다.

분산 분석_(Analysis of variance)을 발전시킨 사람은 바로 로널드 피셔_(1890~1962) 입니다.

로널드 피셔

일원배치 분산분석 개념과 작동원리

회귀분석의 한 형태인 분산분석_(ANOVA), 각 케이스의 관찰값과 평균 간 차이인 편차를 제곱해 합산한 후 표본 크기로 나눈 분산을 이용해 2개 이상 집단 간 평균 차이를 검증하는 방법이다.

이 분석은 독립변인이 2개 이상 범주수준으로 측정된 질적 데이터이고, 종속 변인이 유사등간 수준이상으로 측정된 양적 데이터일 경우에 사용할 수  있다. 분산분석은 K개 집단들의 평균이 모집단 평균과 동일하다는 영가설을 검증한다.

이를 상징적으로 표현하면 이렇습니다.

H0 : μ1=μ2=…=μk
Ha : 적어도 두 개의 μ는 다르다.

회귀 분석과 분산분석의 작동원리 비교표

그럼 미니탭을 활용한 분산분석 절차를 한번 보도록 하겠습니다.

'분산'이란 무엇인가?

아메바 단세포 머리로 이해한것이 바로 이것입니다.

'분산' 이라는 건 퍼져있다는 뜻이죠, 평균에서 각각의 점수가 얼마나 퍼져 있는가??

예를 들어서 우리회사 월급이 평균 400만원이라고 발표가 났다고 가정하고, 이게 너무  억울한것이죠.

나는 200 받는데  왜 평균이 400만원?? 알고보니 내 상사는 내 5개월치 월급을 한달 월급으로 상사의 상사인 팀장은 내 1년치 월급을 한달에 받어라 가정하죠. 그래서 그걸 합쳐서 평균을 내서 400만원 이라고 하더라고 칩시다.

그럼 너무 억울 하다는 거죠, 그러니 따져 볼 필요가 있다는 것입니다. 평균 400만원을 가운데 딱 선을 그어놓고

우리 회사 사람들의 월급을  하나하나 점으로 찍어보는거죠, 누가 얼마나 받는지를...

평균보다 어떤 이는 얼마나 적게 받고, 어떤 사람은 얼마나 많이 받고, 상위 1%가 월급 다 차지하고 평균만 올리는 거 아닌지? 점수들이 얼마나 퍼져 있는지....

이게 바로 분산이라는 것이죠. 많이 퍼져 있을수록 월급 차이가 천차만별이 되는것이죠.

그럼 분산분석은 어제 쓰는게 가장 좋을까요??

예를 들어서 세 집단에서 뭔 조사를 했다고 가정하고, 그 결과값의 평균을 비교하고 싶어요.

그런데 평균을 직접비교하는 것이 의미가 정확하지 않다는 걸 이전에 400만원 월급 얘기 나올 때 했었죠?

그러니 평균을 비교하는 것이 아니라, 세 집단의 평균이 '얼마나 퍼져 있는지'를 살펴봐야 되는 것이죠.

그걸 통계 언어로 집단 간 분산의 차이를 검정한다. --> 세 집단의 평균값이 서로서로 얼마나 퍼져 있는지 보는것.

이렇게 미니탭의 분산분석에 대해서 간단한 예제로 활용 방법을 포스팅 해봤습니다.

많이 도움이 되셨길 바라고, 추가적으로 계속해서 미니탭 활용법에 대한 내용 UPDATE 예정이오니 많이 찾아주시고

댓글 많이들 달아주세요~ 그럼 즐거운 하루 보내세요~

https://coupa.ng/biH15y

 

제주 삼다수

COUPANG

www.coupang.com

 

반응형

댓글