본문 바로가기
[몽상쟁이] DFSS 6 시그마/미니탭 활용 및 신뢰성분석

상관분석 과 회귀분석 미니탭 활용

by 몽상쟁이 2019. 7. 31.
반응형

상관 분석이란....? _(Correlation analysis)

변수간의 상관 계수 등에 대해서 추정이나 검정을 하는 것. 시료 상관 계수 r를 다음 식에서 z로 변환하면, z의 분포는 근사적으로 정규 분포가 된다.

회귀 분석이란....?_(Regression analysis)

하나 그 이상의 독립변수의 종속변수에 대한 영향의 추정을 할 수 있는 통계기법이며, 하나의 독립변수를 가진 회귀분석에서  하나의 방정식은 독립변수와 종속변수의 결합분포를 보여 주는 지점들의 분포구성을 통해 지나가는 하나의 선을 설명하고 있으며 이 방정식은 Yi=a+bXi+ei 라는 형태를 갖습니다. Xi는 독립 변수의 값을 말하며,

a는 Y축을 지나가는 회귀선의 지점이고, b는 회귀선의 기울기이며, ei는 회귀선 예측의 오차입니다.

그럼 미니탭에서의 예제를 통한 사용방법을 알아 보겠습니다.

다시한번 말씀 드리면, 상관분석이란, 두 변수들 사이에서 어떠한 선형적인 관계가 있는지에 분석 하는 것입니다.

예를 들어 여름이라 기온이 올라 가는것과 아이스크름 판매량의 관계, 반대로 기온이 올라가는 것과 온열기구 판매량의 관계 등이 있겠습니다.

여기서 관계라 함은 +,-의 선형 관계를 나타내는 것이므로 인과관계를 나타내는 것은 아닙니다.

(인과관계를 나타내는 회귀분석은 추후 포스팅 예정) 상관 분석도 모수적 방법과 비모수적 방법이 있습니다.

상관분석을 통해 얻어지는 상관계수(Correlation coefficient)는 r(표본상관계수)로 표시하고, 로우라고  읽습니다.

상관계수는 -1부터 +1 사이의 값을 가지며 +1에 가까울 수록 양의 상관관계를, -1에 가까울 수록 음의 상관관계를 가지며 0에 가까울 경우 상관 두 변수의 관계는 선형적인 관계를 가지지 못한다는 뜻을 가지고 있습니다.

흔히 상관분석 결과를 기울기와 혼동 하시는 분들이 많으신데, 상관분석 결과는 두 변수의 상관의 정도만을 나타내는 것으로 변수들의 기울기와는 전혀 상관이 없습니다.

즉 상관계수의 절대값이 1  이라는 것은 100% 상관성을 의미 한다는 것이라는 것이죠.

상관분석은 이렇게 이루어지며, 헷갈리시면 자칫하면 엉뚱한 방향으로 검정이 이루어지기 때문에 확실히 상관분석에 대해서 어떤 데이터가 필요하고 분석을 해야하는지 확인후 미니탭을 작성 실행 하셔야합니다.

각 회사들마다 담당자가 있을시 것 같습니다.

저 또한 통계분석을 통한 해석을 하는 담당자다 보니 이런류의 자료가 많이 필요한데, 혹시나 도움이 되실까 싶어서 이렇게 예제 파일을 통한 자료를 공유 드립니다.

조금이나마 도움이 되셨으면 좋겠고, 이런 업무가 어렵고 신경을 많이 써야하는 일이지만 나 혼자만 가능하다는 자부심

을 가지고 일하시면 좋을것 같네요

그럼 다들 즐 미니탭 하시고, 또 다른 주제로 포스팅 하러 오겠습니다.

다들 휴가 기간이실건데 휴가 건강히 잘 보내시고 ~ 음식 조심하세요~

<트리즈 관련 포스팅 보기>

반응형

댓글