수학의 꽃이 함수라면, 사회과학분야에 있어 통계의 꽃은 회귀분석입니다.

회귀분석을 통해 어떤 변인이 다른 변인에게 유의미한 영향을 주는지 확인할 수 있습니다.

(회귀분석은 등간척도 또는 비율척도에서만 가능합니다.)


회귀분석은 상관분석(관계성)과 달리 방향성이 있습니다.

따라서 A가 B에 미치는 영향과 B가 A에 미치는 영향은 다릅니다.

(어머니가 아들에게 유의미하게 영향을 주지만, 아들은 어머니에게 영향을 주지 못할 수 있는 것과 같습니다.)

그리고 회귀분석을 하기 전에 상관관계 분석을 진행한 이유가 있습니다.

회귀분석을 진행하기 위한 전제조건은 독립변수들간의 상관관계가 없다는 조건입니다.

따라서 회귀분석을 진행하기 전 상관관계 분석에서, 다중공선성이 발생했다면 회귀분석을 진행할 수 없습니다.

만약 다중공선성이 발생했다면, 문제가 되는 변수를 제거하거나, 설문문항을 추가하여 다중공선성을 희석시켜야 합니다.



독립변수가 한 개인 회귀분석을 단순회귀분석,

독립변수가 두 개 이상인 회귀분석을 다중회귀분석이라고 합니다. 



회귀분석은 종속(영향을 받는)변인에 1개의 변인만 설정할 수 있습니다.

따라서 위 이미지의 왼쪽과 같은 경우, A→B, A→C, A→D, A→E, A→F 이렇게 5번의 단순회귀분석을 진행해야 합니다.

오른쪽의 경우는 (A, B, C, D, E)→F 이렇게 1번만 다중회귀분석을 진행합니다.



하위요인을 3개 갖고 있는 독립변수 A가, 하위요인을 2개 갖고 있는 종속변수 B에게 미치는 영향에 대해 회귀분석을 하려면

종속변수가 BA인 경우와, 종속변수가 BB인 두 경우로 나누어, 다중회귀분석을 2번 진행해야 합니다.




위 매개효과 연구모형을 기준으로 회귀분석은 5번 진행되어야 합니다.


1. A(팀분위기)가 B(이직의도)에 미치는 영향

1-1) A(AA, AB, AC, AD) → BA

2. C(여가만족)가 B(이직의도)에 미치는 영향

2-1) C(CA, CB, CC) → BA

3. A(팀분위기)가 C(여가만족)에 미치는 영향

3-1) A(AA, AB, AC, AD) → CA

3-2) A(AA, AB, AC, AD) → CB

3-3) A(AA, AB, AC, AD) → CC


이 중 1-1) A(AA, AB, AC, AD) → BA에 미치는 영향을 회귀분석을 하겠습니다.



예제로 사용할 SPSS 파일이 준비되어 있지 않으신 분은 아래의 파일를 다운로드 해주세요.


rawdata2(sample).sav


출력결과2.spv



※ 이미지들은 클릭하면 원본이미지로 크게 보실 수 있습니다.



메뉴에서 [분석-회귀분석-선형]을 선택합니다.



변수 AA, AB, AC, AD를 독립변수로 선택합니다.



BA를 종속변수로 선택합니다.



우측의 [통계량] 옵션에서 공성성 진단Durbin-Watson을 체크합니다.

(다중회귀분석에서만 선택합니다.)



[확인]을 클릭하여 회귀분석을 실행합니다.



뷰어에 회귀분석 결과가 추가되었습니다.



독립변수가 AA, AB, AC, AD이고

종속변수사 BA인 것을 확인할 수 있습니다.



R값을 확인하여, 독립변수와 종속변수의 상관관계를 확인합니다.

R=.357로, 독립변수와 종속변수는 낮은 상관관계를 나타나고 있습니다.


<참고: R값에 따른 상관관계의 정도>

r이 -1.0과 -0.7 사이이면, 강한 음적 선형관계,

r이 -0.7과 -0.3 사이이면, 뚜렷한 음적 선형관계,

r이 -0.3과 -0.1 사이이면, 약한 음적 선형관계,

r이 -0.1과 +0.1 사이이면, 거의 무시될 수 있는 선형관계,

r이 +0.1과 +0.3 사이이면, 약한 양적 선형관계,

r이 +0.3과 +0.7 사이이면, 뚜렷한 양적 선형관계,

r이 +0.7과 +1.0 사이이면, 강한 양적 선형관계


R제곱값을 확인하여, 종속변수가 독립변수에 의해 설명되는 비율흘 확인할 수 있습니다.

R 제곱=.127로, 종속변수가 독립변수에 의해 12.7% 설명되고 있습니다.

Durbin-Watson(DW)값을 확인하여, 잔차(residual)간의 상관관계를 확인합니다. 

DW=1.750으로 2에 근접하여, 잔차(residual)간의 상관관계가 없어 회귀모형이 적합한 것으로 나타나고 있습니다.


<참고: Durbin-Watson>

더빗-왓슨(DW)값은 데이터들의 1차 자기상관을 나타냅니다.

DW의 범위는 0~4이며,

0: 양의 자기상관

2: 독립

4: 음의 자기상관을 의미합니다.

정확한 기준은 아직 없으나, 보통 1.5~2.5 사이이면 독립으로 판단하여, 1보다 작거나, 3보다 크면 자기상관이 있어 회귀모형이 적합하지 않은 것으로 판단합니다.



유의확률이 0.05보다 작은지 확인합니다. 

F값은 7.107로 나타고, 유의확률은 .000으로 회귀모델이 적합하다는 것을 알 수 있습니다.

(유의확률이 .05 이상인 경우 회귀선이 모델에 부적합하다고 할 수 있습니다.)



비표준화 계수는 회귀선의 기울기와 기울기 표준오차를 의미합니다.(논문에서는 중요하지 않음)


t값이 ±1.96보다 크고, 유의확률(p)가 .05보다 작을 때 영향을 미친다는 가설을 유의미하다고 판단합니다.

변수 AA는 t값이 -2.493이고, p<.05이므로 BA에 부적인 영향을 미친다고 할 수 있습니다.

변수 AB는 t값이 -.687이고, p>.05이므로 BA에 유의미한 영향을 미친다고 할 수 없습니다.

변수 AC는 t값이 1.656이고, p>.05이므로 BA에 유의미한 영향을 미친다고 할 수 없습니다.

변수 AD는 t값이 -4.300이고, p<.05이므로 BA에 부적인 영향을 미친다고 할 수 있습니다.

(t값이 1.96이면, 유의확률(p)는 .05이므로 둘 중에 하나만 확인해도 무방합니다.)

(t값의 부호가 +면 정적인 영향, -면 부적인 영향을 미치는 것입니다.)


 표준화 계수 β값을 확인하여 어떤 변인이 상대적으로 더 많은 영향을 주는 지 판단할 수있습니다.

변수 AA는 β값이 -.199이고 AD는 β값이 -.320이므로, AD가 상대적으로 AA보다 더 큰 영향을 미친다고 할 수 있습니다.


 공차한계(Tolerance)와 VIF를 확인하여, 다중공선성을 진단할 수 있습니다.

공차한계가 모두 .100 이상이며, VIF가 10 미만이므로 다중공선성의 문제가 없어 회귀 모형이 적합하다고 할 수 있습니다.

(공차한계가 .1보다 작거나, VIF가 10 이상이면 다중공선성으로 판단합니다.(공차한계가 .1일 때, VIF는 10))



(다중공선성 문제를 확인하려면 아래를 클릭)

2015/12/11 - [논문통계/통계기초] - 다중공선성(Multicollinearity)이란?






회귀분석 결과를 논문작성중인 한글파일에 작성하기 위해, 회귀분석 표를 작성합니다.



회귀분석 결과를 표에 입력합니다.



회귀분석 결과해설을 작성합니다.





회귀분석을 모두(총 5번) 실시한 후, 뷰어파일(출력결과)를 저장합니다.

아래 첨부파일과 같은 SPSS 파일이 저장되어 있으면 성공입니다.


출력결과2.spv



(엑셀에서 회귀분석 하는 방법을 알고 싶다면 아래를 클릭)

2015/12/10 - [논문통계/엑셀] - 엑셀(Excel)에서 회귀분석으로 영향을 미치는지 확인하기






회귀분석을 5회 진행하면 아래와 같은 결과를 확인할 수 있습니다.



회귀분석(regression analysis)이란

관찰된 연속형 변수들에 대해 독립변수와 종속변수 사이의 상관관계를 나타내는 선형 관계식을 구하는 기법 및 이렇게 얻은 모형의 적합도를 측정하는 분석 방법이다.






관련 글 보기


2015/12/03 - [논문통계/SPSS] - SPSS에서 엑셀데이터 불러와서 저장하기(예제파일포함)


2015/12/03 - [논문통계/SPSS] - SPSS에서 빈도분석으로 인구통계적 특성 파악하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 요인분석으로 타당도 측정하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 크론바흐 알파(Cronbach's α)로 신뢰도 측정하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 변수 계산으로 요인 평균값 만들기


2015/12/06 - [논문통계/SPSS] - SPSS에서 상관관계분석으로 변수 간 상관도 분석하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 회귀분석으로 영향을 미치는지 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 3단계 회귀분석으로 매개변수의 매개효과 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 위계적 회귀분석으로 조절변인의 조절효과 확인하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 더미변수를 이용하여 회귀분석하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 T-test로 두 집단간의 평균 비교하기


2016/01/17 - [논문통계/SPSS] - SPSS에서 One-Way-Anova(일원배치분석)으로 여러 집단간의 평균 비교하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 카이제곱 분석으로 변수들간의 독립성과 관련성 분석하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 군집분석으로 집단을 군집으로 분류한 후 특성 확인하기






+ 최근 게시물들