앞서서 다양한 회귀분석을 진행하였습니다.

그런데 회귀분석을 하기 위한 전제조건 중 하나는 척도가 등간척도거나 비율척도여야 한다는 것이었습니다.

그렇다면 성별과 같은 명목척도는 회귀분석을 할 수 없을까요?

대중적은 방법은 아니지만, 더미변수(Dummy Variable)를 사용하여 명목척도도 회귀분석을 할 수 있습니다.

여기서 Dummy란 뭔가 '쌓아가기 위해 임의로 만든' 정도로 생각하시면 됩니다.


성별(D1)이 이직의도(BA)에 미치는 영향을 확인해보도록 하겠습니다.

예제로 사용할 SPSS 파일을 다운로드 해주세요.


rawdata4(sample).sav




※ 이미지들은 클릭하면 원본이미지로 크게 보실 수 있습니다.


위에 첨부된 파일을 열어, 화면의 오른쪽에 보면

독립변수가 될 성별 D1과 종속변수가 될 이직의도 BA를 확인할 수 있습니다.



명목척도인 성별을 더미변수로 바꾸기 위해

메뉴에서 [변환-다른 변수로 코딩변경]을 선택합니다.




[새로운 변수로 코딩변경] 팝업창에서

성별인 D1을 변수로 설정합니다.




우측의 이름 입력창에 'D1_Dummy' 라고 입력한 후, 설명 입력창에는 '성(더미변수)'라고 입력합니다.

아래의 [바꾸기] 버튼을 클릭한 후, [기준값 및 새로운 값] 버튼을 클릭합니다.




성별에 대한 값은 '남' 또는 '여'로 값이 저장되어 있습니다.

'남'은 숫자 '1'로, '여'는 숫자 '0'으로 바꿔보겠습니다.


기존값의 값에는 '남'을 입력한 후, 새로운 값의 기준값에는 '1'을 입력합니다.

[추가] 버튼을 클릭합니다.



'남'을 제외하면 나머지, 즉 '여'는 '0'으로 바꾸기 위해

기존값의 [기타 모든 값]을 선택한 후, 새로운 값에 '0'을 입력합니다.

[추가] 버튼을 클릭합니다.

[계속] 버튼을 클릭합니다.



[확인] 버튼을 클릭합니다.



더미변수 생성이 완료되었습니다.



새로 생성된 성별 더미변수 'D1_Dummy'를 보면 남자는 1로 여자는 0으로 입력되어 있는 것을 확인할 수 있습니다.



이제, 회귀분석을 하기 위해 메뉴에서 [분석-회귀분석-선형]을 선택합니다.




독립변수에는 성별더미변수 [D1_Dummy]를, 종속변수에는 이직의도 [BA]를 설정한 후

[확인] 버튼을 클릭합니다.



뷰어에 회귀분석 결과가 추가되었습니다.



독립변수에 성별더미변수(D1_Dummy)가 종속변수에 이직의도(BA)가 입력되었습니다.



독립변수와 종속변수의 상관관계는 거의 없습니다.(R=.152)

독립변수가 종속변수를 설명하는 비율은 2.3%로 설명력이 매우 낮습니다.(R^2=.23)



F값이 4.666, 유의확률은 .032(p<0.05)으로 통계적 유의수준 하에 있어, 회귀선 모델에 적합하다고 할 수 있습니다.



독립변수인 성별더미변수가 종속변수인 이직의도에 통계적 유의수준 하에서 유의한 영향을 미치고 있는 것으로 나타났습니다.(t=-2.160)

결과적으로

'남자'라는 요인은 이직의도에 3.169 + -3.66*(1)= -0.419 만큼 영향을 미치고,

'여자'라는 요인은 이직의도에 3.169 + -3.66*(0)=  3.169 만큼 영향을 미치는 것으로 나타났습니다.


분석이 완료되면 뷰어파일(출력결과)을 저장합니다.

아래 첨부파일과 같은 SPSS파일이 저장되어 있으면 성공입니다.


출력결과(더미변수).spv






<추가> 직급(D6)이 이직의도(BA)에 미치는 영향을 회귀분석


직급은 사원급/대리급/과장급/차장급/부장급 이렇게 총 5개의 서열척도로 구성되어 있습니다.

이전에 성별(남,여)을 회귀분석하기 위해서는 더미변수가 1개가 필요했지만, 직급은 총 5개의 값이 있으므로 더미변수는 4개가 필요합니다.

더미변수를 한 개씩 만들면 오래걸리기 때문에, 명령어를 사용하여 한 번에 더미변수 4개를 만들면 시간을 단축할 수 있습니다.


D6가 직급에 관한 문항입니다.



명령문을 실행하기 위해

메뉴에서 [파일-새파일-명령문]을 선택합니다.



더미변수를 생성하는 명령을 지시하는 명령문을 입력합니다.


명령문에 설명드리면,

If (D6="사원급") D6_Dummy1=1. 

만일 [D6]의 변수값이 "사원급"으로 되어 있는 사람은 [D6_Dummy1] 변수값에 '1'이라고 등록하세요 라는 의미입니다.


명령문을 작성할 떄 조심할 점은

1) 문자(텍스트)를 입력할 때는 엑셀과 같이 양끝에 쌍따옴표를 붙여서 입력해야 합니다.(숫자는 그냥, 문자는 양 끝에 쌍따옴표 추가)

2) 명령문은 .(마침표)로 마무리합니다.


우리가 원하는 더미변수 4개(D6_Dummy1 ~ D6_Dummy4)를 만들기 위해 아래와 같은 명령문을 입력합니다.


If (D6="사원급") D6_Dummy1=1.

If (D6="대리급") D6_Dummy1=0.

If (D6="과장급") D6_Dummy1=0.

If (D6="차장급") D6_Dummy1=0.

If (D6="부장급") D6_Dummy1=0.


If (D6="사원급") D6_Dummy2=0.

If (D6="대리급") D6_Dummy2=1.

If (D6="과장급") D6_Dummy2=0.

If (D6="차장급") D6_Dummy2=0.

If (D6="부장급") D6_Dummy2=0.


If (D6="사원급") D6_Dummy3=0.

If (D6="대리급") D6_Dummy3=0.

If (D6="과장급") D6_Dummy3=1.

If (D6="차장급") D6_Dummy3=0.

If (D6="부장급") D6_Dummy3=0.


If (D6="사원급") D6_Dummy4=0.

If (D6="대리급") D6_Dummy4=0.

If (D6="과장급") D6_Dummy4=0.

If (D6="차장급") D6_Dummy4=1.

If (D6="부장급") D6_Dummy4=0.





팝업창 상단 메뉴에서 [실행-모두]를 선택합니다.



더미변수 생성처리가 잘 완료되었음이 뷰어에 추가되었습니다.



새로 생성한 4개의 더미변수에 값이 보이지 않습니다.

수정하기 위해 [변수보기] 탭으로 이동합니다.



새로 생성된 변수들의 척도 필드가 '척도'로 되어있습니다. 척도 필드를 '순서'로 수정해줍니다.




변경을 실행할지 여부를 물으면 [확인] 버튼을 클릭합니다.



변환이 완료되었음이 [뷰어]에 추가되었습니다.



[데이터 보기] 탭을 선택하여 데이터를 확인합니다.



생성한 더미변수의 값이 '1'과 '0'으로 잘 등록되어 있음을 확인할 수 있습니다.



회귀분석을 하기 위해 메뉴에서 [분석-회귀분석-선형]을 선택합니다.



독립변수에 생성한 4개의 회귀변수를, 종속변수에 BA를 설정한 후 [확인] 버튼을 클릭합니다.




회귀분석 결과가 뷰어에 추가되었습니다.



유의확률이 .211(p>0.05)이므로 직급은 회귀선에 적합하지 않습니다.


(적합하지 않지만 연습을 위해) 만약에, 직급이 이직의도에 미치는 영향이 회귀선에 적합했다면

'사원급'은 이직의도에 2.312 + .733*(1) + .688*(0) + .623*(0) + .388*(0) = 3.045 만큼 영향을 미치고,

'대리급'은 이직의도에 2.312 + .733*(0) + .688*(1) + .623*(0) + .388*(0) = 3.000 만큼 영향을 미치고,

'과장급'은 이직의도에 2.312 + .733*(0) + .688*(0) + .623*(1) + .388*(0) = 2.935 만큼 영향을 미치고,

'차장급'은 이직의도에 2.312 + .733*(0) + .688*(0) + .623*(0) + .388*(1) = 2.700 만큼 영향을 미치고,

'부장급'은 이직의도에 2.312 + .733*(0) + .688*(0) + .623*(0) + .388*(0) = 2.312 만큼 영향을 미친다고 할 수 있습니다.

(물론 적합했다면 입니다.)







관련 글 보기


2015/12/03 - [논문통계/SPSS] - SPSS에서 엑셀데이터 불러와서 저장하기(예제파일포함)


2015/12/03 - [논문통계/SPSS] - SPSS에서 빈도분석으로 인구통계적 특성 파악하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 요인분석으로 타당도 측정하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 크론바흐 알파(Cronbach's α)로 신뢰도 측정하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 변수 계산으로 요인 평균값 만들기


2015/12/06 - [논문통계/SPSS] - SPSS에서 상관관계분석으로 변수 간 상관도 분석하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 회귀분석으로 영향을 미치는지 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 3단계 회귀분석으로 매개변수의 매개효과 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 위계적 회귀분석으로 조절변인의 조절효과 확인하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 더미변수를 이용하여 회귀분석하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 T-test로 두 집단간의 평균 비교하기


2016/01/17 - [논문통계/SPSS] - SPSS에서 One-Way-Anova(일원배치분석)으로 여러 집단간의 평균 비교하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 카이제곱 분석으로 변수들간의 독립성과 관련성 분석하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 군집분석으로 집단을 군집으로 분류한 후 특성 확인하기






+ 최근 게시물들