T-test가 성별(남,여), 고용형태(정규직,비정규직)와 같은 두 집단의 평균차이를 검증했다면,

둘 이상의 집단을 비교할 때는 ANOVA 분석을 실시합니다.


ANOVA 분석을 실시할 때,

독립변수는 명목척도로, 종속변수는 등간척도 또는 비율척도로 구성되어 있어야 합니다.


예제로 사용할 SPSS 파일이 준비되어 있지 않으신 분은 아래의 파일를 다운로드 해주세요.


rawdata5(sample).sav




※ 이미지들은 클릭하면 원본이미지로 크게 보실 수 있습니다.


직급별 집단의 여가만족(가족생활(AA)/취미활동(AB)/자기계발(AC))의 평균차이 검증해보겠습니다.

위에 첨부된 파일을 열어 데이터편집기를 보면, D6에는 직급이 AA~AC까지는 여가만족 하위요인들의 값이 있습니다.



우선 직급(D6)이 텍스트로 입력되어 있기 때문에, D6 입력값을 수치로 변환한 새로운 DD6를 만들겠습니다.

메뉴에서 [파일-새파일-명령문]을 선택합니다.



아래와 같은 명령문을 입력하여 실행합니다.

If (D6="사원급") DD6=1.

If (D6="대리급") DD6=2.

If (D6="과장급") DD6=3.

If (D6="차장급") DD6=4.

If (D6="부장급") DD6=5.


(명령문에 대한 사용방법은 아래의 게시물에 설명되어 있는 관계로 생략합니다.)

2016/01/11 - [논문통계/SPSS] - SPSS에서 더미변수를 이용하여 회귀분석하기




D6를 변환한 새로운 변수 DD6가 생성되었습니다.

DD6를 독립변수인 직급으로 사용하여 One-Way-ANOVA 분석을 실시합니다.

메뉴에서 [분석- 평균비교-일원배치 분산분석]을 선택합니다.




팝업창에서

독립변수에는 DD6를, 종속변수에는 AA(가족생활), AB(취미활동), AC(자기계발)을 설정합니다.



[사후분석] 옵션을 선택합니다.



사후분석 옵션에서

[등분산을 가정함]에서는 Scheffe(C)를

[등분산을 가정하지 않음]에서는 DUnnett의 T3를 선택합니다.

[계속] 버튼을 클릭합니다.



[옵션] 옵션을 선택합니다.

[통계량]에서 '기술통계'와 '분산 동질성 검정'을 선택합니다.

[계속] 버튼을 클릭합니다.



[확인] 버튼을 클릭하여, 분석을 실행합니다.



뷰어에 일원배치 분석결과가 추가되었습니다.



독립변수는 사원급(1), 대리급(2), 과장급(3), 차장급(4), 부장급(5) 5집단으로 구성되어 있습니다.

종속변수는 가족생활(AA), 취미활동(AB), 자기계발(AC) 3가지로 구성되어 있습니다.



Levene의 등분산 검정의 유의확률을 보면 모두 0.05보다 작습니다.

따라서 AA, AB, AC 모두 '등분산이 가정되지 않음'을 기준으로 합니다.


(등분산 가정에 대한 자세한 설명은 아래의 게시물에 있습니다.)

2016/01/11 - [논문통계/SPSS] - SPSS에서 T-test로 두 집단간의 평균 비교하기



분산분석을 보면, AA, AB, AC의 유의확률이 각각 0.000, 0.000, 0.820 이므로

가족생활(AA), 취미활동(AB)은 직급에 따른 평균차이가 있고, 자기계발(AC)은 직급에 따른 평균차이가 없다고 볼 수 있습니다




앞서 우리는 '등분산이 가정되어 있지 않음'을 기준으로 하므로, 'Dunnett T3'를 보면 됩니다.

(등분산이 가정된다면, Scheffe를 확인합니다.)


가족생활(AA)의 집단간의 평균 차이는

사원(1)-대리(2)

사원(1)-부장(5)

대리(2)-과장(3)

대리(2)-부장(5)

과장(3)-차장(4)

과장(3)-부장(5)

에서 평균의 차이가 있는 것으로 나타났습니다.

특히, 과장과 부장의 차이가 1.17668로 평균차이가 가장 크게 나타났습니다.


취미활동(AB)의 집단간의 평균 차이는

사원(1)-대리(2)

사원(1)-부장(5)

대리(2)-과장(3)

과장(3)-부장(5)

차장(4)-부장(5)

에서 평균의 차이가 있는 것으로 나타났습니다.

특히, 사원과 부장의 차이가 1.27500로 평균차이가 가장 크게 나타났습니다.



참고로 분산분석표를 통해 집단간의 차이가 있을 것으로 예상했는데, '사후검정'에서는 그 차이를 확인하지 못하는 경우가 종종 있습니다.

이런 경우는 분석방법을 달리해서 다시 일원배치분석을 실행합니다.

1) 등분산을 가정한 경우에 평균차이 결과를 확인하지 못했다면 Tukey방법으로 다시 해봅니다.

2) 등분산을 가정하지 않은 경우에 평균차이 결과를 확인하지 못했다면 Games-Howell방법으로 다시 해봅니다.




논문에 결과를 작성할 때는 아래와 같이 작성합니다.




출력결과(뷰어파일)가 아래와 같이 저장되어 있으면 성공입니다.


출력결과(ANOVA).spv








관련 글 보기


2015/12/03 - [논문통계/SPSS] - SPSS에서 엑셀데이터 불러와서 저장하기(예제파일포함)


2015/12/03 - [논문통계/SPSS] - SPSS에서 빈도분석으로 인구통계적 특성 파악하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 요인분석으로 타당도 측정하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 크론바흐 알파(Cronbach's α)로 신뢰도 측정하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 변수 계산으로 요인 평균값 만들기


2015/12/06 - [논문통계/SPSS] - SPSS에서 상관관계분석으로 변수 간 상관도 분석하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 회귀분석으로 영향을 미치는지 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 3단계 회귀분석으로 매개변수의 매개효과 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 위계적 회귀분석으로 조절변인의 조절효과 확인하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 더미변수를 이용하여 회귀분석하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 T-test로 두 집단간의 평균 비교하기


2016/01/17 - [논문통계/SPSS] - SPSS에서 One-Way-Anova(일원배치분석)으로 여러 집단간의 평균 비교하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 카이제곱 분석으로 변수들간의 독립성과 관련성 분석하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 군집분석으로 집단을 군집으로 분류한 후 특성 확인하기


  1. 2016.01.27 09:40

    비밀댓글입니다

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2016.01.27 10:40 신고

      안녕하세요.^^ 어제 메일도 주셨네요.
      (질문해주신 내용이 자연과학쪽이라, 제가 잘 모를수도 있어요.ㅎㅎ)

      궁금한게 있습니다. 시간대별 요인들이 어떻게 변하는지를 확인하고 싶은건지, 아니면 시간대마다 요인들의 상관관계가 있는지 확인하고 싶으신건가요?;;;

      전자라면 설명해주신 분석방법쪽으로 가는게 맞을 것 같지만, 작성해주신 연구주제대로 상관성을 보고 싶으신 것이라면 그냥 일반적인 상관분석을 진행하면 될 것 같습니다.(저도 정확한 상황을 몰라 말씀드리기 어려우나, 후자쪽이 맞을 것 같다는 데 한 표입니다.ㅎ)

      전자 기준으로, 2시간 간격으로 측정한 시간별 12개나 되는 데이터의 66*15=990개 관계들 중 몇 개가 차이가 있는지 확인하는 것 보다는;;;
      더 단순하게 기본적인 상관분석으로 수온, 염분, 영양염들의 상관관계를12번(시간대별)하는 게 낫지 않을까요?(결과 예를 들면, 수온과 염분의 상관관계는 08시부터 18시까지 존재함을 확인할 수 있었다. 이런식으로요...)

      추가로 궁금하신 점 있으면 말씀해주세요... 그리고 교수님의 조언은 진리죠..ㅋㅋ

      p.s. 보내주신 SPSS 첨부파일의 로우데이터는 요인15개를 테이블필드 기준으로 정리되어야 할 것 같습니다.(12*15 테이블이 되겠지요)

  2. 유지수 2016.10.03 21:13

    감사합니당 덕분에 이해가 쏙쏙 가네용^-^

  3. 져니엉 2016.10.18 19:21

    저 a,b,c,d,e 부등호 표시하는거 자세히 알려주실 수 있나요?ㅠㅠㅠㅠㅠㅠㅠㅠㅠ

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2016.10.19 10:04 신고

      유의확률이 유의한 경우 내에서

      5개의 abcde의 차이중 유의한 경우만 뽑아서

      표시해주시면 됩니다.^^

    • 져니엉 2016.10.20 19:45

      가족생활과 직급에 대해서 봤을경우
      a>e, b>e c>a,b,d,e
      이렇게 되어있는데

      표를 봤을때
      a<c , a>e, b>c, b>e, c>d, c>e
      이렇게 보는게 아닌가요~?
      부등호 표시를 어떻게 해야하는지 잘 모르겠네요ㅠㅠ

  4. 2016.11.23 11:28

    비밀댓글입니다

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2016.11.23 13:48 신고

      등분산 안되면 원래는 비모수검정을 해야하는데..... 대부분; 비모수검정 없이 그냥 ANOVA 합니다.

  5. DD 2017.11.09 00:52

    선생님 사는 동안 많이 버세요.. 많은 도움받고 갑니다ㅠㅠㅠㅠ

  6. 2018.01.30 15:18

    비밀댓글입니다

  7. 도라지 2018.05.12 21:54

    안녕하세요, 지금 논문 쓰고 있는 대학원생입니다.
    친절하고 자세히 설명해주셔서 이해가 잘됩니다. 통계를 생전 처음해서 너무 난감했는데 정말 감사합니다!!
    근데 이해 안되는 부분이 있어서 질문 좀 드려도 될까요??
    'F값/유의확률'에 보면 가족생활의 경우 유의확률이 0.00이고 표밑에 **P<0.01 이라고 하셨는데 이 부분은 spss 결과표 어디에서 확인하면 되는건가요ㅠㅠ?
    실제 결과표 중 F값이 나온 표에는 유의확률이 0.000 이라고 되어있어서요! 이거말고 다른걸 보는건가요??

  8. 2018.05.26 18:57

    비밀댓글입니다

  9. js 2018.05.29 12:39

    오랜만에 anova 분석을 사용하게 되서 개념잡으려고 들어왔는데 많은 도움 받고 갑니다. 감사합니다.

  10. 혀니 2019.04.13 18:51

    안녕하세요, 선생님 덕분에 공부가 막힘없이 진행중입니다. 궁금한게 생겼는데요, 나이나 경력 등 연속변수의경우 상관분석도 가능한걸로 알고있는데 그 연속변수를 범주화시켜서 ANOVA로 돌린것 둘 중 어느것이 더 의미있을까요?? 연구주제에 따라 선택하면 되는건지 아니면 둘다 언급을 해야하는지요?

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2019.04.15 13:14 신고

      어느 것이 더 의미있느냐라고 물어봐주셨는데... 상관관계랑 ANOVA는 확인하고자 하는 내용이 다르다고 보시면 편하실 것 같아요.

    • 혀니 2019.04.16 01:11

      아... 우문현답이십니다. 겉핥기식으로 배우다보니ㅜㅜ 빠른 답변도 감사합니다!!

  11. 2019.05.19 22:45

    비밀댓글입니다

+ 최근 게시물들