상관관계(correlation)는 관련성을 확인하는 것입니다.

예를 들어, 중학교 3학년 학생들의 수학점수와 과학점수는 상관이 있습니다. 수학점수가 높으면 과학점수도 높을 것입니다.

하루 중 낮과 밤의 시간도 상관이 있습니다. 낮의 길이가 길어지면 밤의 길이는 줄어들기 때문입니다.


[수학점수-과학점수]의 상관관계를 양의 상관관계라고 합니다.

[낮길이-밤길이]의 상관관계를 음의 상관관계라고 합니다.

(상관관계는 방향성이 없습니다, 수학과 과학의 상관관계나, 과학과 수학의 상관관계나 같습니다.)


그리고 그 관계성이 아주 높으면 강한 상관관계, 낮으면 약한 상관관계라고 합니다.

수학점수와 과학점의 관계성이 아주 높았다면, 그 상관관계는 강한 양의 상관관계라고 말할 수 있습니다.


예제로 사용할 SPSS 파일를 다운로드 해주세요.


rawdata2(sample).sav


출력결과2.spv




※ 이미지들은 클릭하면 원본이미지로 크게 보실 수 있습니다.


위에 첨부된 파일을 열어, 데이터편집기 화면의 오른쪽에 보면 변수계산이 완료되어 있는 데이터들을 확인할수 있습니다.


<참고>

A: 팀분위기

AA)위계

AB)혁신

AC)과업

AD)관계

B: 이직의도

BA)이직의도

C: 여가만족

CA) 가족활동 만족

CB) 취미활동 만족

CC) 자기계발 만족



메뉴에서 [분석-상관관계-이변량상관계수]를 선택합니다.



변수계산을 마친 AA부터 CC까지 8개의 변수를 대상으로 선택합니다.




팝업 우측의 [옵션]에서 평균과 표준편차를 체크합니다.



[확인]을 클릭하여 상관관계분석을 실행합니다.

(상관계수는 기본값인 Pearson으로 선택되어있어야 합니다, 등간척도나 비율척도가 아닌 서열척도인 경우에만 Spearman을 선택합니다.)



뷰어에 상관관계 분석결과가 추가되었습니다.



변수들에 대한 200명 응답자의 평균과 표준편차를 확인할 수 있습니다.

CA(가족활동 만족)에 대한 응답값의 평균이 3.56으로 가장 높았고,

BA(이직의도)에 대한 표준편차가 1.17139로 가장 높아, 이직의도에 대한 응답자들 간의 편차가 크다는 것을 알 수 있습니다.


(엑셀에서 기술통계량 분석을 하는 방법을 알고 싶다면 아래를 클릭)

2015/12/10 - [논문통계/엑셀] - 엑셀(Excel)에서 요인들의 평균, 표준편차 구하기




상관관계계수(Pearson)을 확인하여, 두 변인간의 상관도를 확인할 수 있습니다.

±0.9이상                : 매우 높은 상관관계 → 다중공선성 문제

±0.7이상 ~ ±0.9미만  : 높은 상관관계

±0.4이상 ~ ±0.7미만  : 다소 높은 상관관계 → 0.7미만이면 다중공선성 문제에서 안전합니다.

±0.2이상 ~ ±0.4미만  : 낮은 상관관계

±0.2미만               : 상관관계가 거의 없음

(상관관계계수의 최댓값은 1이고 최솟값은 -1입니다. 상관관계계수가 1이라는 것은 그 둘이 같다는 것입니다.)


대부분의 상관계수(Correlation coefficient)가 0.4미만으로 낮은 상관관계가 대부분임을 알 수 있습니다.

그나마 높은 것은 CB(취미활동만족)-CC(자기계발 만족)의 상관관계계수가 .499로 다소 높은 상관관계입니다. 


상관관계가 높으면 좋고, 낮으면 안 좋은 것은 아닙니다.

오히려 상관관계가 높아 다중공선성(Multicollinearity) 문제가 발생하면, 연구주제를 수정해야 합니다.


(다중공선성 문제를 확인하려면 아래를 클릭)

2015/12/11 - [논문통계/통계기초] - 다중공선성(Multicollinearity)이란?


(엑셀에서 상관관계 분석을 하는 방법을 확인하려면 아래를 클릭)

2015/12/10 - [논문통계/엑셀] - 엑셀(Excel)에서 상관관계분석으로 변수 간 상관도 분석하기






상관관계분석 결과를 논문작성중인 한글파일에 작성하기 위해, 먼저 기술통계량 표를 작성합니다.

(개인차이가 있지만, 보통 기술통계량과 상관관계분석은 같이 작성합니다.)






상관행렬 표를 작성합니다.

(A와 B의 상관계수와, B와 A의 상관계수는 같기 때문에, 표의 절반만 작성합니다.)





분석이 완료되면 뷰어파일(출력결과)를 저장합니다.

아래 첨부파일과 같은 SPSS 파일이 저장되어 있으면 성공입니다.


출력결과2.spv






인구통계학적 정보를 포함하여 상관관계 분석을 하려면,

인구통계학적 정보는 명목척도(남,여) 또는 서열척도(직급)를 포함하고 있기 때문에,

Pearson(적률)이 아닌 다른 상관관계 분석을 실시해야합니다.

등간(또는 비율)척도 - 등간(또는 비율)척도: Pearson 상관분석

서열척도-서열척도: Spaerman 상관분석

등간척도 또는 비율척도 - 서열척도: 다류 상관관계분석



상관관계분석(Correlation Analysis)이란

변수간에 어떠한 선형적 관계를 갖고 있는지 분석하는 방법입니다.






관련 글 보기


2015/12/03 - [논문통계/SPSS] - SPSS에서 엑셀데이터 불러와서 저장하기(예제파일포함)


2015/12/03 - [논문통계/SPSS] - SPSS에서 빈도분석으로 인구통계적 특성 파악하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 요인분석으로 타당도 측정하기


2015/12/05 - [논문통계/SPSS] - SPSS에서 크론바흐 알파(Cronbach's α)로 신뢰도 측정하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 변수 계산으로 요인 평균값 만들기


2015/12/06 - [논문통계/SPSS] - SPSS에서 상관관계분석으로 변수 간 상관도 분석하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 회귀분석으로 영향을 미치는지 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 3단계 회귀분석으로 매개변수의 매개효과 확인하기


2015/12/06 - [논문통계/SPSS] - SPSS에서 위계적 회귀분석으로 조절변인의 조절효과 확인하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 더미변수를 이용하여 회귀분석하기


2016/01/11 - [논문통계/SPSS] - SPSS에서 T-test로 두 집단간의 평균 비교하기


2016/01/17 - [논문통계/SPSS] - SPSS에서 One-Way-Anova(일원배치분석)으로 여러 집단간의 평균 비교하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 카이제곱 분석으로 변수들간의 독립성과 관련성 분석하기


2016/02/10 - [논문통계/SPSS] - SPSS에서 군집분석으로 집단을 군집으로 분류한 후 특성 확인하기

  1. 2016.04.21 19:01

    비밀댓글입니다

  2. YJ 2016.04.21 19:02

    논문쓰면서 여기서 정말 많은 도움을 받고 있습니다 .ㅠㅠ
    제가 지금 성별을 조절효과로 쓰는데, 아쉽게도 예시가 없어서 곤란을 겪고있네요ㅠㅠ
    독립변수, 종속변수, 조절변수까지 함께 상관관계분석을 해야하는데, 조절변수인 성별이 더미변수여서 저 위에서 말씀하신 다류상관관계분석이라는 걸 써야할 것 같은데, 다류 상관관계분석은 어떻게 하는건가요? ㅠㅠ SPSS에서도 찾아보고 인터넷어서도 찾아봤는데, 안 나오네요ㅠㅠ 어떻게 하는지 모르겠어요 ㅠㅠ 책에도 안보여요ㅠㅠ 제가잘몰라서ㅠㅠㅠ
    그대로 다 넣고 일반 피어슨 상관관계분석을해봤는데, 독립변수끼리의 상관관계만나오네요ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2016.04.22 10:09 신고

      도움이 되셨다면 다행이네요.

      어떤 연구인지 제가 현재 이해가 없어서,
      댓글 또는 메일로 연구주제가 무엇인지 설명 부탁드립니다.

      고맙습니다.

  3. 2016.10.12 01:19

    비밀댓글입니다

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2016.10.12 08:39 신고

      궁금하실수 있겠네요. 우선 블로그내용들은 순서가 있습니다. 지금 보신 포스팅은 앞단에서 데이터코딩-타당도검사-신뢰도검사-변수그룹핑 단계들을 거쳐 도착한 상관관계 차례입니다.^^

      따라서 질문해주신 앞서 진행된 과정들은 데이터정제, 타당도 신뢰도 검사, 변수정리 등이 되겠네요.

      포스팅 순서대로 보신다면 더 도움되실거예요.

  4. 2017.11.23 10:08

    비밀댓글입니다

  5. ASM 2018.06.06 20:20

    도움 많이 받고있습니다 !! 잘 정리되있어서 읽이 편하고 좋아요 ㅠㅠ
    저 궁금한게 있는데 변수 계산은 어떤 과정으로 실행한 건가요? 각 문항들의 평균인가요??
    궁금합니다!!

    • Favicon of https://learnx.tistory.com BlogIcon Learn X BboL 2018.06.08 15:02 신고

      타당도와 신뢰도에 문제가 없었던 문항들의 평균으로, 말씀해주신 내용이 맞습니다.

  6. 2018.08.09 16:35

    감사합니다. 상관관계 잘 몰랐었는데 글에 너무 자세하게 적어주셔서 잘 배우고 갑니다. 또한번 감사합니다.

  7. 2019.06.08 22:06

    비밀댓글입니다

+ 최근 게시물들