/ 위계적 회귀 분석과 단계 선택 법의 차이 [SPSS 기초 통계] 위계적 회귀 분석

본고에서는 위계적 회귀 분석이란 무엇이며, SPSS 상에서 위계적 회귀 분석을 실시하는 방법에 대해 논의한다. 또, 한층 더 위계적 회귀 분석과 스텝 선택(스텝 와이즈)을 망설이는 분들을 위해서 개념적 차이에 대해 논의한다.위계적 회귀 분석이란 무엇인가?위계적 회귀 분석은 학자로서 다르게 부르기도 하지만 단계적 회귀 분석이라고도 하고 계층적 회귀 분석이라고도 한다. 그러나 가장 많이 사용되는 단어가 위계적 회귀 분석이라고 이 글에서도 위계적 회귀 분석이라고 할 수 있다. 위계적 회귀 분석은 간단히 표현하면 변수를 추가해 회귀 분석을 2회 이상 한 것이다. 위계적 회귀 분석의 목적은, 독립 변수를 단계적으로 투입함으로써 종속 변수에의 영향 정도를 파악하는 것이다. 앞 단계에 비해 새로 투입된 변수에 의한 F값의 증가분이 유의미한지를 파악하여 모형의 적합성을 판단할 수 있다. 주로 독립 변수의 특성이 다를 때 특성별로 구분하여 위계적 회귀 분석을 하면 변화량(설명력)을 측정할 수 있다.SPSS 상에서 위계적 회귀 분석을 실시하는 방법 SPSS에서 위계적 회귀 분석을 실시할 때에 가장 중요한 것은 설명력의 변화이다. 통상 R평방 변화량으로 측정한다. 분석→회귀 분석→선형 클릭에 의해 회귀 분석을 실시하는 방식과 마찬가지로, 위계적 회귀 분석을 실시할 수 있다. 다만 차이가 있다면 블록을 구분하는 것이다. 이 글에서는 자몽 판매 가격에 대한 위계적 회귀 분석을 한다.

우선 자몽 판매가격에 간접적인 영향을 주는 변수(지역, 공정처리, 유럽산, 교배 유무)를 넣은 뒤 블록란에 있는 다음을 클릭한다. 그 후, 자몽의 판매 가격에 직접 영향을 주는 자몽의 크기와 숙성의 달을 넣는다. 그 후 통계 버튼을 클릭해 R제곱의 변화량을 반드시 클릭한다. 위계적 회귀 분석의 주된 목표는 R제곱의 변화량을 측정하는 것이다.

이후 확인 버튼을 누르면 SPS 상에서 다음과 같은 결과표가 표시된다. 해당 표를 해석하는 방법은 다음과 같다. 주로 모형의 요약과 계수를 살펴본다. 모형 요약에서 보면, 첫 번째 모형에서는 R제곱이.309이며 두 번째 모형에 세논R승이 917이다. 즉, R승이 상당히 증가한 것을 확인할 수 있다. 유의수준 F 변화량 역시 .000으로, 매우 R제곱의 변화량이 매우 유의하다고 할 수 있다. 이를 해석하면 첫 번째 변수 집단만 넣는 것보다 두 번째 집단까지 넣는 것이

위계적 회귀 분석과 단계 선택법(스텝와이즈)의 차이=첫 번째 통계를 배우면 위계적 회귀 분석과 스텝와이즈의 차이를 잘 이해하지 못할 수 있다. 둘은 변수를 조작한다는 점에서 비슷한 개념이나 위계적 회귀 분석(분석방법)이 단계 선택법(변수 투입 기준)보다 상위 개념이다. 단계 선택법은 회귀 분석 중에서 어떠한 방식으로 변수를 투입할지를 결정하는 것만으로 분석 방법이 아니고, 한편, 위계적 회귀 분석은 R제곱의 변화량을 측정할 목적으로 의도적으로 연구자의 판단에 의해서 블록을 구분한 것이다. 위계적 회귀 분석을 실시하면서 변수의 투입을 스텝 와이즈로 하는 경우를 생각하면, 두 개의 개념의 차이를 확실히 구분할 수 있게 된다.

이제 위계적 회귀 분석에 스텝 와이즈를 적용해 본다. 상기로 활용한 데이터를 엔터 방식이 아닌, 단계 선택사항 안에서 전진을 활용해 실시하면, 이하의 결과가 된다. 스텝와이즈를 하면 결과가 다르게 나타날 수 있다. 상기의 방식과 같은 데이터에 같은 블록으로 위계적 회귀 분석을 실시해, 단계 선택만 엔터에서 전진(포워드)으로 바꾸었다.

총 4가지 모델이 나온 것을 확인할 수 있으며, 많은 변수가 제외되어 있음을 확인할 수 있다. 첫 번째 블록에서 가장 의미 있는 유럽산과 범_지역 변수만 포함되어 있고, 그 후 두 번째 모형에 범_지역이라는 변수가 포함되어 있으며, 그 후의 단계 선택에 따라 나머지 변수가 포함되어 있지 않다. 그 후 두 번째 블록에서 의미 있는 두 변수가 모두 추가되었음을 확인할 수 있다.

error: Content is protected !!