[한국공공정책신문=최진실 기자]
◇ 회귀분석이란?
회귀분석(Regression Analysis)은 변수 간의 관계를 분석하여 미래의 트렌드나 수치를 예측하는 방법이다. 즉 회귀분석은 데이터 안에 있는 관계성을 찾기 위한 강력한 도구이다. 특히 한 변수가 다른 변수에 어떤 영향을 미치는지 이해하는 데 도움이 된다. 예컨대, 과거의 주택 가격 데이터에서 미래의 가격 동향을 예측할 수 있다. 수치를 이용하기 때문에 근거의 명확한 분석을 한다.
◇ 회귀분석의 목적
회귀분석의 주된 목적은 두 개 이상의 변수 간의 관계성을 모델링하고 예측 및 설명을 수행하는 것이다. 예컨대, 기온이 아이스크림 매출에 어떻게 영향을 미치는지 알고 싶을 때 사용한다.
◇ 회귀분석의 종류
회귀분석에는 몇 가지 종류가 있는데, 기본적인 두 가지 종류를 소개한다. ① 단회귀분석(Simple Regression)이다. 단회귀분석은 하나의 설명변수(독립변수)와 하나의 목적변수(종속변수)의 관계를 조사한다. 예컨대, ‘기온(독립변수)’이 ‘아이스크림 매출(종속변수)’에 미치는 영향을 분석하는 경우이다. ② 다중회귀분석(Multiple Regression)이다. 다중회귀분석은 여러 설명 변수가 하나의 목적변수에 어떻게 영향을 미치는지 조사한다. 예컨대, 기온, 요일, 날씨 등이 아이스크림 매출에 미치는 영향을 동시에 분석하는 경우이다.
◇ 회귀분석의 흐름
① 데이터 수집이다. 우선 분석하고 싶은 변수에 대한 데이터를 모은다. 데이터가 많을수록 더 정확한 결과를 얻을 수 있다. ② 데이터 전처리다. 수집한 데이터에는 결손치나 이상치가 포함되어 있는 경우가 있다. 이것들을 처리함으로써 분석 결과의 신뢰성을 높인다. ③ 모델 구축이다. 회귀분석 모델을 만든다. 단회귀분석의 경우 선형 방정식을 사용하고, 다중회귀분석의 경우 여러 방정식을 조합한다. ④ 모델 평가다. 작성한 모델이 얼마나 정확하게 데이터를 설명할 수 있는지 평가한다. 여기에는 R²값(결정계수)이나 회귀계수의 평가가 포함된다. ⑤ 예측과 해석이다. 모델을 사용하여 새로운 데이터를 예측한다. 또한 결과를 해석하여 실제 문제에 도움을 준다.
◇ 회귀분석의 응용사례
회귀분석은 많은 분야에서 다음과 같이 활용되고 있다. ① 비즈니스다. 매출 예측 및 마케팅 전략 수립이다. ② 의료다. 환자의 증상과 치료 효과의 관계 분석이다. ③ 경제학이다. 경제지표와 경제성장의 관계 조사이다.
여기서 키포인트는 회귀분석은 데이터의 관계성을 이해하고 미래 예측을 하기 위한 강력한 방법이라는 점이다. 그리고 기본적인 사고방식과 기법을 이해함으로써 보다 복잡한 분석에 도전하기 위한 첫걸음을 내디딜 수 있을 것으로 본다.
이규철 / 법학박사(상법)
∙ AI·GPT, SDGs&ESG 코치 및 강사
∙ 100세대학 크리에이터 및 칼럼니스트
∙ 생성AI와 챗GPT, SDGs·ESG경영전략,
글로벌 MBAtoCEO, 리더의 필승전략,
100세대학 행복디자인 매뉴얼 등 27권
∙ 일본(와세다대),중국(복단대·화동정법대)










