본문 바로가기
통계 및 데이터분석

[통계적 연구방법] 회귀분석(1) : 회귀분석, 최소제곱법

by 연구잼 2023. 6. 26.
반응형

회귀분석(1) : 회귀분석, 최소제곱법

회귀분석을 통해 마케팅 전략을 정할 수 있다. 통계를 통해 구체적인 계수, 수치로 두 요인의 관계를 분석하여 어떤 요소가 높은 성장을 가져다 주는 지 어느 부분에서 비즈니스의 방향을 잡아야하는지 도와준다.

1. 회귀분석

회귀분석은 결과가 되는 수치과 요인이 되는 수치의 관계를 조사해, 두 관계를 밝히는 통계적 기법을 말한다. 결과가 되는 수치를 결과 변수, 요인이되는 변수를 원인변수라 한다. Y값을 잘 설명하는 X를 발견하는 것이 중요하며 X를 값으로 표현할 수 없을 때 더미변수를 사용하여 나타낸다. 회귀분석은 통제할 수 있는 X를 움직여서 Y를 예측하며 회귀분석 모형은 다음과 같다. 정확도가 높은 회귀 분석을 위해서는 정확한 데이터 수집, 고급 데이터 처리, 정확한 데이터 분석 및 수학적 지식이 매우 중요하다. 회귀분석 모형에 있는 e는 오차항을 말하며 덧셈으로만 되어있는 수식을 선형수식이라고 말한다.

 

    • Y를 잘 설명하는 X를 발견하는 것이 중요하다.
    • X를 값으로 표현할 수 없을 때 더미변수 사용한다.
    • 통제할 수 있는 X를 움직여서 Y를 예측한다.
    • X:원인변수, 독립변수, 설명변수
    • Y: 결과변수, 종속변수 (ex. 구매의도, 순이익, 시험결과 등)

회귀분석 식
회귀분석 모형

 

2. 최소제곱법 (OLS: Ordinary Least Squares)

최소제곱법은 수식의 계수를 구하는 방법 즉 오차의 제곱의 합을 최소화하는 계수를 구하는 방법을 말한다. 정확하게 값을 측정할 수 없는 경우 이용되며 방적식이 어떤 형태인지 알고 있을 때 상수 값을 알아낼 때 사용되는 방법이다. 최소제곱법은 함수를 직선이라고 가정했을 때 점들에서 가장 가까운 직선 그래프의 식을 구하기 위해 이용된다.

 

    • 회귀분석 모형의 적합도를 보여주는 지표: R^2, Adj-R^2, Loglikelihood, AIC, SBIC
    • 값이 1에 가까우면 예측값이 정확할 것이라고 기대한다.
    • 계수가 통계적으로 유의한 것이 중요하다.
    • 모형을 개선하기 위해서는 오차항 확인 필요하다.
    • 오차항-백색잡음일 때가 되면 더이상 개선여지 없다고 판단한다.