선형 회귀

기준모델(Baseline Model)

예측 모델을 구체적으로 만들기 전에 가장 간단하면서도 직관적이면서 최소한의 성능을 나타내는 기준이 되는 모델

Mean Absolute Error(MAE, 평균절대오차)

예측 error 의 절대값 평균

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/127dddc1-fd4c-40dc-91cd-b3ea58ec582b/Untitled.png

예측모델(Predictive Model) 활용

scatterplot에 가장 잘 맞는(best fit) 직선을 그려주면 그것이 회귀 예측모델이 된다.

회귀직선은 어떻게 만들 수 있을까?

회귀분석에서 중요한 개념은 예측값과 잔차(residual) 이다.예측값은 만들어진 모델이 추정하는 값이고, 잔차는 예측값과 관측값 차이다.(오차(error)는 모집단에서의 예측값과 관측값 차이)

회귀선은 잔차 제곱들의 합인 RSS(residual sum of squares)를 최소화 하는 직선이다.

RSS는 SSE(Sum of Square Error)라고도 말하며, 이 값이 회귀모델의 비용함수(Cost function)가 된다.