단순 선형 회귀 모델을 만들기 위해서는 우선 4가지 기본 가정을 만족해야 한다.

1. 선형성

2. 독립성

3. 등분산성

4. 정규성

이 4가지 기본가정을 만족하지 못하면 올바른 선형 회귀모델이 될 수 없다.

선형성이란 회귀분석에서 가장 중요한 가정으로 당연하게도 비 선형 회귀분석에는 사용 할 수 없다.

예측하고자 하는 종속변수 y와 그에 따른 feature 독립변수 x 간의 선형성을 만족하는 특성을 의미한다.

feature의 변수 중 일부가 선형성을 만족하지 않는다면 여러가지 방법이 있는데,

1. 다른 변수를 추가

2. 로그, 지수, 루트 등 변수 변환을 취해 본다.

3. 아예 선형성을 만족하지 않는 변수를 제거한다.

4. 일단 선형 회귀모델을 만들고 변수 선택법을 통과 시킨다.

등이 있다. 이 방법 중 4번째 방법은 변수의 개수가 많아지면 개별 변수를 파악하기 어려워지기 때문에 자주 쓰는 방법중 하나이다.