카테고리형 Feature들을 0과 1 로 분리 해준다.
Feature들의 수를 늘려 트레이닝의 복잡도를 올려준다.
!pip install category_encoders
인스톨 후 런타임 재시작 하고 실행 하면 된다.
from category_encoders import OneHotEncoder
encoder = OneHotEncoder(use_cat_names=True)
# use_cat_names feature내의 변수 이름을 적을 것인지.
X_train_encoded = encoder.fit_transform(X_train)
X_validation_encoded = encoder.fit_transform(X_validation)
X_test_encoded = encoder.fit_transform(X_test)
X_train_encoded
import numpy as np
import pandas as pd
season = pd.DataFrame({'season':['spring', 'summer', 'fall', 'winter', np.nan]})
# 결측값 처리도 가능
pd.get_dummies(season['season'], dummy_na=True)