딥러닝

딥러닝(3) dummy variable trap

개발연습자1 2022. 12. 27. 17:08

딥러닝에 원인핫 인코딩후 1개의 컬럼을 없애도 어떤 데이터인지 알수 있는게 dummy variable trap이라 한다.

 

우선 저번시간에 딥러닝에서 썻던 원인핫 인코딩까지 완료한 X데이터를 가져온뒤 코드를 진행한다.

 

# dummy variable trap
#
#France, Germerny, Spain 3개 컬럼으로 만들었는데,
#실제로는 원핫 인코딩을 수행한 후에, 맨 왼쪽컬럼은 삭제해도
#0 과 1로 데이터를 전부 나타낼수 있다.

#즉, France 컬럼을 삭제해도

# France  Germany  Spain   
#   1        0       0      => 프랑스
#   0        0       1      => 독일
#   0        1       0      => 스페인

# 이렇게 맨 왼쪽 france 컬럼을 삭제해도, 3개의 데이터를 모두 나타낼수 있다.

X=X[:,1:]

X_df = pd.DataFrame(X)

X_df

 

반응형