딥러닝에 원인핫 인코딩후 1개의 컬럼을 없애도 어떤 데이터인지 알수 있는게 dummy variable trap이라 한다.
우선 저번시간에 딥러닝에서 썻던 원인핫 인코딩까지 완료한 X데이터를 가져온뒤 코드를 진행한다.
# dummy variable trap
#
#France, Germerny, Spain 3개 컬럼으로 만들었는데,
#실제로는 원핫 인코딩을 수행한 후에, 맨 왼쪽컬럼은 삭제해도
#0 과 1로 데이터를 전부 나타낼수 있다.
#즉, France 컬럼을 삭제해도
# France Germany Spain
# 1 0 0 => 프랑스
# 0 0 1 => 독일
# 0 1 0 => 스페인
# 이렇게 맨 왼쪽 france 컬럼을 삭제해도, 3개의 데이터를 모두 나타낼수 있다.
X=X[:,1:]
X_df = pd.DataFrame(X)
X_df
반응형
'딥러닝' 카테고리의 다른 글
딥러닝(6) validation split (0) | 2022.12.29 |
---|---|
딥러닝(5) 텐서플로우로 리그레션 문제 모델링 하는 방법 (0) | 2022.12.28 |
딥러닝(4) GridSearch 를 이용한, 최적의 하이퍼 파라미터 찾기 (0) | 2022.12.27 |
딥러닝(2) 텐서플로우에서 학습시 epoch와 batch_size에 대한 설명 (0) | 2022.12.27 |
딥러닝(1) 딥러닝 환경 준비 (0) | 2022.12.27 |