카테고리 없음
pandas 라이브러리(14) 피벗 테이블
개발연습자1
2022. 11. 30. 17:40
피벗 테이블은 두 데이터를 합칠때 카테고리컬 데이터처럼 데이터가 중복있다면 데이터의 기준을 세울수 없어 합쳐지지 않을때까 있다. 이러한 상황을 막기 위해 카테고리컬 데이터는 피벗팅으로 중복을 없애고 데이터를 정렬 시킨다.
#데이터 부르기(엑셀)
#아나콘다 프롬프트에 pip install openpyxl쓰기
df =pd.read_excel('../data/sales-funnel.xlsx')
df
데이터를 보면 사람이름과 id명 같은 여러 컬럼이 중복되어 있는것을 확인할 수 있다. 이를 피벗테이블로 정렬한다.
# index 파라미터에는, 유니크하게 만들고 싶은 컬럼의 이름을 적는다.
#피벗 테이블 함수 .pivot
#정렬 컬럼은 'Name'
pd.pivot_table( df, index=['Name'] )
이런식으로 중복을 없애고 정렬하여 피벗테이블을 완성한다.
좀더 세분화하여 컬럼을 기준으로 나눌수 있고 합계,평균으로도 값을 나타낼수 있다.(기본 디폴트 값은 평균)
# Manager 와 Rep 를 유니크하게 만들고, 수치의 평균을 구하라.
pd.pivot_table( df, index=['Manager', 'Rep'], aggfunc=np.sum)
필요없는 컬럼은 뺄수 있고 합계 평균을 동시에 나타내게 할수도 있다.
# Name 컬럼은 유니크하게 만들되, 수치 데이터들은 더한값, 평균값 두개로 표시
# 필요없는, Account 컬럼은 제외시키고 만든다.
pd.pivot_table( df, index=['Name'], aggfunc= [np.sum, np.mean] ,
values=['Price','Quantity'] )
반응형