파이썬 함수

pandas 라이브러리(2) 데이터프레임 컬럼 추가하기, 데이터프레임 불러오기

개발연습자1 2022. 11. 24. 09:32

pandas 라이브러리는 기존에 데이터구조 처럼 수동적으로 for문 등 반복문을 통해서

데이터를 추가하는 방식이 아닌 훨씬 간단한 방식으로 가능하다. 

 

우선 데이터를 특정값으로 변경하는 방식부터 알아보자

import pandas as pd
# We create a list of Python dictionaries
items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, 
          {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}]
df = pd.DataFrame(data=items2, index = ['store1','store2'])

# 데이터의 값을 변경!
#스토어2의 watches 데이터를 20으로 변경해주세요.
df #이미지 참조후 밑에 코드 실행

df.iloc[0,2] = 20
df.loc['store2','watches'] =20
df

첫번째 데이터 프레임 그림에서 두번째 데이터 프레임으로 값이 바뀌게 된다.

 

데이터를 추가하는 방법

#위에 데이터 프레임을 따른다.
df

#shirts 라는 컬럼을 만들고, store 1에는 15개, store 2에는 2개가 생겼습니다.
#새로운 컬럼 만드는 방법
df['shirts'] = [15,2]
df

위에 데이터 프레임에서 shirts 컬럼이 추가 되어 있는것을 알수 있다.

그 뒤에도 계속 추가가 가능하고 데이터값을 연산하여 그값을 새로운

컬럼으로 만들수도 있다.

 

#위에 데이터 프레임에서
df['suits'] = df['pants']+df['shirts']
df

 

 

 

데이터프레임을 불러오기 위해서는 pd.read_csv 함수로 불러오는데 두가지 방법이 있다.

 

 

주피터 노트북내에 파일에서 불러올때는 pd.read_csv('파일명.csv')로 

써줘서 불러온다.

df2 = pd.read_csv('test.csv')
df2

 

이때 .to_csv함수로 파일내에 다른 이름으로 다시 저장할수도 있다.

df2.to_csv('test2.csv')

 

두번째로 파일 바깥에서 불러올때는 pd.read_csv('..(경로명)/데이터가 있는 폴더명/파일명.csv')으로 불러온다.

#언네임드 컬럼은 인덱스에 있어야 할 컬럼이다.

reviews=pd.read_csv('../data/winemag-data_first150k.csv',index_col=0)
reviews

 

반응형