pandas 라이브러리는 기존에 데이터구조 처럼 수동적으로 for문 등 반복문을 통해서
데이터를 추가하는 방식이 아닌 훨씬 간단한 방식으로 가능하다.
우선 데이터를 특정값으로 변경하는 방식부터 알아보자
import pandas as pd
# We create a list of Python dictionaries
items2 = [{'bikes': 20, 'pants': 30, 'watches': 35},
{'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}]
df = pd.DataFrame(data=items2, index = ['store1','store2'])
# 데이터의 값을 변경!
#스토어2의 watches 데이터를 20으로 변경해주세요.
df #이미지 참조후 밑에 코드 실행
df.iloc[0,2] = 20
df.loc['store2','watches'] =20
df
첫번째 데이터 프레임 그림에서 두번째 데이터 프레임으로 값이 바뀌게 된다.
데이터를 추가하는 방법
#위에 데이터 프레임을 따른다.
df
#shirts 라는 컬럼을 만들고, store 1에는 15개, store 2에는 2개가 생겼습니다.
#새로운 컬럼 만드는 방법
df['shirts'] = [15,2]
df
위에 데이터 프레임에서 shirts 컬럼이 추가 되어 있는것을 알수 있다.
그 뒤에도 계속 추가가 가능하고 데이터값을 연산하여 그값을 새로운
컬럼으로 만들수도 있다.
#위에 데이터 프레임에서
df['suits'] = df['pants']+df['shirts']
df
데이터프레임을 불러오기 위해서는 pd.read_csv 함수로 불러오는데 두가지 방법이 있다.
주피터 노트북내에 파일에서 불러올때는 pd.read_csv('파일명.csv')로
써줘서 불러온다.
df2 = pd.read_csv('test.csv')
df2
이때 .to_csv함수로 파일내에 다른 이름으로 다시 저장할수도 있다.
df2.to_csv('test2.csv')
두번째로 파일 바깥에서 불러올때는 pd.read_csv('..(경로명)/데이터가 있는 폴더명/파일명.csv')으로 불러온다.
#언네임드 컬럼은 인덱스에 있어야 할 컬럼이다.
reviews=pd.read_csv('../data/winemag-data_first150k.csv',index_col=0)
reviews
반응형
'파이썬 함수' 카테고리의 다른 글
pandas 라이브러리(4) 카테고리컬 데이터( Categorical Data) (0) | 2022.11.24 |
---|---|
pandas 라이브러리(3) NaN값 다루기 (0) | 2022.11.24 |
pandas 라이브러리(1) pandas라이브러리 활용 (0) | 2022.11.24 |
numpy 라이브러리(5) 2차원 배열 연산 (0) | 2022.11.23 |
numpy 라이브러리(4) 데이터 인덱싱과 boolean 연산 (0) | 2022.11.23 |