반응형

전체 글 121

pandas 라이브러리(13) api 데이터 불러오기

만약 데이터 특정상 선택한 문자열을 지도에서 검색해서 입력해야하는 경우 데이터가 방대하면 이를 절대 수동으로 할수가 없다. 그래서 현실의 데이터들을 모은 외부의 api데이터를 이용한다. api는 Application Programming Interface의 약자로 유저가 서버에 요청하면 그서버에서 인증을 거친후 데이터를 제공하는 일종의 서비스다. 그림을 보면 조금은 이해가 갈껏이다. 그럼 실습을 통해 api를 써보자 우선 데이터를 불러올 준비를 하자 #서울시 범죄현황 데이터 불러보기 # 한글을 파이썬 환경에 적용 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inli..

파이썬 함수 2022.11.30

pandas 라이브러리(12) pandas 시리즈를 리스트형식로 바꾸는 방법

pandas 시리즈 형식은 기본적으로 다른 데이터 구조와 다른 형식이기 때문에 맞춰 주려면 함수를 써주면된다. #판다스 시리즈를 리스트로 바꾸는 방법 #판다스 라이브러리 11번 글과 데이터가 이어진다. names >>>> 0 서울중부경찰서 1 서울종로경찰서 2 서울남대문경찰서 3 서울서대문경찰서 4 서울혜화경찰서 5 서울용산경찰서 6 서울성북경찰서 7 서울동대문경찰서 8 서울마포경찰서 9 서울영등포경찰서 10 서울성동경찰서 ..... 30 서울수서경찰서 Name: 관서명, dtype: object names.to_list() >>>> ['서울중부경찰서', '서울종로경찰서', '서울남대문경찰서', '서울서대문경찰서', '서울혜화경찰서', ....... '서울은평경찰서', '서울도봉경찰서', '서울수서경찰서..

카테고리 없음 2022.11.30

pandas 라이브러리(11) pandas 데이터 내에 문자열 슬라이싱

pandas 데이터 내에서 문자열을 슬라이싱 하는 방법을 알아보자 #데이터를 불러오기(컴마 제거) df=pd.read_csv('../data/crime_in_Seoul.csv',encoding = 'euc-kr',thousands=',') df.head(2) 이 데이터내에서 '관서명'중 끝에 '서'자를 빼고 앞에 '서울'자를 붙히고 뒤에 '경찰서'를 붙이고 싶다면 데이터 컬럼 뒤에 str함수로 문자열이 들어있는 자리를 엑세싱 할수 있다. #station_names 라는 리스트를 만드는데 #df의 관서명 컬럼,서울 붙이고,오른쪽은 경찰서로 붙여서 #['서울중부경찰서','서울종로경찰서'......] #관서명에뒤에 2번째까지만 불러온다. names="서울"+df["관서명"].str[:-2+1]+"경찰서" na..

파이썬 함수 2022.11.30

pandas 라이브러리(10) 엑셀데이터 불러오기

파이썬 환경에서 엑셀 데이터를 불러오는 방법은 사실 잘 시도하지 않는 부분이다. 왜냐하면 엑셀에서 csv로 전환하기가 가능해서이다. 그러나 엑셀데이터를 불러오는데 방법이 없는것은 아니니 한번 이런것이 있구나 보고 가자 우선 엑셀 데이터를 불러오기 위해선 라이브러리를 파이썬 서버에서 라이브러리를 설치해야 한다. 아나콘나 프롬포트를 키고 가상환경에 접속하여 라이브러리를 설치한다. 이제 설치를 하면 파이썬 환경에서 코드를 따라하면 된다. #엑셀 파일은 파일의 형식이 다르다. #엑셀 라이브러리 설치 필수 pd.read_excel('../data/population_in_Seoul.xls') 불러오게 되면 다음과 같다. 기존 데이터 프레임과 다르게 이상한 데이터 형식이 되었는데 이는 엑셀 데이터가 데이터 프레임에..

파이썬 함수 2022.11.30

파이썬 프로젝트(1) 인구조사 차트 그려보기

지금까지 배운 파이썬 함수들을 이용하여 인구조사 데이터를 차트로 그려보자 먼저 한글 데이터를 다루기 위해 다음과 같은 구문을 쓴다. # 한글 찍기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': pa..

파이썬 함수 2022.11.29

파이썬 함수Matplotlib을 이용한 차트 그리기(2) Scatter plots와 히트맵

지난번Matplotlib을 이용한 차트 그리기 두번째 시간으로써 이어서 차트 그리는법을 설명하겠다. 4. Scatterplots Scatterplots는 두차트간에 관계를 차트로 나타낸다. #데이터 준비 df = pd.read_csv('../data/fuel_econ.csv') df 데이터가 많아서 옆이 잘렸는데 어쨌든 이 데이터를 가지고 Scatterplots을 만들어보자 #두 컬럼간의 관계!!! #배기량(displ)과 연비(comb)의 관계 => 비례,반비례,관계없음 plt의 scatter 사용하는 방법 #scatter 함수에 data값,x=컬럼값,y=컬럼값 plt.scatter(data=df, x='displ',y='comb') plt.title('Displ Vs Comb') plt.xlabel('..

파이썬 함수 2022.11.28

Matplotlib을 이용한 차트 그리기(1) bar,pie차트와 히스토그램

데이터 프레임이나 데이터를 사람 눈에 한눈에 들어오게 하려면 차트를 그려서 보여주는것이 효과적이다. 오늘은 Matplotlib을 이용한 차트 그리기를 해보겠다. 1. Bar Charts 카테고리컬 데이터를 활용한 countplot 바 차트로 카테고리컬 데이터를 표현해보자 #기본적으로 import해야될 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline #데이터 프레임 불러오기(파일에 있는 데이터) df = pd.read_csv('../data/pokemon.csv') df 데이터 프레임을 보게되면 generation_id가 카테고리컬 데이터라는 것을..

파이썬 함수 2022.11.28

pandas 라이브러리(8) 데이터 합치기

각각 다른 데이터 프레임은 컬럼명이 같다면 concat과merge 함수로 합칠수 있다. 먼저 concat함수를 알아보자 concat함수의 특징은 컬럼명이 같은대로 합쳐지고, 데이터 프레임이 몇개 이든지 합칠수 있다. #합칠 데이터 프레임 준비 df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3]) df1 df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4',..

파이썬 함수 2022.11.25

pandas 라이브러리(7) 데이터 정렬 SORTING AND ORDERING

pandas 데이터를 정리할때 오름차순 또는 내림차순으로 데이터를 볼 수 있다. 변수명.sort_values('컬럼명')으로 sort_values 함수를 이용하여 정렬 할 수 있다. #데이터 프레임 작성 df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) df #경력을 오름차순으로 정렬하세요. df.sort_values('Years of Experience') #문자열이면 그 언어 순서대로 정렬한다. df.sort_values('Employ..

파이썬 함수 2022.11.25