지난번Matplotlib을 이용한 차트 그리기 두번째 시간으로써 이어서 차트 그리는법을 설명하겠다.
4. Scatterplots
Scatterplots는 두차트간에 관계를 차트로 나타낸다.
#데이터 준비
df = pd.read_csv('../data/fuel_econ.csv')
df
데이터가 많아서 옆이 잘렸는데 어쨌든 이 데이터를 가지고 Scatterplots을 만들어보자
#두 컬럼간의 관계!!!
#배기량(displ)과 연비(comb)의 관계 => 비례,반비례,관계없음
plt의 scatter 사용하는 방법
#scatter 함수에 data값,x=컬럼값,y=컬럼값
plt.scatter(data=df, x='displ',y='comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff(mpg)')
plt.show()
또한 정확히 알기 위해 상관 분석도 해주면 좋다. 상관분석이란 -1에서 1까지의 상관계수를 갖고 계수가 -1에 가까우면 반비례 관계 계수가 0이면 관계 없음 1이면 비례 관계를 나타낸다.
df[ ['displ','comb'] ].corr()
위에 값을 보아 -1에 가깝고 반비례 관계인것을 알 수 있다.
regplot함수를 이용해서 Scatterplots을 나타낼수 있는데 약간 다른점이 있다. 알아보자
seaborn의 repiot 이용하는 방법
#regration 데이터의 피팅한다.
#reg의 뜻? regression: 데이터에 fitting 한다는 의미
sb.regplot(data=df, x='displ',y='comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff(mpg)')
plt.show()
위에 Scatterplots을 보면 선이 보이는데 이 선으로 더욱 더 두 컬럼간의 관계를 알 수 있다.
pairplot 함수를 이용해서도 Scatterplots을 나타낼수 있는데 다중으로 Scatterplots이 나타낸다.
sb.pairplot(data=df,vars=['displ','comb','co2'])
5. heatmap
히트맵도 Scatterplots과 마찬가지로 데이터의 분포를 나타내지만 분포 마다 색깔로 나타내는게 특징이다.
#엔진 크기와 이산화탄소 배출량의 관계를 분석하세요.
#displ 이 엔진사이즈이고, co2 가 이산화탄소 배출량입니다.
plt.hist2d(data=df, x='displ', y='co2', cmin = 0.5, cmap='viridis_r' )
plt.colorbar()
plt.show()
색깔별로 다르게 나타나는것을 알수 있다.
반응형
'파이썬 함수' 카테고리의 다른 글
pandas라이브러리(9) 데이터 프레임에서 찾는값이 아닌걸 엑세스 할 경우 (0) | 2022.11.29 |
---|---|
파이썬 프로젝트(1) 인구조사 차트 그려보기 (0) | 2022.11.29 |
Matplotlib을 이용한 차트 그리기(1) bar,pie차트와 히스토그램 (0) | 2022.11.28 |
pandas 라이브러리(8) 데이터 합치기 (0) | 2022.11.25 |
pandas 라이브러리(7) 데이터 정렬 SORTING AND ORDERING (0) | 2022.11.25 |