파이썬 함수

파이썬 함수Matplotlib을 이용한 차트 그리기(2) Scatter plots와 히트맵

개발연습자1 2022. 11. 28. 17:55

지난번Matplotlib을 이용한 차트 그리기 두번째 시간으로써 이어서 차트 그리는법을 설명하겠다.

 

4. Scatterplots

Scatterplots는 두차트간에 관계를 차트로 나타낸다.

#데이터 준비

df = pd.read_csv('../data/fuel_econ.csv')
df

데이터가 많아서 옆이 잘렸는데 어쨌든 이 데이터를 가지고 Scatterplots을 만들어보자

 

#두 컬럼간의 관계!!!

#배기량(displ)과 연비(comb)의 관계 => 비례,반비례,관계없음

plt의 scatter 사용하는 방법

#scatter 함수에 data값,x=컬럼값,y=컬럼값

plt.scatter(data=df, x='displ',y='comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff(mpg)')
plt.show()

또한 정확히 알기 위해 상관 분석도 해주면 좋다. 상관분석이란 -1에서 1까지의 상관계수를 갖고 계수가 -1에 가까우면 반비례 관계 계수가 0이면 관계 없음 1이면 비례 관계를 나타낸다.

df[ ['displ','comb']  ].corr()

위에 값을 보아 -1에 가깝고 반비례 관계인것을 알 수 있다.

 

 

regplot함수를 이용해서 Scatterplots을 나타낼수 있는데 약간 다른점이 있다. 알아보자

 

seaborn의 repiot 이용하는 방법
#regration 데이터의 피팅한다.
#reg의 뜻? regression: 데이터에 fitting 한다는 의미

sb.regplot(data=df, x='displ',y='comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff(mpg)')
plt.show()

위에 Scatterplots을 보면 선이 보이는데 이 선으로 더욱 더 두 컬럼간의 관계를 알 수 있다.

 

 

pairplot 함수를 이용해서도 Scatterplots을 나타낼수 있는데 다중으로 Scatterplots이 나타낸다.

sb.pairplot(data=df,vars=['displ','comb','co2'])

 

5. heatmap

   히트맵도 Scatterplots과 마찬가지로 데이터의 분포를 나타내지만 분포 마다 색깔로 나타내는게 특징이다.

 

#엔진 크기와 이산화탄소 배출량의 관계를 분석하세요. 
#displ 이 엔진사이즈이고, co2 가 이산화탄소 배출량입니다.

plt.hist2d(data=df, x='displ', y='co2', cmin = 0.5, cmap='viridis_r' )
plt.colorbar()
plt.show()

색깔별로 다르게 나타나는것을 알수 있다.

반응형