numpy 라이브러리는 평균,중앙값, 합계, 표준편차등을 구할수 있는 함수가 있다.
1. sum함수
데이터의 전체의 합계를 알려준다.
X
>>>> array([[ 15, 32, 79, 84, 81],
[ 71, 67, 83, 86, 56],
[ 28, 63, 44, 75, 72],
[ 43, 84, 22, 7, 100]])
X.sum()
>>>> 1192
2. mean 함수
데이터의 전체의 평균을 알려준다.
#아까 메모리로 저장된 X활용
X.mean()
>>>> 59.6
3. np.median 함수
데이터의 중앙값을 구하는데 2차원 데이터부터는 기존의 median함수가 행렬에서 중앙값을
판별할수 없기에 numpy안에 있는 median함수로 판별한다.
X.median()
>>>> ---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
Cell In [171], line 1
----> 1 X.median()
AttributeError: 'numpy.ndarray' object has no attribute 'median'
# 기존의 함수는 행렬의 중앙값을 판별할수 없으므로 에러가 난다.
np.median(X)
>>>> 69.0
4. max(),min() 함수
행렬 데이터내 최대 최소를 구할 수 있다. 또한 어느자리가 가장큰지(가장작은지)를 알려줄 수 있다.
#최대치
X.max()
>>> 100
#최소치
X.min()
>>> 7
#최대치 자리
X.argmax()
>>> 19
#최소치 자리
X.argmin()
>>> 18
5.행단위 열단위 데이터 연산
numpy는 행렬데이터일때 행 또는 열별로 데이터를 연산 할수 있다.
이때 axis로 0이면 행별로,1이면 열별로 연산하게 해준다. 또한
행별로 열별로 계산했기 때문에 값은 행의 자리수만큼 또는 열의 자리수
만큼 나타낸다.
#행별로 데이터의 합
X.sum(axis = 1)
>>> array([ 8, 16, 24, 32])
#열별로 데이터의 합
X.sum(axis = 0)
>>> array([280, 216, 246, 229, 173])
#다른 연산 함수도 적용가능
X.mean(axis = 1)
>>> array([57.2, 65.2, 33.6, 72.8])
X.mean(axis = 0)
>>> array([70. , 54. , 61.5 , 57.25, 43.25])
반응형
'파이썬 함수' 카테고리의 다른 글
numpy 라이브러리(5) 2차원 배열 연산 (0) | 2022.11.23 |
---|---|
numpy 라이브러리(4) 데이터 인덱싱과 boolean 연산 (0) | 2022.11.23 |
numpy 라이브러리(2) 데이터 재배열과 랜덤함수 (0) | 2022.11.23 |
numpy 라이브러리(1) data structure특징과 numpy라이브러리 실행 (0) | 2022.11.22 |
기타 라이브러리 statistics (0) | 2022.11.22 |