CNN의 이미지 데이터들은 데이터 용량이 크기 때문에 대부분은 압축이 된 경우가 많다. 파이썬으로 이미지 데이터를 받고 압축을 푸는 작업을 해보자
우선 데이터 이미지가 압축된 파일을 다운로드 한다.
# 리눅스 언어로 압축파일을 받아 온다.
!wget --no-check-certificate \
https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \
-O /tmp/cats_and_dogs_filtered.zip
압축을 풀고 지정한 경로로 지정한 이름으로 저장한다.
#지정한 경로로 압축을 풀기
import zipfile
file = zipfile.ZipFile('/tmp/cats_and_dogs_filtered.zip')
#지정한 이름으로 압축을 풀기
file.extractall('/tmp/cats_and_dogs_filtered')
압축을 풀었다고 파이썬 환경상에 알집처럼 파일이 뜨지는 않는다. 그렇기 때문에 파일 경로를 변수로 저장해주어야 한다.
base_dir='/tmp/cats_and_dogs_filtered/cats_and_dogs_filtered'
train_dir='/tmp/cats_and_dogs_filtered/cats_and_dogs_filtered/train'
test_dir='/tmp/cats_and_dogs_filtered/cats_and_dogs_filtered/validation'
반응형
'딥러닝' 카테고리의 다른 글
딥러닝(16) ImageDataGenerator 사용하기 (0) | 2023.01.02 |
---|---|
딥러닝(15) 텐서플로우를 활용한 CNN (0) | 2023.01.02 |
딥러닝(13) pooling 이란 (0) | 2023.01.02 |
딥러닝(12)CNN의 구조 (0) | 2022.12.30 |
딥러닝(11) 텐서플로우의 모델을 저장하고 불러오는 방법 (0) | 2022.12.30 |