MNIST 머신러닝, 딥러닝
- Yongjin
- 4일 전
- 1분 분량
MNIST(Minist로 잘못 표기된 경우가 많음)는 손글씨 숫자(0~9) 이미지로 구성된 대표적인 머신러닝·딥러닝 학습용 데이터셋입니다.
정확한 명칭은 **MNIST (Modified National Institute of Standards and Technology database)**입니다.
---
## 주요 특징
- **구성**: 28×28 픽셀 크기의 흑백(그레이스케일) 손글씨 숫자 이미지
- **샘플 수**: 총 70,000장 (훈련용 60,000장, 테스트용 10,000장)
- **클래스**: 0~9까지 10개 숫자 클래스
- **용도**: 이미지 분류, 딥러닝, 머신러닝 알고리즘 성능 평가 및 벤치마크에 널리 사용됨
- **전처리**: 원본 NIST 데이터에서 이미지를 크기 정규화(28×28)하고, 중심 정렬 및 안티앨리어싱 처리로 그레이스케일화함[1][2][4][5][6][7].
---
## 활용 예시
- 딥러닝/머신러닝 모델(예: CNN, SVM 등)의 기본 분류 성능 실험
- 신경망 구조 실험 및 최적화
- 전이학습, 오토인코더, 생성모델 등 다양한 연구의 벤치마크 데이터로 활용
---
## 확장 데이터셋
- **EMNIST**: 영문자(대소문자)와 숫자를 모두 포함한 확장판
- **Fashion MNIST**: 패션 아이템(신발, 옷 등) 이미지로 구성된 더 어려운 분류용 데이터셋[2].
---
## 참고
- MNIST는 Yann LeCun, Corinna Cortes, Christopher J.C. Burges가 개발했으며, 머신러닝/딥러닝 연구 커뮤니티에서 가장 널리 쓰이는 표준 데이터셋 중 하나입니다[1][2][4][5][6].
- 실제 데이터와 코드는 공식 홈페이지와 다양한 오픈소스 라이브러리, Kaggle, TensorFlow Datasets 등에서 쉽게 구할 수 있습니다[3][6][8].
---
**요약**:
MNIST는 손글씨 숫자 이미지(28×28, 흑백)로 구성된, 이미지 분류 및 딥러닝 연구의 대표적 벤치마크 데이터셋입니다.
출처
[1] MNIST Dataset - Ultralytics YOLO Docs https://docs.ultralytics.com/datasets/classify/mnist/
[2] MNIST database - Wikipedia https://en.wikipedia.org/wiki/MNIST_database
[3] MNIST Dataset | Kaggle https://www.kaggle.com/datasets/hojjatk/mnist-dataset
[4] MNIST Dataset | Papers With Code https://paperswithcode.com/dataset/mnist
[5] MNIST Database of Handwritten Digits - UCI Machine Learning ... https://archive.ics.uci.edu/dataset/683/mnist+database+of+handwritten+digits
[6] mnist | TensorFlow Datasets https://www.tensorflow.org/datasets/catalog/mnist
[7] MNIST database of handwritten digits - Azure Open Datasets https://learn.microsoft.com/en-us/azure/open-datasets/dataset-mnist
[8] MNIST Handwritten Digit Recognition | Kaggle https://www.kaggle.com/c/mnist-handwritten-digit-recognition/overview
Comments