top of page

MNIST 머신러닝, 딥러닝

  • 작성자 사진: Yongjin
    Yongjin
  • 4일 전
  • 1분 분량

MNIST(Minist로 잘못 표기된 경우가 많음)는 손글씨 숫자(0~9) 이미지로 구성된 대표적인 머신러닝·딥러닝 학습용 데이터셋입니다.

정확한 명칭은 **MNIST (Modified National Institute of Standards and Technology database)**입니다.


---


## 주요 특징


- **구성**: 28×28 픽셀 크기의 흑백(그레이스케일) 손글씨 숫자 이미지

- **샘플 수**: 총 70,000장 (훈련용 60,000장, 테스트용 10,000장)

- **클래스**: 0~9까지 10개 숫자 클래스

- **용도**: 이미지 분류, 딥러닝, 머신러닝 알고리즘 성능 평가 및 벤치마크에 널리 사용됨

- **전처리**: 원본 NIST 데이터에서 이미지를 크기 정규화(28×28)하고, 중심 정렬 및 안티앨리어싱 처리로 그레이스케일화함[1][2][4][5][6][7].


---


## 활용 예시


- 딥러닝/머신러닝 모델(예: CNN, SVM 등)의 기본 분류 성능 실험

- 신경망 구조 실험 및 최적화

- 전이학습, 오토인코더, 생성모델 등 다양한 연구의 벤치마크 데이터로 활용


---


## 확장 데이터셋


- **EMNIST**: 영문자(대소문자)와 숫자를 모두 포함한 확장판

- **Fashion MNIST**: 패션 아이템(신발, 옷 등) 이미지로 구성된 더 어려운 분류용 데이터셋[2].


---


## 참고


- MNIST는 Yann LeCun, Corinna Cortes, Christopher J.C. Burges가 개발했으며, 머신러닝/딥러닝 연구 커뮤니티에서 가장 널리 쓰이는 표준 데이터셋 중 하나입니다[1][2][4][5][6].

- 실제 데이터와 코드는 공식 홈페이지와 다양한 오픈소스 라이브러리, Kaggle, TensorFlow Datasets 등에서 쉽게 구할 수 있습니다[3][6][8].


---


**요약**:

MNIST는 손글씨 숫자 이미지(28×28, 흑백)로 구성된, 이미지 분류 및 딥러닝 연구의 대표적 벤치마크 데이터셋입니다.


출처

[1] MNIST Dataset - Ultralytics YOLO Docs https://docs.ultralytics.com/datasets/classify/mnist/

[2] MNIST database - Wikipedia https://en.wikipedia.org/wiki/MNIST_database

[4] MNIST Dataset | Papers With Code https://paperswithcode.com/dataset/mnist

[5] MNIST Database of Handwritten Digits - UCI Machine Learning ... https://archive.ics.uci.edu/dataset/683/mnist+database+of+handwritten+digits

[7] MNIST database of handwritten digits - Azure Open Datasets https://learn.microsoft.com/en-us/azure/open-datasets/dataset-mnist

[8] MNIST Handwritten Digit Recognition | Kaggle https://www.kaggle.com/c/mnist-handwritten-digit-recognition/overview

 
 
 

Comments


Featured Posts
Recent Posts
Archive
Search By Tags
Follow Us
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page