컴퓨터과학/딥러닝

MNIST 데이터셋의 특징부터 구현까지 - 딥러닝의 신경망

InfHo 2023. 1. 23. 23:35

목차

     

    MNIST-데이터셋
    NINST 데이터셋

     

    개요

     MNIST 데이터 세트는 특히 컴퓨터 비전 분야에서 기계 학습 모델을 교육하고 테스트하는 데 널리 사용되는 데이터 세트입니다. Modified National Institute of Standards and Technology의 약자입니다.

     


    특징

    MNIST 데이터 세트60,000개의 학습 이미지와 10,000개의 손글씨 숫자 테스트 이미지로 구성되며 각 이미지의 크기는 28x28픽셀이고 회색조입니다. 각 이미지에는 0에서 9까지의 해당 숫자가 표시됩니다.

    MNIST 데이터 세트에서 훈련된 모델의 목표는 손으로 쓴 숫자의 이미지를 입력으로 가져와 10자리 숫자 중 하나로 올바르게 분류하는 것입니다. 이것은 고전적인 이미지 분류 문제이며 다양한 기계 학습 모델 및 아키텍처의 성능을 테스트하기 위한 벤치마크로 널리 사용됩니다.

    MNIST 데이터 세트는 작업이 간단하고 쉬우면서도 여전히 높은 정확도를 달성하기 위해 정교한 모델이 필요할 만큼 까다롭기 때문에 컴퓨터 비전 및 기계 학습을 학습하고 실험하기 위한 훌륭한 데이터 세트입니다. 다양한 기계 학습 모델 및 아키텍처의 성능을 테스트하기 위한 벤치마크로 널리 사용됩니다.

    MNIST 데이터셋과 유사한 Fashion-MNIST라는 유사한 데이터셋이 있다는 것도 언급할 가치가 있습니다. 이 데이터셋의 이미지는 가방, 신발 등과 같은 패션 아이템과 관련이 있습니다. 컴퓨터 비전 작업을 위한 벤치마크 데이터셋으로도 사용됩니다.

     

    구현

    import numpy as np
    from keras.datasets import mnist
    
    # load the MNIST dataset
    (x_train, y_train), (x_test, y_test) = mnist.load_data()
    
    # convert the data to a NumPy array
    x_train_np = np.array(x_train)
    y_train_np = np.array(y_train)
    x_test_np = np.array(x_test)
    y_test_np = np.array(y_test)

     

    이 예제에서 mnist.load_data() 함수는 MNIST 데이터셋을 로드하는 데 사용됩니다. x_train, y_train, x_test 및 y_test는 numpy 배열이므로 다시 변환할 필요가 없습니다.

    mnist.load_data() 함수는 데이터를 NumPy 배열의 튜플로 반환한다는 점에 유의해야 합니다. 첫 번째 요소에는 학습 데이터와 레이블이 포함되고 두 번째 요소에는 테스트 데이터와 레이블이 포함됩니다. 학습 데이터와 레이블은 모델 학습에 사용되고 테스트 데이터와 레이블은 학습된 모델의 성능을 평가하는 데 사용됩니다.

    또한 mnist.load_data() 함수가 x_train의 경우 (60000,28,28), x_test의 경우 (10000,28,28) 형식으로 데이터를 로드한다는 점은 주목할 가치가 있습니다. 즉, 이미지를 포함하는 3D 배열입니다. 데이터, 첫 번째 차원은 이미지의 수를 나타내고 두 번째 및 세 번째 차원은 이미지 픽셀을 나타냅니다.

    NumPy 배열의 데이터를 사용하여 Keras, Tensor Flow, PyTorch 등과 같은 적절한 라이브러리를 사용하여 기계 학습 모델을 훈련하고 테스트할 수 있습니다.

     

    [컴퓨터과학/딥러닝] - 파이썬의 keras를 이용해 3층 신경망을 구현해 보자 - 딥러닝

     

    더 보기

     

    '컴퓨터과학/딥러닝' 카테고리의 글 목록

    모든 분야의 정보를 담고 있는 정보의 호텔입니다. 주로 컴전기입니다.

    jkcb.tistory.com

     

    '자격증/빅데이터분석기사' 카테고리의 글 목록

    모든 분야의 정보를 담고 있는 정보의 호텔입니다. 주로 컴전기입니다.

    jkcb.tistory.com