大家好,欢迎来到IT知识分享网。
🤵 Author :Horizon John
✨ 编程技巧篇:各种操作小结
🎇 机器视觉篇:会变魔术 OpenCV
💥 深度学习篇:简单入门 PyTorch
🏆 神经网络篇:经典网络模型
💻 算法篇:再忙也别忘了 LeetCode
MINIST
Size: 28×28 灰度手写数字图像
Num: 训练集 60000 和 测试集 10000,一共70000张图片
Classes: 0,1,2,3,4,5,6,7,8,9
官方下载链接:MINIST
数据集读取
1)MNIST数据集文件夹
一共包含四个文件夹:
train-images-idx3-ubyte.gz:训练集图像(9912422 字节)55000张训练集 + 5000张验证集;
train-labels-idx1-ubyte.gz:训练集标签(28881 字节)训练集对应的标签;
t10k-images-idx3-ubyte.gz:测试集图像(1648877 字节)10000张测试集;
t10k-labels-idx1-ubyte.gz:测试集标签(4542 字节)测试集对应的标签;
2)读取MNIST数据集
如果数据集没有下载,修改参数:download=True
from torchvision import datasets, transforms train_data = datasets.MNIST(root="./MNIST", train=True, transform=transforms.ToTensor(), download=False) test_data = datasets.MNIST(root="./MNIST", train=False, transform=transforms.ToTensor(), download=False) print(train_data) print(test_data)
输出结果:
Dataset MNIST Number of datapoints: 60000 Root location: ./MNIST Split: Train StandardTransform Transform: ToTensor() Dataset MNIST Number of datapoints: 10000 Root location: ./MNIST Split: Test StandardTransform Transform: ToTensor()
完整的数据集读取代码:
from torchvision import datasets, transforms from torch.utils.data import DataLoader train_data = datasets.MNIST(root="./MNIST", train=True, transform=transforms.ToTensor(), download=False) test_data = datasets.MNIST(root="./MNIST", train=False, transform=transforms.ToTensor(), download=False) train_loader = DataLoader(dataset=train_data, batch_size=64, shuffle=True) test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True)
数据可视化
以训练集为例:
import torchvision from torchvision import datasets, transforms from torch.utils.data import DataLoader import numpy as np import matplotlib.pyplot as plt train_data = datasets.MNIST(root="./MNIST", train=True, transform=transforms.ToTensor(), download=False) train_loader = DataLoader(dataset=train_data, batch_size=64, shuffle=True) for num, (image, label) in enumerate(train_loader): image_batch = torchvision.utils.make_grid(image, padding=2) plt.imshow(np.transpose(image_batch.numpy(), (1, 2, 0)), vmin=0, vmax=255) plt.show() print(label)
1)image :
2)label :
tensor([1, 8, 9, 6, 8, 9, 9, 9, 4, 0, 4, 9, 0, 1, 6, 5, 2, 6, 1, 6, 4, 2, 8, 5, 1, 7, 7, 8, 9, 3, 5, 0, 8, 9, 3, 6, 5, 4, 0, 2, 4, 2, 4, 5, 8, 7, 1, 5, 9, 8, 6, 8, 6, 8, 3, 8, 7, 7, 3, 0, 8, 6, 2, 0])
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/111255.html
![[ 数据集 ] MINIST 数据集介绍插图1 在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/ed84e41dc4f583fe6f127678958a52e0.png#pic_center)
![[ 数据集 ] MINIST 数据集介绍插图3 在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/ab76087c2507d6d8e924e0832af766eb.png#pic_center)
![[ 数据集 ] MINIST 数据集介绍插图5 在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/05fc54272531096e73dca03073900e62.png#pic_center)