用Python玩转人工智能——数字识别技术 之一

目录

  前言

  一、MNIST数据集初始与导入

  (一)MNIST 数据集(Mixed National Institute of Standards and Technology database)是一个广泛应用于机器学习中训练和测试的二进制图像数据集。以下是其详细介绍:

  (二)本地导入MNIST数据集的方法

  方法一:使用torchvision(PyTorch)

  方法二:使用tensorflow.keras

  方法三:手动下载并解析二进制文件

  方法四:使用mnist库(简化版)

  注意事项


用Python玩转人工智能——数字识别技术 之一_第1张图片

  前言

  当下,玩代码,不会运用代码搞几套适合自己的人工智能模型,可以说代码白完了,这一套系列课程,我将结合自己学到的内容,帮大家总结一些能快速上手的模型,希望给大家一些编程方面的启发。

  一、MNIST数据集初始与导入

  (一)MNIST 数据集(Mixed National Institute of Standards and Technology database)是一个广泛应用于机器学习中训练和测试的二进制图像数据集。以下是其详细介绍:

  •   发布方与发布时间:由美国国家标准技术研究所(NIST)于 1998 年发布。
  •   数据来源:从 NIST 的 Special Database 3 和 Special Database 1 这两个手写数字数据集中分别取出部分图像,并经过一些图像处理后得到。
  •   数据规模与划分:共有 70000 张图像,其中训练集 60000 张,测试集 10000 张。
  •   数据格式与特点:所有图像都是 28×28 的灰度图像,以矩阵形式存储于 idx 格式的二进制文件中。图像中的手写数字居中显示。每张图像都有标注,共 10 个类别,代表 0~9 之间的一个数字。
  •   应用领域:作为入门级的计算机视觉数据集,常用于图像识别模型的训练和测试,如线性分类器、K - 近邻算法、支持向量机、神经网络、卷积神经网络等,也广泛应用于教育领域,帮助初学者了解和掌握机器学习的基本概念和技术要点。

你可能感兴趣的:(Python教程,python,人工智能,开发语言)