手写数字系统实践指导手册1问题描述设计一个简单的手写数字识别系统,能够识别手写输入的数字 1-9 并且能够识别选中的文本文件中的数字,应具有简单方便的操作界面,输入输出等
1 功能需求分析通过分析,以及从用户的角度考虑,系统应该具有以下功能:(1)数字的手写输入
作为一个手写数字识别系统,首先应该能够让用户过绘制窗口进行数字绘制,系统得到用户的手写输入进行处理
(2)直接选择文件
用户还可以选择系统中的文本文件进行处理
(3)数据预处理
包括计算数据大小、二值化、格式化处理等
(4)数字提取
将经过二值化后的图像中的个数字区域进行提取,只有能够将数字进行准确的提取,才能将其一一识别
(5)基准库的选择与建立
选择一个可供系统训练和测试的样本库非常重要,本系统的训练集和测试集选择的是《机器学习实战》中所给的数据
(6)识别数字
经过训练集进行训练后,使用 knn 算法对需要识别的数字识别
2数据集获取任务要求:从网上爬取或者下载适合进行手写数字识别系统的训练集和测试集实践指导:方式一:自己从网上找适合的数据下载方式二:推荐数据集:“手写数字数据集的光学识别”一文中的数据集合,该 文 登 载 与2010年10月3日 的UCI机 器 学 习 资 料 库 中http://archive
edu/ml3 功能设计与实现3
1 手写数字识别系统结构图:图一: 系统结构图3
2 识别用户选择手选文件功能设计与实现任务要求:用户可以自己从电脑中选择文本文件进行识别
实践指导: KNN 分类器的构造思路及原理如下:1)选择训练集和测试集
系统所采用的数据集选用的是“手写数字数据集的光学识别”一文中的数据集合
0-9 每个数字大约有 200 个训练数据 20 个测试数据
数字的文本格式如图所示
文本格式存储的数字的文件命名也很有特点,格式为:数字的值_该数字的样本序