1 .什么是机器学习 机器学习是为了应对系统程序设计,属于计算机科学类的学科,它能根据经验进行自动学习和提高。例如:一个由程序操纵的机器人,它能根据从传感器搜集到的数据,完成一系列的任务和工作。它能根据数据自动地学习应用程序。 2 .机器学习与数据挖掘的区别 机器语言是指在没有明确的程序指令的情况下,给予计算机学习能力,使它能自主的学习、设计和扩展相关算法。数据挖掘则是一种从非结构化数据里面提取知识或者未知的、人们感兴趣的图片。在这个过程中应用了机器学习算法。 3 .什么是机器学习的过度拟合现象 在机器学习中,当一个统计模型首先描述随机误差或噪声,而不是自身的基本关系时,过度拟合就会出现。当一个模型是过于复杂,过拟合通常容易被发现,因为相对于训练数据类型的数量,参数的数量过于五花八门。那么这个模型由于过度拟合而效果不佳。 4 .过度拟合产生的原因 由于用于训练模型的标准并不等同于判断模型效率的标准,这导致了产生过度拟合的可能性。 5 .如何避免过度拟合 当你使用较小的数据集进行机器学习时,容易产生过度拟合,因此使用较大的数据量能避免过度拟合现象。但是,当你不得不使用小型数据集进行建模时,可以使用被称为交叉验证的技术。在这种方法中数据集被分成两节,测试和训练数据集,测试数据集只测试模型,而在训练数据集中,数据点被用来建模。 在该技术中,一个模型通常是被给定有先验知识的数据集(训练数据集)进行训练,没有先验知识的数据集进行测试。交叉验证的思想是:在训练阶段,定义一个数据集用来测试模型。 6 .什么是感应式的机器学习? 感应机器学习涉及由实践进行学习的过程,能从一组可观测到的例子的尝试推导出普遍性规则。 7 .什么是机器学习的五个流行的算法? 1. 决策树 2. 神经网络(反向传播)3. 概率网络 4.最邻近法 5. 支持向量机 8.机器学习有哪些不同的算法技术? 在机器学习不同类型的算法技术是: 1. 监督学习 2.非监督学习 3. 半监督学习 4. 转导推理(Transduction)5.学习推理(Learning to Learn)。 9.在机器学习中,建立假设或者模型的三个阶段指的是什么? 1.建模 2.模型测试 3.模型应用。 10.什么是监督学习的标准方法? 监督学习的标准方法是将一组示例数据的分成训练数据集和测试数据集。 11.什么是训练数据集和测试数据集? 在类似于机器学习的各个信息科学相关领域中,一组数据被用来发现潜在的预测关...