人工智能 技术篇机 器 学 习第七章本 章 导 读 随着计算机性能的大幅提升和可用数据量的不断增加,机器学习得到了飞速的发展。它利用计算机对大量的数据进行分析,并从中获取有用的信息,使机器具有一定的智能。近些年来,机器学习在众多领域都得到了广泛的应用。 本章从机器学习的概念入手,先介绍机器学习的相关术语、分类和应用场景,然后详细介绍机器学习的两种学习方法,即有监督学习和无监督学习。学习目标 熟悉机器学习的概念、相关术语、分类和应用场景。 理解有监督学习模型。 掌握分类任务和回归任务的基本思想和实现方法。 理解无监督学习模型。 掌握聚类任务的基本思想和实现方法。目 录 4机 器 学 习 概 述有 监 督 学 习无 监 督 学 习010203机 器 学 习 概 述01人工智能的概念7.1.1 机器学习( machine learning )是通过各种算法从数据中学习如何完成任务,并获得完成任务方法的一门学科。它可以对数据进行自动分析,并从中获得规律或模型,然后利用规律或模型对未知数据进行预测。它是人工智能的核心,是使计算机具有智能的重要途径。 目前,机器学习还没有一个公认且准确的定义,下面列举了部分学者对机器学习的描述。( 1 )机器学习是研究如何用机器模拟人类学习活动的一门学科。( 2 )机器学习是研究机器如何获取新知识和新技能,并识别现有知识的学科。( 3 )机器学习是研究机器如何模拟人类的学习活动,自主获取新知识和新技能,不断提升系统性能的学科。 机器学习的基本思路就是使用一定的算法解析训练数据(进行模型训练);然后学习数据中存在的一些特征,得到模型;最后使用得到的模型对实际问题做出分类、决策或预测等。 机器学习的研究对象是数据,其中,具有相似结构的数据样本集合称为数据集;对某个对象的描述称为样本或示例;对象的某方面表现称为特征或属性;特征或属性上的取值称为特征值或属性值;描述样本特征参数的个数称为维数。 以计算机识别图像中的动物是否是猫为例,其中数据集、样本、特征、特征值如图所示。机器学习的相关术语7.1.2术语标记 在机器学习中,执行某个学习算法,从数据中学习得到模型的过程称为训练或学习;训练过程中使用的数据称为训练数据;每个样本称为训练样本;训练样本组成的集合称为训练集。为得到效果最佳的模型,常用来调整模型参数的样本称为验证样本;验证样本组成的集合称为验证集。 获得模型后,使用模型对未知数据...