第一章 机器学习概述 1
机器学习研究什么问题,构建一个完整的机器学习算法需要哪些要素
机器学习主要研究如何选择统计学习模型,从大量已有数据中学习特定经验
构建一个完整的机器学习算法需要三个方面的要素,分别是数据,模型,性能度量准则
可以生成新数据的模型是什么,请举出几个例子 可以生成新数据的模型是生成模型,典型的生成模型有朴素贝叶斯分类器、高斯混合模型、隐马尔可夫模型、生成对抗网络等
监督学习、半监督学习和无监督学习是什么,降维和聚类属于哪一种
监督学习是指样本集合中包含标签的机器学习,无监督学习是无标签的机器学习,而半监督学习介于二者之间
降维和聚类是无监督学习
过拟合和欠拟合会导致什么后果,应该怎样避免
过拟合导致模型泛化能力弱,发生明显的预测错误,往往是由于数据量太少或模型太复杂导致,通过增加训练数据量,对模型进行裁剪,正则化的方式来缓解
而欠拟合则会导致模型不能对数据进行很好地拟合,通常是由于模型本身不能对训练集进行拟合或者训练迭代次数太少,解决方法是对模型进行改进,设计新的模型重新训练,增加训练过程的迭代次数
什么是正则化,L1 正则化与 L2 正则化有什么区别
正则化是一种抑制模型复杂度的方法
L1 正则化能够以较大概率获得稀疏解,起到特征选择的作用,并且可能得到不止一个最优解
L2 正则化相比前者获得稀疏解的概率小的多,但得到的解更加平滑
第二章 逻辑回归与最大熵模型 1
逻辑回归模型解决( B ) A
回归问题 B
分类问题 C
聚类问题 D
推理问题 2
逻辑回归属于( B )回归 A
概率性线性 B
概率性非线性 C
非概率性线性 D
非概率性非线性 3
逻辑回归不能实现( D ) A
分类预测 D
非线性回归 4
下列关于最大熵模型的表述错误的是( B ) A
最大熵模型是基于熵值越大模型越稳