北邮阿里巴巴技术联盟机器学习概述研究方法概念学习资料机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科
机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法
即从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法
定义:“机器学习是对能通过经验自动改进的计算机算法的研究”
定义:“机器学习是一种让计算机在没有事先明确地编程的情况下做出正确反应的科学”
机器学习:定义机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用
机器学习:应用机器学习:应用监督学习无监督学习机器学习算法统计分类回归分析聚类关联规则机器学习算法分类监督学习算法:统计分类监督学习算法:回归分析监督学习算法特征n目标训练集特征n目标特征n目标特征1特征1特征1………………监督学习算法:训练/学习身高发长抽烟性别1
4cm是男1
3cm否女1
6cm否女监督学习算法特征n测试集特征n特征n特征1特征1特征1………………结果目标目标目标监督学习算法:预测身高发长抽烟1
660cm是1
4cm否性别男男女统计分类特征n测试集特征1……结果离散值监督学习算法:分类
回归分析特征n特征1……连续值离散值连续值决策树KNN逻辑回归监督学习算法朴素贝叶斯神经网络监督学习算法随机森林SVM算法优化AdaBoost遗传算法监督学习无监督学习机器学习算法统计分类回归分析聚类关联规则机器学习算法分类无监督学习算法:聚类无监督学习算法:关联规则刮风降温降雨冰雹111011001000101001111100刮风降温降雨冰雹1110110010001010011