机器学习基础特征提取与预处理2020/12/3特征提取与预处理第 4-1 课特征提取与预处理在线性回归中讨论的例子使用了简单的数字解释变量,例如比萨饼的直径
许多机器学习问题需要从分类变量,文本或图像的观察中学习
在本课中,您将学习预处理数据和创建这些观察的特征表示的基本技术
这些技术可以用于回归模型,线性回归,以及我们将在下一课讨论的模型2020/12/3特征提取与预处理第 4-2 课特征提取与预处理从分类变量中提取特征从文本中提取特征从图像中提取特征数据规范化2020/12/3特征提取与预处理第 4-3 课从分类变量中提取特征变量的类型numinal (定类) : 类别,状态或“事物的名称”Hair_color={auburn , black , blond , brown , grey, red , white}婚姻状况,职业,身份证号码,邮政编码2020/12/3特征提取与预处理第 4-4 课从分类变量中提取特征变量的类型numinal (定类) : 类别,状态或“事物的名称”Hair_color={auburn , black , blond , brown , grey, red , white}婚姻状况,职业,身份证号码,邮政编码Binary (二类)只有 2 个状态( 0 和 1 )的标称属性对称二元 : 两种结果同等重要,例如性别非对称二元 : 结果不同等重要,例如医学检验(阳性与阴性)公约 : 最重要的结果(如 HIV 阳性)为 12020/12/3特征提取与预处理第 4-5 课从分类变量中提取特征变量的类型名义上二进制Ordinal (定序)值有一个有意义的顺序(排名),但连续值之间的大小是未知的
大小 ={ 小,中,大 } ,等级,军队排名2020/12/3特征提取与预处理第 4-6 课从分类变量中提取特征变量的类型NominalBinary Ord