1《数据科学导论》在线作业数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A:异常值B:缺失值C:不一致的值D:重复值参考选项:C以下哪些不是缺失值的影响()A:数据建模将丢失大量有用信息B:数据建模的不确定性更加显著C:对整体总是不产生什么作用D:包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考选项:CBFR聚类是用于处理数据集()的k-means变体。A:大B:中C:小D:所有参考选项:A例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()A:简单函数变换B:规范化C:属性构造D:连续属性离散化参考选项:B在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。A:越小B:越大C:无关D:不确定参考选项:B设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A:4B:5C:62D:7参考选项:C为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。A:1B:2C:3D:4参考选项:B某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。A:产量每增加一台,单位成本增加100元B:产量每增加一台,单位成本减少1.2元C:产量每增加一台,单位成本平均减少1.2元D:产量每增加一台,单位平均增加100元参考选项:C在回归分析中,自变量为(),因变量为()。A:离散型变量,离散型变量B:连续型变量,离散型变量C:离散型变量,连续型变量D:连续型变量,连续型变量参考选项:D在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。A:最优回归线B:最优分布线C:最优预测线D:最佳分布线参考选项:A通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A:简单函数变换B:规范化C:属性构造D:连续属性离散化参考选项:C变量之间的关系一般可以分为确定性关系与()。A:非确定性关系B:线性关系