毕业答辩论文毕 业 设 计(论 文)题目京东热销手机评论中的数据分析及简单挖掘学生姓名:指导老师:理学院数学与应用数学专业101班京东热销手机评论中的数据分析及简单挖掘Analysis of data and simple miningJingdong selling mobile phone in comments学 生 姓 名 :所 在 专 业 :数学与应用数学班 级 :101指 导 老 师 :申 请 学 位 :理学学士论 文 提 交 日期:2025 -05-20论 文 答 辩 日期:2025 -06-16学 位 授 予 单位:摘 要手机已然成为人们生活中的必需品,正因为存在着宽阔的市场需求,手机的种类也越来越多
如何在这繁多的手机中选择出一部适合于自己的,自然成为即将购买手机用户的一个绕不过去的话题
由此,本文将对所采集的京东的14 部热销手机的评论进行数据分析和数据的简单挖掘
考虑到对手机评价的直观印象是依赖于 star 字段,所以本文先取出每部手机所有的 star 字段
由于事先并不知道 star 的分布情况,先求出基本统计量,如均值、峰度、偏度等,接下来对其进行探究性分析,通过 Kolmogorov-Smirnov 检验计算出数据不呈正态分布,然后通过 Kruskal-Wallis 检验得出手机间存在显著性差异,可是这并不知道每两部手机间的具体情况,所以又对数据进行 Nemenyi 检验,即多独立样本间均值的两两比较检验,从而得出每两部手机间的具体差异情况
最后,通过计算每个分值在所有得分中的占比来衡量手机间的得分情况,得出 id 编号为 982040 的手机得分情况最好,858025 和1005766 两部手机得分情况最差
并且,所得结果与前文所作检验得到的结果也相一致
接下来我们考察每部手机从开始到 2025 年 4 月 24 日为止的每天的销售情况