毕业答辩论文毕 业 设 计(论 文)题目京东热销手机评论中的数据分析及简单挖掘学生姓名:指导老师:理学院数学与应用数学专业101班京东热销手机评论中的数据分析及简单挖掘Analysis of data and simple miningJingdong selling mobile phone in comments学 生 姓 名 :所 在 专 业 :数学与应用数学班 级 :101指 导 老 师 :申 请 学 位 :理学学士论 文 提 交 日期:2025 -05-20论 文 答 辩 日期:2025 -06-16学 位 授 予 单位:摘 要手机已然成为人们生活中的必需品,正因为存在着宽阔的市场需求,手机的种类也越来越多。如何在这繁多的手机中选择出一部适合于自己的,自然成为即将购买手机用户的一个绕不过去的话题。由此,本文将对所采集的京东的14 部热销手机的评论进行数据分析和数据的简单挖掘。考虑到对手机评价的直观印象是依赖于 star 字段,所以本文先取出每部手机所有的 star 字段。由于事先并不知道 star 的分布情况,先求出基本统计量,如均值、峰度、偏度等,接下来对其进行探究性分析,通过 Kolmogorov-Smirnov 检验计算出数据不呈正态分布,然后通过 Kruskal-Wallis 检验得出手机间存在显著性差异,可是这并不知道每两部手机间的具体情况,所以又对数据进行 Nemenyi 检验,即多独立样本间均值的两两比较检验,从而得出每两部手机间的具体差异情况。最后,通过计算每个分值在所有得分中的占比来衡量手机间的得分情况,得出 id 编号为 982040 的手机得分情况最好,858025 和1005766 两部手机得分情况最差。并且,所得结果与前文所作检验得到的结果也相一致。接下来我们考察每部手机从开始到 2025 年 4 月 24 日为止的每天的销售情况。我们发现,在 2025 年 6 月 18 日之前就开始销售的五部手机,在 6 月 18 日这一天销售量都有所增长,经查阅新闻可知,这是三星和华为那几日的相关活动或新闻所导致。另外,在 2025 年 11 月 11 日,销量相对于平常也有所提升。这是因为在“双十一”那天,各电商企业进行大规模打折促销活动,在一定程度上刺激了手机的销售。最后,通过考察每部手机销售情况的序列图,我们发现国外品牌的手机及两部国产手机销售初期的状况并不好,而另外四部国产手机一开始就取得了良好的销售战绩。主要原因有两点:一、国外手机在国内的一次发行量远不及国产手机在国内的发行量多;二、手机正式销售前是否召开发布会,...