浙江工商大学计算机与信息工程学院《Python 程序设计与实践》大作业汇报专 业: 计科 班 级: 1404 学 号:1412190416 、 1412190415 、 1412190413 姓 名: 陆阳 , 孙勇,裘昇明 指导教师: 蒲飞 年 6 月 28 日题目简介:在真实的业务场景下,我们往往需要对所有商品的一种子集构建个性化推荐模型。在完毕这件任务的过程中,我们不仅需要运用顾客在这个商品子集上的行为数据,往往还需要运用更丰富的顾客行为数据。定义如下的符号:U——顾客集合I—-商品全集P-—商品子集,P ⊆ ID--顾客对商品全集的行为数据集合那么我们的目的是运用 D 来构造 U 中顾客对 P 中商品的推荐模型。数听阐明:竞赛数据包含两个部分.第一部分是顾客在商品全集上的移动端行为数据 (D),表名为tianchi_mobile_recommend_train_user,包含如下字段:字段字段阐明提取阐明 user_id 顾客标识 抽样&字段脱敏 item_id 商品标识 字段脱敏 behavior_type 顾客对商品的行为类型 包括浏览、收藏、加购物车、购置,对应取值分别是1、2、3、4。 user_geohash 顾客位置的空间标识,可以为空 由经纬度通过保密的算法生成item_category商品分类标识字段脱敏time行为时间精确到小时级别第二个部分是商品子集(P),表名为 tianchi_mobile_recommend_train_item,包含如下字段:字段字段阐明提取阐明 item_id 商品标识 抽样&字段脱敏 item_ geohash 商品位置的空间标识,可以为空 由经纬度通过保密的算法生成 item_category 商品分类标识 字段脱敏训练数据包含了抽样出来的一定量顾客在一种月时间(11。18~12。18)之内的移动端行为数据(D),评分数据是这些顾客在这个一种月之后的一天(12。19)对商品子集(P)的购置数据。参赛者要使用训练数据建立推荐模型,并输出顾客在接下来一天对商品子集购置行为的预测成果. 大作业汇报内容包括如下几种部分1、数据分组记录:可记录有多少顾客、商品、商品类别等信息,甚至每天多种行为的记录数。如图:尚有,在给出的顾客行为数据中,有些顾客在整个 11—18 日至 12—18 日对商品有浏览行为记录,不过从未产生过购置行为,这些顾客会否在 12 月 19 号购置商品实难预测,因此,我们去除这些无购置行为的顾客信息,认为这些顾客在 12 月 19 号还是不会购置任何商品。贴关键代码import timeimport pandas as pdstart=time。time()df_items=pd。read_csv("tianchi_mobile_recom...