浙江工商大学计算机与信息工程学院《Python 程序设计与实践》大作业汇报专 业: 计科 班 级: 1404 学 号:1412190416 、 1412190415 、 1412190413 姓 名: 陆阳 , 孙勇,裘昇明 指导教师: 蒲飞 年 6 月 28 日题目简介:在真实的业务场景下,我们往往需要对所有商品的一种子集构建个性化推荐模型
在完毕这件任务的过程中,我们不仅需要运用顾客在这个商品子集上的行为数据,往往还需要运用更丰富的顾客行为数据
定义如下的符号:U——顾客集合I—-商品全集P-—商品子集,P ⊆ ID--顾客对商品全集的行为数据集合那么我们的目的是运用 D 来构造 U 中顾客对 P 中商品的推荐模型
数听阐明:竞赛数据包含两个部分
第一部分是顾客在商品全集上的移动端行为数据 (D),表名为tianchi_mobile_recommend_train_user,包含如下字段:字段字段阐明提取阐明 user_id 顾客标识 抽样&字段脱敏 item_id 商品标识 字段脱敏 behavior_type 顾客对商品的行为类型 包括浏览、收藏、加购物车、购置,对应取值分别是1、2、3、4
user_geohash 顾客位置的空间标识,可以为空 由经纬度通过保密的算法生成item_category商品分类标识字段脱敏time行为时间精确到小时级别第二个部分是商品子集(P),表名为 tianchi_mobile_recommend_train_item,包含如下字段:字段字段阐明提取阐明 item_id 商品标识 抽样&字段脱敏 item_ geohash 商品位置的空间标识,可以为空 由经纬度通过保密的算法生成 item_category 商品分类标识 字段脱敏训练数据包含了抽样出来的一定量顾客在一种月时间(11
18)之内的移动端行为数据(D),评