浙江工商大学计算机与信息工程学院《Pyt hon 程序设计与实践》大作业报告专 业: 计科 班 级: 14 04 学 号:1 41 2 19 04 1 6 、 1 4 121 90 415 、 14121904 1 3 姓 名: 陆阳,孙勇 , 裘昇明 指导老师: 蒲飞 2 0 15 年 6 月 2 8 日题目介绍:在真实得业务场景下,我们往往需要对所有商品得一个子集构建个性化推举模型
在完成这件任务得过程中,我们不仅需要利用用户在这个商品子集上得行为数据,往往还需要利用更丰富得用户行为数据
定义如下得符号:U——用户集合ﻫI—-商品全集P--商品子集,P ⊆ IﻫD——用户对商品全集得行为数据集合那么我们得目标就是利用 D 来构造 U 中用户对 P 中商品得推举模型
数据说明:竞赛数据包含两个部分
第一部分就是用户在商品全集上得移动端行为数据(D),表名为 t ian c h i_m obile_re m end_train_user,包含如下字段:字段字段说明提取说明 us er_id 用户标识 抽样&字段脱敏 it e m_i d 商品标识 字段脱敏 be h avior_type 用户对商品得行为类型 包括浏览、收藏、加购物车、购买,对应取值分别就是 1、2、3、4
use r_geo hash 用户位置得空间标识,可以为空 由经纬度通过保密得算法生成i te m_ca teg ory商品分类标识字段脱敏time行为时间精确到小时级别第二个部分就是商品子集(P),表名为t ianchi_mo b il e_r emen d_tra i n_ite m,包含如下字段:字段字段说明提取说明 it e m_id 商品标识 抽样&字段脱敏 i te m_ geohash 商品位置得空间标识,可以为空 由经纬度通过保密得算法生成 it e m_category 商品分类标识