精品文档---下载后可任意编辑一种网页推举系统的设计与实现的开题报告一、讨论背景和意义随着互联网的普及和进展,人们在日常生活中越来越依赖网络
互联网已经成为人们猎取信息、沟通互动、购物娱乐、学习工作的主要渠道之一
然而,互联网上信息量巨大、信息质量参差不齐,如何帮助用户快速找到自己想要的信息,成为了一个亟待解决的问题
为了解决这个问题,互联网推举系统应运而生
推举系统通过分析用户的行为、兴趣和偏好,向用户推举相关的信息、商品或服务,能够提高用户在互联网上的体验,提升用户的满意度,也能够增加互联网企业的收益
本文旨在设计一种基于网页浏览历史记录和兴趣标签的网页推举系统,通过分析用户的浏览历史记录和标签兴趣,向用户推举更符合其兴趣的网页内容
特别的,本文关注于由用户兴趣标签对网页进行embedding 的方法,并探讨各种 embedding 方法的优缺点
二、国内外讨论现状当前,推举系统已经得到广泛应用,涉及到的领域包括但不限于电子商务、电影音乐、社交网络、新闻媒体等
已有许多机构和企业讨论过推举系统,并在实践中取得了一定的成绩
根据推举系统应用的领域和应用场景的不同,讨论领域主要可以分为以下几个方面:基于内容的推举、协同过滤推举、混合推举、社交网络推举等
针对 web 页面的推举,国内外已有多种方法被提出
根据传统的协同过滤方法,首先将用户浏览的历史记录提取出来,通过对浏览历史进行相似度计算,找到和用户浏览历史相似的其它用户或网页,然后给用户推举这些网页
基于内容的推举系统通常会对网页的标题、文本、图像等内容进行分析,然后根据这些特征来为用户推举相关网页
三、讨论内容本文将会设计一种基于用户浏览历史记录和兴趣标签的网页推举系统
具体讨论内容包括:1
数据预处理首先需要对已有的网页数据进行预处理,包括网页去重、提取网页特征等
精品文档---下载后可任意编辑2
兴趣标签提取通