电视节目的个性化搜索研究摘 要电视节目是人们普遍喜欢的娱乐方式之一。然而随着电视技术的高速发展,电视节目日益丰富的,人们不知不觉中已深处在电视节目的海洋中。电视节目包含了文本字幕,因而对电视节目的查找可间接地转换为对电视文本的搜索。为了帮助用户快速地查找到喜爱的电视节目,针对电视节目的个性化搜索进行了研究,并开发了一个小型的个性化电视节目搜索原型系统。本文主要研究了基于文本的电视节目的个性化搜索,在文章最后可以看到个性化搜索算法可以显著提高搜索质量。关键词:个性化搜索,用户兴趣模型,查询扩展,用户反馈一、引言电视节目是人们普通的娱乐方式;然而随着电视技术的高速发展,出现了诸如电缆、光缆、微波、卫星等多种传播方式。我国的鑫诺通信卫星可可同时支持两百余套标准清晰度电视节目;人们不知不觉中已深处在电视节目的海洋中。为了帮助用户快速地查找到喜爱的个性化电视节目,针对电视节目的个性化搜索进行了研究。在我们的系统中,我们是基于如下假定:每个电视节目都有一个对应的具有固定格式且具有类别信息的描述文本,所以对电视节目的搜索可以转换为对电视文本的搜索。二、个性化搜索引擎研究综述个性化搜索引擎目的是为了建立的通用搜索引擎之上的新一代的搜索引擎,它的目标是消除当前搜索引擎缺点即结果相关性低和“千人一面”等缺点。2.1 个性化搜索框架如下图所示,我们设计的电视节目个性化搜索系统共分为 6 个子系统:分别是处于最底层的自然语言处理子系统和网络蜘蛛子系统、处于次底层的存储子系统和索引子系统。图 2-1 电视节目个性化搜索系统架构处于中间层的通用搜索系统和个性化搜索子系统,处于最高层的用户查询处理子系统。其中个性化搜索子系统又包括了四个子模块,分别为用户兴趣模型模块,用户反馈模块,语义库模块和以语义库为基础的查询扩展模块。我们的系统通用搜索引擎在此基础上,添加了基于用户兴趣模型,用户查询关键字的扩展,用户相关反馈等三个要素,使经典的搜索引擎具有了个性化搜索的特征。由上面可以看出,我们的电视节目个性化搜索系统是有九大模块组成的,每个模块具有各自相对对立的功能(高内聚),而各个模块间紧密联系(低耦合),一起共同实现了电视节目的个性化搜索的功能。我们的系统是通过在原理的基础上增加了用户兴趣模型、用户查询扩展和用户反馈等中间层的子系统来实现搜索引擎的个性化。所以接下我们将介绍整个系统各个子系统的设计和实现,...