电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

语义分析报告地一些方法

语义分析报告地一些方法_第1页
1/50
语义分析报告地一些方法_第2页
2/50
语义分析报告地一些方法_第3页
3/50
word 1 / 57 语义分析的一些方法 ( 上篇)人工智能林17 小时前70℃0 评论火光摇曳语义分析的一些方法〔上篇〕语义分析的一些方法〔中篇〕语义分析的一些方法〔下篇〕语义分析, 本文指运用各种机器学习方法,挖掘与学习文本、 图片等的深层次概念。wikipedia上的解释: In machine learning, semantic analysis of a corpus is the task of building structures that approximate concepts from a large set of documents(or images)。工作这几年,陆陆续续实践过一些项目,有搜索广告,社交广告,微博广告,品牌广告,内容广告等。要使我们广告平台效益最大化,首先需要理解用户,Context( 将展示广告的上下文 ) 和广告,才能将最适宜的广告展示给用户。而这其中,就离不开对用户, 对上下文,对广告的语义分析, 由此催生了一些子项目,例如文本语义分析,图片语义理解,语义索引,短串语义关联,用户广告语义匹配等。接下来我将写一写我所认识的语义分析的一些方法,虽说我们在做的时候, 效果导向居多, 方法理论理解也许并不深入,不过权当个人知识点总结, 有任何不当之处请指正,谢谢。本文主要由以下四局部组成:文本根本处理,文本语义分析,图片语义分析,语义分析小结。 先讲述文本处理的根本方法,这构成了语义分析的根底。 接着分文本和图片两节讲述各自语义分析的一些方法,值得注意的是, 虽说分为两节, 但文本和图片在语义分析方法上有很多共通与关联。最后我们简单介绍下语义分析在广点通“用户广告匹配〞上的应用,并展望一下未来的语义分析方法。1 文本根本处理在讲文本语义分析之前, 我们先说下文本根本处理, 因为它构成了语义分析的根底。而文本处理有很多方面,考虑到本文主题,这里只介绍中文分词以与Term Weighting 。1.1 中文分词拿到一段文本后,通常情况下,首先要做分词。分词的方法一般有如下几种:word 2 / 57 ? 基于字符串匹配的分词方法。 此方法按照不同的扫描方式, 逐个查找词库进展分词。根据扫描方式可细分为:正向最大匹配,反向最大匹配,双向最大匹配,最小切分 ( 即最短路径 ) ;总之就是各种不同的启发规如此。? 全切分方法。 它首先切分出与词库匹配的所有可能的词,再运用统计语言模型决定最优的切分结果。 它的优点在于可以解决分词中的歧义问题。如下图是一个示例,对于文本串“某某市长江大桥〞,首先进展词条检索( 一般用...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

语义分析报告地一些方法

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部