电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

自然语言处理NLP论文VIP免费

自然语言处理NLP论文_第1页
1/12
自然语言处理NLP论文_第2页
2/12
自然语言处理NLP论文_第3页
3/12
1自然语言处理NLP论文1.引言做为人工智能(AI)的一个研究主题,自然语言处理(NLP)已经在一些系统中得到应用。人类使用自然语言(如汉语、英语)进行交流是一种智能活动。AI研究者们一直在尝试形式化处理自然语言所需要的过程机制,如把自然语言概念化为一种知识库系统以处理人与计算机的自然语言对话,并建立计算机软件来模型化这个处理过程。一种比较成熟和有效的方法并不使用显式的领域模型而是利用关键字或模式(Pattern)来处理自然语言。这种方法利用预先设计的结构存储有限的语言学和领域知识,输入的自然语言句子由预定义的含有指示已知对象或关系的关键字或模式的软件来扫描处理。这种方法也即做为一种自然语言接口与数据库系统或专家系统等进行连接,以检索其中的信息。通过学习国外相关应用案例,分析一个英语自然语言处理的模型系统,从而研究并实现基于WEB与汉语自然语言处理的地理信息查询系统模型。2.基于英语自然语言处理的系统模型Geobase2.1Geobase模型简介Geobase是针对一个地理信息系统的查询而研制的,其中用自然语言英语来查询地理信息数据库(VisualProlog可装入的一个文本文件)。通过输入查询的英语句子,Geobase2分析并转换这些英语句子为VisualProlog能够理解的形式,然后给出查询的答案。Geobase把数据库看做是由联系而联接起来的实体联系网络。实体是存储在数据库中的数据项,联系是联接查询句子中实体的词或词组,如句子CitiesinthestateCalifornia,这里的两个实体Cities和state是由联系in联接的,词the在这里被忽略,而California被看做是state实体的一个实例。Geobase通过将用户的查询与实体联系网络进行匹配来分析查询句子。如查询句子:whichriversrunthroughstatesthatborderthestatewiththecapitalAustin?首先忽略某些词:which、that、the、?,其结果查询句子为:riversrunthroughstatesborderstatewithcapitalAustin,其次找出实体与联系的内部名,实体可能有同义词、复数,联系也有同义词并可能由几个词组成等,经过转换后,查询句子为:riverinstateborderstatewithcapitalAaustin,通过查找statewithcapitalAustin的state,Geobase再找出与这个state相邻接的所有的states,最后找出runthrough(由assoc("in",["run","through"])转义为in)states的rivers。2.2数据库及实体联系网络数据库谓词举例如下:state(Name,Abbreviation,Capitol,Area,Admit,Population,City,City,City,City)city(State,Abbreviation,Name,Population)3实体联系网络结构schema(Entity,Assoc,Entity)如下:schema("population","of","state")schema("city","in","state")}实体对数据库查询的接口,通过谓词db和ent实现,如:db(ent,assoc,ent,string,string)ent(ent,string)2.3Geobase分析器分析器用来识别查询句子的结构,Geobase把查询的句子分类为九种类型。分析使用一种“差分表”方法,分析器中第一个参数是过滤后的表、第二个参数对应实体名,最后一个参数是分析器建立的查询结构,如:pars(LIST,E,Q):-s_attr(LIST,OL,E,Q),OL=[],!.Q为查询结构如分析句子“Howlargeisthetownnewyork?”,首先过滤器给出待分析词表:["large","town","new","york"],然后调用分析器谓词pars,即依次执行如下谓词:s_attr([BIG,ENAME|S1],S2,E1,q_eaec(E1,A,E2,X)):-第一个s_attr子句ent_name(E2,ENAME),由town转义为citysize(E2,BIG),匹配size("city","large")entitysize(E2,E1),匹配entitysize("city","population")schema(E1,A,E2),匹配schema("population","of","city")4get_ent(S1,S2,X),!.返回实体名等一旦分析器分析完一个句子,Geobase便调用谓词db和ent给出查询结果。3.Geobase模型的汉化研究及实现对Geobase模型的汉化研究即通过对Geobase及自然语言处理过程的汉化,使之能识别汉语句子的输入,并利用这个识别汉语句子的自然语言处理系统查询存储有中国地理信息的数据库。3.1汉语句子与英语句子特点汉语字或词与英语单词或词组一样既有复数形式,也有同义词。一个差别是:英语句子的每个单词之间是以空格分隔的,这使得在处理英语句子时比较方便,并且被分...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

自然语言处理NLP论文

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部