句法标注模型 人类社会进展的基本轨迹是:原始社会—农业社会—工业社会—信息社会
人工智能的目标是用计算机模拟人的智能,以最大限度地解放和延伸人的智能,无疑是信息社会的制高点
语言是人思维的物质外壳,人不可能离开语言而具备真正属于人的高级智能
因此,模拟人类语言智能的自然语言处理无疑是人工智能的重要讨论方向
然而,迄今为止的讨论表明,在可以预见的将来,语义处理将是自然语言处理的瓶颈所在
原因是语义十分复杂,而基于现有计算机软硬件的自然语言处理要求语义形式化
解决这一问题的根本之道是:探究新的句法标注模型,进行大规模的语义标注,基于语料库进行语义知识猎取和自然语言处理
一、句法标注模型 语言的复杂性在于语言与认识的关系
语言具有意义,而意义是入对主客观世界的认识结果
主客观世界的复杂性决定了意义的复杂性,进一步决定了语言的复杂性
语言本身又可以视为人的主客观世界中的一部分,因此语言讨论是一种特别的认识活动,是人对语言的认识
由此可见,语言离不开认识
人对主客观世界的认识可以如此描述:认识主体借助认识工具根据认识方法处理认识对象获得认识结果
认识是由多种认识因素共同作用的活动,认识结果是这一活动的产物,被多种认识因素共同决定,任何一种认识因素的改变必定导致认识结果出现或大或小的差异
显然,认识结果与认识对象不能等同,是认识主体对认识对象的选择性反映,认识具有主观能动性
从这个意义上讲
认识不可能也不应该去被动地还原认识对象,而是从符合主体目的性出发,力求简单有效地描述和预测认识对象
借用模型的概念,认识结果就是认识对象的模型,认识就是建立认识对象的模型,简称建模
这是一种有用主义认识观
模型一般分为心理模型、数学模型和物理模型
心理模型是认识对象在人认识中的定性关系,是数学模型的基础;数学模型是认识对象在人认识中的定量关系,是物理模型的基础;物理模型是人借助特定材料和工具根据