第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共6页改变科学研究思路的十个知识创新点——探索汉语理论建设及中文信息处理的新路邹晓辉qhkjy@yahoo.com.cn519125广东珠海井岸桥东恒美花园15-2栋201号摘要本文介绍《字本位与中文信息处理的基础》1贡献的十个知识创新点,即:汉语及中文的基本原理,信息和智的本质定义及基本分类,认知心理学双语协同存储原理,形式理论的受限原理,序位逻辑原理及工具,语言和知识的通用计算方法和量具,生产式教学及协同智能训练体系,(产、学、研、教、用、算)一体化(知识信息数据)管理。其重要性不仅在于指出自然语言与机器语言的互换路径,除直接形式化之外还有间接形式化道路对汉语形式理论建设和中文信息处理及基于中文的知识处理而言,后者更便捷而高效,而且还在于改变科学研究思路的十个知识创新点具有的整体功用。关键词汉语形式理论、中文信息处理、基于中文的知识处理、融智学的十个知识创新点1.引言在过去几年,基于语言学和信息学的融智学(如字本位与中文信息处理的基础)研究取得了长足进展[1义项语汇典例(SVDE)的总量控制模型(CLSW-5论文集)[1],重构“概念分类体系”的新思路与新方法(CLSW-6论文集)[2],优化“语义信息处理”的新方法与实施例(CLSW-6论文集)[3],字本位与中文信息处理[4];2理性的标准的协同智能模型(CAAI-11录用)[5],融智学的观点和方法(CAAI-11录用)[6],信息学基础研究(信息科学交叉研究学术研讨会2005北京)[7]和IntelligenceMeansInformationProcessing(智意味着信息处理)ZouXiaoHui(VIIInternationalOntologyCongress:RealorVirtual:fromPlato’sCavetoInternet2006,10,Spain)[8]]。然而也还有很多重要的问题没有得到满意的解决[如:3不同的信息观的分歧依然较大,信息本质的理论探讨仍在进行[9],汉语理论的本位问题仍未彻底解决[10],中文信息处理现有的三大流派[11]各自预期都是至少还需要几代人的努力才可望有所突破);4国际范围内语言与知识的计量问题仍然存在;5人类智力以及人工智能所涉及的智的概念的本质似乎仍未搞清(http://www.aaai.org)AI©2000-2007]。有鉴于此,本文系统地介绍了《字本位与中文信息处理的基础》提出的十个知识创新点,希望有助于改变汉语理论及中文信息处理的研究思路。它们体现的协同智能的观点、原理和方法至少可在“强人工智能”与“弱人工智能”之间形成必要张力。人脑与电脑的双脑结合及其相应的一整套“软件和数据库”系统实质上是(k+1)双文双语协同智能计算系统2。2.正文2.1领域字本位与中文信息处理,涉及语言学与信息学的一系列难题。这些问题中,最基础的是可否判断(如字词含义的消歧)与可否计算(如真实文本处理)两类问题。解答前者是人脑的擅长,解答后者是电脑的擅长。由于存在不可判断(ε)与不可计算(∞)这两类超出人脑与电脑处理范围的问题,因此笔者引入了(k+1)双文双语协同智能计算系统,把问题转化限制在可判断{0,1}与可计算{0,1}+{00,01,10,11}+…+{000…0,…,1…111}范围以内。于是,《字本位与中文信息处理的基础》实际上就是《融智学导论》3。1广东省优秀科技专著出版基金会2006专家论证通过正式资助将于2007年底/2008年初出版发行。2涉及拓广的(包容大、小字符集的)形式语言、形式文法、形式体系、形式理论和形式科学。3专门研究(狭义的)协同智能的概念、原理和方法及其典型实例的新型科学理论,涉及微观语言学与信息本体学两个基础分支。融智学导论对理论融智学、工程融智学和应用融智学的研究成果只做简单介绍。第2页共6页第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共6页2.2特殊性同样是研究自然语言,不同学科有不同的视角,基础语言学站在人类智能主体立场,采用自然人的视角;计算语言学站在人工智能代理立场,采用计算机的视角;融智学导论站在(k+1)双文双语协同智能计算系统“第三智能”立场,采用人机分工协作的视角。所谓“第三智能”就是继人脑智能和电脑智能之后而出现的协同智能,其特征在于:“人际、人机、机际、机人”之...