下载后可任意编辑互联网环境法律信息猎取方法 一、引言 今日,计算机网络和信息技术的迅猛进展大大地推动了社会的进展,它的影响和溯及力已经遍布整个社会的方方面面,并且在法律领域逐渐显示出强有力的优势,无论是对日常的司法业务处理,还是法学讨论与司法办案决策都给予了新的方法和思路,越来越发挥着它的辅助支持作用
然而面对着网络中越来越错综复杂、难以描述的模糊问题和海量非结构化的数据,如何满足对其高效的查询请求,以更低的成本、更准确的数据和更迅捷的速度作出正确的决策,是当前信息猎取和利用所面临的关键问题
司法决策人员在查询目标不很明确的状况下选择决策依据时,注重的是如何从浩如烟海的数据中快速地调出与案件相关的法律、法规及判例,而不是遍历庞大的互联网或数据库资源漫无目标地搜寻
而目前大多数网络搜索引擎和信息猎取工具是基于检索提问式关键词匹配技术,在检索的过程中常常出现的两类主要问题是“信息过载”和“内容不匹配”
前者指在检索过程中系统返回的信息量过多,与查找相关或不相关的内容都冒出来,使用户应接不暇,难于接受;后者指因对同一个概念的表述出现多义、歧义,返回的信息并非用户真实的查询意图和内容,查准率和查全率都得不到保证
要解决网络环境中上述信息猎取存在的问题,实现真正意义上的面对法律领域的知识检索,从理论层面上,必须构建以法律领域知识为基础的用于语义检索的元数据标准,用来对网页中的相关信息标引和知识抽取,以便将用户查询请求准确地与网页上查询的法律知识目标相匹配;这就要求我们对来自网页或数据库的法律信息进行整理、组织和特征分析,依据法律领域专家所设计的法律信息法律规范标准,建立可利用和共享的法律知识单元和元数据,以达到智能和准确的语义检索,实现面对法律领域的知识猎取,为司法业务信息化和司法决策信息化提供更加有力的支撑
二、法律信息资源的构成与语义特征分析 (一)法律信息知识单元的组织 一般