下载后可任意编辑全文检索系统整体方案12024 年 4 月 19 日下载后可任意编辑1全文检索系统方案 1.1全文检索需求1) 系统提供模糊检索、分类搜索、高级复合搜索、全文检索、图片内容检索、跨库检索等多种检索途径;2) 支持字索引和词索引;3) 检索条件具有完整的关键词布尔逻辑运算AND、OR、NOT 能力,支持复合式布尔逻辑运算查询,而且能够配合多组左括号"("与右括号")"作关键词查询优先级的设置;4) 提供用户多次递进查询的功能,用户可根据上一次查询关键词得到的检索结果集,增加查询关键词与缩小搜索日期范围,而得到更准确的查询结果集;5) 能够支持对以上文件中的中文(简体/繁体)、英文、日语、22024 年 4 月 19 日下载后可任意编辑韩语内容实现关键字检索;6) 支持对 Word、TXT、PDF 等多种主流文档格式全文检索,并提供开发接口以支持特别文档格式的全文检索;7) 在数据源数据发生更新时,能在索引库中反映出来,保证搜索的信息为最新,即支持增量索引机制;8) 用户可自行设定时间,让系统自动定时进行更新索引;9) 对于百万级记录数的搜索以及结合模糊搜索等查询方式,搜索时间不得超过 10 秒;10) 提供跨数据源、数据格式的搜索;11) 同过相关性搜索,能够把和搜索条件相关联的信息搜索出来;12) 不但能够对图片的描述信息进行搜索,还能对图片内容的检索;13) 提供 COM 与 SOAP 的搜索接口(Interface) 可让其它应用32024 年 4 月 19 日下载后可任意编辑程序或查询网页能够提供用户查询入口和查询结果的呈现,用户可经过应用程序或浏览器访问全文检索服务器,提交查询条件,可在浏览器中查看检索结果;14) 查询结果集中应包含结果集总数、命中的结果文件的完整路径,以及符合关键词出现的内容片断;15) 在搜索结果集中,关键词应被标识出来,用特别的字体及颜色和其它文字进行区别,查询者可在查询结果片断中一目了然的看到关键词出现的位置;16) 查询结果可根据关键词命中次数,命中结果文件的修改时间,大小等条件进行排序;17) 可提供用户对检索命中结果文件在索引库中进行标记,从而再次检索时,不在标记过的文件中进行查询;42024 年 4 月 19 日下载后可任意编辑1.2全文检索系统总体方案系统将采纳以下全文检索流程。针对企业内部的信息,包括文件服务器上的文件、网站网页、ERP 等系统存放信息的数据库信息、办公应用中的公文档案文档已经内容管理系统中流转的内容,本系统提供...