Oracle 的全文检索技术Oracle 一直致力于全文检索技术的讨论,当 Oracle9i Rlease2 公布之时,Oracle 数据库的全文检索技术差不多专门完美,Oracle Text 使 Oracle9i具备了强大的文本检索能力和智能化的文本治理能力
Oracle Text 是Oracle9i 采纳的新名称,在 Oracle8/8i 中它被称作 Oracle interMedia Text
使用 Oracle Text,能够方便而有效地利用标准的 SQL 工具来构建基于文本的新的开发工具或对现有应用程序进行扩展
应用程序开发人员能够在任何使用文本的 Oracle 数据库应用程序中充分利用 Oracle Text 搜索,应用范畴能够是现有应用程序中可搜索的注释字段,也但是实现涉及多种文档格式和复杂搜索标准的大型文档治理系统
Oracle Text 支持 Oracle 数据库所支持的大多数语言的差不多全文搜索功能
尽管大多数大型数据库都支持全文检索,但 Oracle 在这方面无疑是最杰出的
Oracle 能搜索多种格式的文档,如 Word,Execl,PowerPoint,Html,PDF等等
但在使用中也发觉有遗憾的地点,Oracle Text 不管使用何种过滤器(INSO_FILTER 或 NULL_FILTER)及何种词法分析器(BASIC_LEXER, CHINESE_VGRAM_LEXER 依旧 CHINESE_LEXER)都不能检索出中文内容的文本文档(TXT,RTF)
1 Oracle Text 的体系架构下图是 Oracle Text 的体系架构:图 1 Oracle Text 的体系架构Oracle Text 索引文档时所使用的要紧逻辑步骤如下: (1)数据储备逻辑搜索表的所有行,并读取列中的数据
通常,这只是列数据,但有些数据储备使用列数据作为文档