Solr+Tomcat 安装配置及二次开发使用说明 1. Solr 介绍 Solr 它是一种开放源码的、基于 Lu cene Jav a 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 等格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。可以使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。Solr 的特性包括: 高级的全文搜索功能 专为高通量的网络流量进行的优化 基于开放接口(XML 和 HTTP)的标准 综合的HTML 管理界面 可伸缩性-能够有效地复制到另外一个 Solr 搜索服务器 使用XML 配置达到灵活性和适配性 可扩展的插件体系 2. Lucene 介绍 Lu cene 是一个基于 Jav a 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lu cene 目前是 Apache Jakarta(雅加达) 家族中的一个开源项目。也是目前最为流行的基于 Jav a 开源全文检索工具包。目前已经有很多应用程序的搜索功能是基于 Lu cene ,比如Eclipse 帮助系统的搜索功能。Lu cene 能够为文本类型的数据建立索引,所以你只要把你要索引的数据格式转化的文本格式,Lu cene 就能对你的文档进行索引和搜索。 3. Solr vs Lucene Solr 与 Lu cene 并不是竞争对立关系,恰恰相反 Solr 依存于 Lu cene,因为Solr 底层的核心技术是使用Lu cene 来实现的,Solr 和 Lu cene 的本质区别有以下三点:搜索服务器,企业级和管理。Lu cene 本质上是搜索库,不是独立的应用程序,而 Solr 是。Lu cene 专注于搜索底层的建设,而 Solr 专注于企业应用。Lu cene不负责支撑搜索服务所必须的管理,而 Solr 负责。所以说,一句话概括 Solr: Solr是Lu cene 面向企业搜索应用的扩展。 Solr 与 Lu cene 架构图: Solr 使用Lu cene 并且扩展了它! 一个真正的拥有动态字段(Dynamic Field)和唯一键(Unique Key)的数据模式(Data Schema) 对 Lucene 查询语言的强大扩展! 支持对结果进行动态的分组和过滤 高级的,可配置的文本分析 高度可配置和可扩展的缓存机制 性能优化 支持通过 XML 进行外部配置 拥有一个管理界面 可监控的日志 支持高速增量式更新(Fast incremental...