Apache Lucene 4.9 发布

  • 李士窑

2014 年 7 月 1 日

话题:Java语言 & 开发

Apache 软件基金会近日正式发布了 Lucene 4.9 版本。由于老的 JDK 版本的一些 JVM bug 会影响到 Lucene,所以新版本的 Lucene 不再支持 JDK 7u55 以下的 Java 版本,且版本全面兼容 Java 8。

Lucene 4.9 版本包括大量的 bug 修复、优化和改进,现已提供下载Lucene 4.9 更新文档)。主要改进包括:

  1. 一组 doc 值字段的原子更新(Atomic update)
  2. 针对 doc 值搜索性能的大量优化
  3. 新增了 Terms.getMin/Max 方法,用于检索每个字段中使用率最高和最低的项(term)
  4. 新增了 IDVersionPostingsFormat 方法,优化了主键 ID filed,也为每个 id 记录了一个 long 型的版本值,优化了 ID 查找功能
  5. 新的(默认的)Lucene49NormsFormat 方法,可以在某些情况下(比如超短字段)实现更好的压缩
  6. 新的 SORTED_NUMERIC 文档值类型,可以更有效地处理多个值的数字字段
  7. 索引现在可以传递早期的令牌流,使得重用更容易
  8. MoreLikeThis 可以接受每个字段中的多个值,pre-existing 方法已经不再鼓励使用
  9. Lucene 文件现在通过 OutputStream 编写,完全禁止通过简化的 IO API 进行搜索

Apache Lucene 是一个使用 Java 开发的高性能的全文检索引擎,读者可以从这里下载最新版本的Lucene, 详细的改进说明可以阅读Lucene ChangeLog。此外,基于 Lucene 的 Solr 也更新到了 4.9 版本,Solr 4.9 中除了包含 Lucene 4.9 的改进外,还针对企业搜索应用进行了优化和改进,读者可以到其官网了解相关信息

Java语言 & 开发