Lucene 2.9：数字字段支持、新分析器及性能优化_Java_赵劼_InfoQ精选文章



 写点什么

登录/注册

Apache Lucene 项目是一个完全用 Java 编写的高性能、全功能的文本搜索引擎库，最近它发布了 2.9 版。此次发布在 2.4.1 版的基础上进行了许多增强：

单个 Segment 的查询及缓存，这使 reopen 操作的速度显著提高。
为 IndexWriter 增加了接近实时的搜索功能。
新的 Query 类型。
更智能，伸缩性更强的多词（multi-term）查询（如 Wildcard，Range 等等）。
最新优化过的 Collector/Scorer API。
新增的 Unicode 支持及字符集（Collation）。
基于 Attribute 的 TokenStream 新 API。
在 contrib 中提供了新的 QueryParser 框架，并替换了核心实现。
在基于字段搜索，或使用自定义的 Collector 的时候可取消 Score 功能，这样可以获得显著的性能提高。
新的分析器（PesianAnalyzer，ArabicAnalyzer 即 SmartChineseAnalyzer）。
为大型文本新增快速向量高亮工具（fast-vector-highlighter）。
对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引，能直接支持简单而高效的数字范围查询，而不需要在外部对数字进行处理。

虽然 Lucene 团队打算在小版本的更新上做到完整的兼容，但是 Lucene 2.9 在不少方面破坏了这一点，详细信息可参考 Changes 文档中“向前兼容策略的改变（Changes in backwards compatibilit policy）”一节。Lucene 团队建议不要直接替换生产环境下的二进制包，而是在部署前重新编译应用程序，以便在出现兼容问题时获得提示并进行修补。

评论

发布

暂无评论

疫情期间宅在家的这段时间，突然收到（余额宝，java架构师技术进阶路线图下载

Java 程序员后端

用10个真实案列带你掌握MySQL调优，开发人员必学

Java 程序员后端

看完这篇，别人的开源项目结构应该能看懂了，kafka入门与实践百度云

Java 程序员后端

直击阿里“远程面试”现场，linux驱动开发入门与实战

Java 程序员后端

疫情降至，我只花了7天，经历三个步骤拿到了腾讯offer，springmvc面试题常问2020

Java 程序员后端

理解RabbitMQ中的AMQP-0-9-1模型，深入java虚拟机第三版百度网盘

Java 程序员后端

真666！阿里资深架构师熬夜纯手写的238页微服务容器化开发实战笔记

Java 程序员后端

真香现场！全网首发Spring5秘籍手册+知识导图，记得把每一次面试当做经验积累

Java 程序员后端

知乎万赞：Java程序员的悲哀竟然是，java编程思想百度云

Java 程序员后端

看一遍就理解：动态规划详解，双非渣本Java四年磨一剑

Java 程序员后端

男默女泪！阿里技术官的Docker+K8S手册(1)，java研发工程师面试问题

Java 程序员后端

百度、阿里、美团，java敏捷开发模式面试题

Java 程序员后端

架构实战营模块2课后作业

架构实战营

看这篇就够了！RabbitMQ如何防止数据丢失，详细讲解，linux教程课后答案孟庆昌

Java 程序员后端

知乎头条。纯干货：深度认识Sharding-JDBC，mybatis连接数据库原理

Java 程序员后端

硬核解析，巧用案例学习jQuery框架三种事件绑定方式，最新阿里+头条+腾讯大厂Java笔试真题

Java 程序员后端

用10个真实案列带你掌握MySQL调优(1)，springboot注解原理

Java 程序员后端

疫情在家刷了几个月的面试题及算法，我终于拿到了字节跳动offer

Java 程序员后端

真香！前阿里P8甩我一份内部SpringCloud笔记手册，竟然在Github上点击破百万

Java 程序员后端

硬核图解！断网了，还能ping通 127，高性能mysql笔记

Java 程序员后端

架构实战营- 模块二

瓜子葫芦侠

「架构实战营」

硬核！阿里内部这份《Java面试核心知识手册，面经解析

Java 程序员后端

用时半个月，终于把2020年各大公司的Java面试题精选整理成文档了

Java 程序员后端

瞬间霸榜，收藏第一的“kafka学习笔记，java图片转视频

Java 程序员后端

硬核！逛了5年的Github一口气把我收藏的JAVA开源项目分享给你

Java 程序员后端

男默女泪！阿里技术官的Docker+K8S手册，java开发视频直播

Java 程序员后端

看完这篇文章，你对Redis持久化的迷惑就全解开了，超全面

Java 程序员后端

看完这篇，面试再也不怕被问 Webpack 热更新，java原理及插件

Java 程序员后端

知乎：怎么评价程序员35岁了还在撸代码？，java实用教程第五版电子书答案

Java 程序员后端

linux中同时移动多种格式文件

用了这么多年分页PageHelper，你确定你真的会用吗？，mysql应用教程李辉答案

Java 程序员后端