2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Lucene 2.9:数字字段支持、新分析器及性能优化

  • 2009-09-27
  • 本文字数:583 字

    阅读完需:约 2 分钟

Apache Lucene 项目是一个完全用 Java 编写的高性能、全功能的文本搜索引擎库,最近它发布了 2.9 版。此次发布在 2.4.1 版的基础上进行了许多增强:

  • 单个 Segment 的查询及缓存,这使 reopen 操作的速度显著提高。
  • 为 IndexWriter 增加了接近实时的搜索功能。
  • 新的 Query 类型。
  • 更智能,伸缩性更强的多词(multi-term)查询(如 Wildcard,Range 等等)。
  • 最新优化过的 Collector/Scorer API。
  • 新增的 Unicode 支持及字符集(Collation)。
  • 基于 Attribute 的 TokenStream 新 API。
  • 在 contrib 中提供了新的 QueryParser 框架,并替换了核心实现。
  • 在基于字段搜索,或使用自定义的 Collector 的时候可取消 Score 功能,这样可以获得显著的性能提高。
  • 新的分析器(PesianAnalyzer,ArabicAnalyzer 即 SmartChineseAnalyzer)。
  • 为大型文本新增快速向量高亮工具(fast-vector-highlighter)。
  • 对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引,能直接支持简单而高效的数字范围查询,而不需要在外部对数字进行处理。

虽然 Lucene 团队打算在小版本的更新上做到完整的兼容,但是 Lucene 2.9 在不少方面破坏了这一点,详细信息可参考 Changes 文档中“向前兼容策略的改变(Changes in backwards compatibilit policy)”一节。Lucene 团队建议不要直接替换生产环境下的二进制包,而是在部署前重新编译应用程序,以便在出现兼容问题时获得提示并进行修补。

2009-09-27 04:252909
用户头像

发布了 157 篇内容, 共 58.7 次阅读, 收获喜欢 6 次。

关注

评论

发布
暂无评论
发现更多内容

unittest框架

Flychen

Python 自动化测试 unittest

2020年4月北京BGP机房网络质量评测报告

博睿数据

运维 服务器 机房 数据中心 评测

Android | Tangram动态页面之路(七)硬核的Virtualview

哈利迪

android

谈谈控制感(8):元控制感

史方远

职场 心理 成长

投机者

Neco.W

投机 口罩 头盔 投机者

Java 简介

编号94530

Java jdk java简介 jdk8

系统化服务构建-调用链管理

图南日晟

微服务 全链路监控 链路追踪

Jenkins:批量自动将 Maven 类型 Job 迁移到自由风格类型

donghui

jenkins

【写作群星榜】本周写作平台优秀作者&文章排名

InfoQ写作社区官方

写作平台 排行榜 热门活动

【Howe 学 JAVA】断点续传原理精析及简单实现

Howe

Java 断点续传

SpringCloud之服务提供者与消费者

北漂码农有话说

真香!谷歌终与美国国防部合作,签署百万美金云服务合同

神经星星

云计算 互联网巨头 互联网 谷歌Google

自我革新最难的是革自己的命

史方远

职场 成长

用 R 语言打个印咋就这么费事儿呢

张利东

可视化 R

一文读懂Java注解

JFound

Java

力扣刷题盛行,风气由何而来?

南湾小猪

刷题

从40万美元创业到执掌5500亿美元的帝国,聊聊《苏世民:我的经验与教训》这本书

万佳

读书笔记 商业 苏世民 金融 企业管理

如何为一家移动游戏公司制定产品策略(严肃长文)

谢锐 | Frozen

游戏出海 手机游戏

职场提问的“唐太宗”原则

大伟

写给管理者的睡前故事

石云升

读书笔记 故事 管理者

学会独立思考的前提

fahsa

自我提升

突然的自我

月白

自我思考

【有奖调研】大数据与人工智能从业者有奖需求用研

Apache Flink

大数据 flink 流计算 实时计算

现代生活对我们大脑的危害

董一凡

生活质量

回“疫”录(23):如果岁月可回头

小天同学

疫情 个人成长 回忆录 现实纪录 纪实

Dubbo - 初识Apache Dubbo

Java收录阁

dubbo

系统服务构建-BFF 助力前后端分离

图南日晟

php 微服务 BFF

工厂模式——这一篇真够了

大头星

Java 架构 面试 设计模式 工厂模式

G-P-M 调度模型深度解析之手撸一个高性能 goroutine 池

潘建锋

并发编程 协程 Go 语言

乙己说:LFU实现思路整理

再见小飞侠

缓存 LeetCode

Android与JS的交互:JsBridge的简单使用

码字与律动

Java android

Lucene 2.9:数字字段支持、新分析器及性能优化_Java_赵劼_InfoQ精选文章