写点什么

Lucene 2.9:数字字段支持、新分析器及性能优化

  • 2009-09-27
  • 本文字数:583 字

    阅读完需:约 2 分钟

Apache Lucene 项目是一个完全用 Java 编写的高性能、全功能的文本搜索引擎库,最近它发布了 2.9 版。此次发布在 2.4.1 版的基础上进行了许多增强:

  • 单个 Segment 的查询及缓存,这使 reopen 操作的速度显著提高。
  • 为 IndexWriter 增加了接近实时的搜索功能。
  • 新的 Query 类型。
  • 更智能,伸缩性更强的多词(multi-term)查询(如 Wildcard,Range 等等)。
  • 最新优化过的 Collector/Scorer API。
  • 新增的 Unicode 支持及字符集(Collation)。
  • 基于 Attribute 的 TokenStream 新 API。
  • 在 contrib 中提供了新的 QueryParser 框架,并替换了核心实现。
  • 在基于字段搜索,或使用自定义的 Collector 的时候可取消 Score 功能,这样可以获得显著的性能提高。
  • 新的分析器(PesianAnalyzer,ArabicAnalyzer 即 SmartChineseAnalyzer)。
  • 为大型文本新增快速向量高亮工具(fast-vector-highlighter)。
  • 对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引,能直接支持简单而高效的数字范围查询,而不需要在外部对数字进行处理。

虽然 Lucene 团队打算在小版本的更新上做到完整的兼容,但是 Lucene 2.9 在不少方面破坏了这一点,详细信息可参考 Changes 文档中“向前兼容策略的改变(Changes in backwards compatibilit policy)”一节。Lucene 团队建议不要直接替换生产环境下的二进制包,而是在部署前重新编译应用程序,以便在出现兼容问题时获得提示并进行修补。

2009-09-27 04:252845
用户头像

发布了 157 篇内容, 共 57.6 次阅读, 收获喜欢 6 次。

关注

评论

发布
暂无评论
发现更多内容

【赠 3 日通票】4 月 10-12 日,融云「展位 B11」在 QCon 北京站恭候莅临~

融云 RongCloud

阿里云服务器对接高防的时候可能会出现的问题

网络安全服务

CDN udp DDoS 阿里云服务器 高防IP

终于等到机会!这轮周期牛市预计比特币涨到$50万左右

PowerVerse

VMware vSphere 7.0 Update 3u 发布 - 数据中心虚拟化和云原生平台

sysin

vSphere

SD-WAN怎样统一管理企业的分支机构网络?

Ogcloud

SD-WAN SD-WAN组网 sd-wan专线 SD-WAN厂家 分支组网

MiniMax 发布新 TTS 模型 Speech-02,轻松制作长篇有声内容;Meta 高端眼镜年底推出:售价上千美元丨日报

声网

PowerVerse&HiBao Cloud已在杭州、深圳、天津等地部署算力节点

PowerVerse

DePIN 去中心化云算力 DeCloud

SvelteKit 最新中文文档教程(17)—— 仅服务端模块和快照

冴羽

Vue 前端 React Svelte SvelteKit

开源协议不能随便选!选错直接被「背刺」

程序员晚枫

开源

什么是 StarRocks?核心优势与适用场景解析

镜舟科技

数据库 存算分离架构 StarRocks 实时分析 极速查询

突破极限: 高负载场景下的单机300M多行正则日志采集不是梦

阿里巴巴云原生

阿里云 云原生

食品行业数字化:MES系统解决方案

万界星空科技

mes 食品饮料行业数字化转型 食品MES 食品加工行业

CAD怎么插入PDF图纸

极客天地

Burp Suite Professional 2025.3 发布,引入 Burp AI 通过人工智能增强安全测试工作流程

sysin

burp

《汽车之家2024年ESG报告》发布 技术创新驱动行业可持续发展

科技大数据

StarRocks 助力首汽约车精细化运营

StarRocks

数据库 spark 存算分离 StarRocks 数据查询

SD-WAN专线怎样进行企业网络防护?

Ogcloud

SD-WAN SD-WAN组网 sd-wan专线 SD-WAN厂家

Kubernetes APIServer 可观测最佳实践

观测云

Kubernetes

局域网开会的视频会议软件推荐哪个?

BeeWorks

IM 即时通讯IM 私有化部署 企业级应用 局域网视频软件

中国上市企业精益战略

管理在线

精益管理体系

Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现

阿里巴巴云原生

阿里云 云原生

与 AI 共处 72 小时,没有食物、水、手机,会发生什么|寻找「赛博鲁滨逊」

声网

Flink Shuffle 技术演进之路

Apache Flink

大数据 实时计算 Flink Shuffle

Get 笔记:解锁演讲稿高效准备新密码

TechLead Studio

怎么用AI工具一键美化PPT?AI美化PPT步骤详解!

职场工具箱

人工智能 PPT 办公软件 AIGC AI生成PPT

<技术白皮书> 智能开发范式革新:iVX 图形化平台重塑软件开发生态

代码制造者

专用、轮式、人形全面布局:「普渡机器人」找到具身智能商业化最优解

机器人头条

科技 大模型 人形机器人 具身智能

CAD线型比例变了怎么办

极客天地

当实时消费遇到 SPL:让数据处理更高效、简单

阿里巴巴云原生

阿里云 云原生 sls

VMware vCenter Server 7.0U3u 发布 - 集中管理 vSphere 环境

sysin

vcenter

Fabric8 Kubernetes 教程——Metrics、Resource

FunTester

Lucene 2.9:数字字段支持、新分析器及性能优化_Java_赵劼_InfoQ精选文章