写点什么

Lucene 2.9:数字字段支持、新分析器及性能优化

  • 2009-09-27
  • 本文字数:583 字

    阅读完需:约 2 分钟

Apache Lucene 项目是一个完全用 Java 编写的高性能、全功能的文本搜索引擎库,最近它发布了 2.9 版。此次发布在 2.4.1 版的基础上进行了许多增强:

  • 单个 Segment 的查询及缓存,这使 reopen 操作的速度显著提高。
  • 为 IndexWriter 增加了接近实时的搜索功能。
  • 新的 Query 类型。
  • 更智能,伸缩性更强的多词(multi-term)查询(如 Wildcard,Range 等等)。
  • 最新优化过的 Collector/Scorer API。
  • 新增的 Unicode 支持及字符集(Collation)。
  • 基于 Attribute 的 TokenStream 新 API。
  • 在 contrib 中提供了新的 QueryParser 框架,并替换了核心实现。
  • 在基于字段搜索,或使用自定义的 Collector 的时候可取消 Score 功能,这样可以获得显著的性能提高。
  • 新的分析器(PesianAnalyzer,ArabicAnalyzer 即 SmartChineseAnalyzer)。
  • 为大型文本新增快速向量高亮工具(fast-vector-highlighter)。
  • 对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引,能直接支持简单而高效的数字范围查询,而不需要在外部对数字进行处理。

虽然 Lucene 团队打算在小版本的更新上做到完整的兼容,但是 Lucene 2.9 在不少方面破坏了这一点,详细信息可参考 Changes 文档中“向前兼容策略的改变(Changes in backwards compatibilit policy)”一节。Lucene 团队建议不要直接替换生产环境下的二进制包,而是在部署前重新编译应用程序,以便在出现兼容问题时获得提示并进行修补。

2009-09-27 04:252936
用户头像

发布了 157 篇内容, 共 59.2 次阅读, 收获喜欢 6 次。

关注

评论

发布
暂无评论
发现更多内容

自古彭城列九州 龙争虎斗几千秋|靠谱点评

无量靠谱

我一怒之下写了个抄袭举报工具!只因一觉醒来我的文章被多个平台抄袭!

1_bit

Python selenium 签约计划 文本分析 文章查重

区块链国富论——财富不是物,而是全球信用共识

CECBC

黄金交易

自己挖的坑,自己填|靠谱点评

无量靠谱

声网 Agora 初体验

若尘

声网 Agora

如何高效率的工作

程序员海军

工作效率 提升效率

从零开始带你打开批处理大门

xiezhr

doc 批处理 cmd

干货版“测试小品”欢乐场景

清菡软件测试

自动化测试

Prometheus官方文档Querying[三]function

卓丁

2021 年带你漫游语音识别技术

清秋

人工智能 语音识别 智能音箱 签约计划 4月日更

【音视频】手把手带你实现超实用实时音视频工具

轻口味

android 音视频 WebRTC 移动端 OpenGL ES

一篇文章带你彻底了解MySQL各种约束

若尘

MySQL 数据库 约束 4月日更

ffmpeg完美实现解封装操作!

txp

音视频

100万级车辆数据监控的hadoop大数据架构探索与实践

黑马腾云

大数据 flink hadoop 分布式 车联网

线程池的引入和实践案例分享

小诚信驿站

线程池 线程池工作原理

Linux rm 命令

一个大红包

4月日更

这些相见恨晚的命令行工具,你用过几个?

wangkx

bash Linux Tool

聪明人的训练(十一)

Changing Lin

4月日更

机器学习水水笔记之——世界是积木吗?

Nydia

签约计划

一文带你了解如何排查内存泄漏导致的页面卡顿现象

零一

chrome 大前端 浏览器 内存泄露 问题处理

面向小白使用Git 的手册

程序员海军

git

园区网的网关部署在接入层还是汇聚层 面试官与求职者之间谈话

艺博东

网关 交换机 网络配置

如何从零搭建技术团队

石云升

团队建设 28天写作 职场经验 管理经验 4月日更

推荐18个 Vue常用组件库

程序员海军

Vue 组件库

和面试官简单聊聊 Elasticsearch

escray

elasticsearch elastic 4月日更 技术编辑能力考核

手把手教你基于Prometheus搭建监控告警系统

Java全栈封神

云原生 Prometheus 监控告警

从运营、产品和技术,多角度思考电商的营销体系建设

邴越

电商营销 优惠券

uni-app跨端开发H5、小程序、IOS、Android(八):理解uni-app生命周期

黑马腾云

小程序 uni-app ios android H5

移动端混合开发选型方案分析

花花

移动开发 移动端 签约计划

Java检查异常、非检查异常、运行时异常、非运行时异常的区别

Sakura

4月日更

JavaScript 中的执行上下文和执行栈 的理解

程序员海军

JavaScript 大前端 上下文 执行栈

Lucene 2.9:数字字段支持、新分析器及性能优化_Java_赵劼_InfoQ精选文章