写点什么

Lucid Imagination 发布了 Apache Lucene 性能监测工具

  • 2009-09-11
  • 本文字数:1409 字

    阅读完需:约 5 分钟

Lucid Imagination 是一家采用 Apache Lucene 和 Solr 搜索引擎类库从事相关开发的商业公司,其引入了一个新的名叫 LucidGaze 的监测工具。该产品给开发者提供了一个针对 Lucene 的完整版本的性能监测工具。性能数据可以打印在日志文件中、存储在轮询数据库中、或者通过 Java API 来使用。如果使用了轮询数据库,则可以采用 RRD4j 类库提供的一个标准 Swing 应用程序来读取或处理该数据库。

该软件是以.jar 文件提供的,用来替代 Lucene 的.jar 文件,因此安装非常简单。开发者只需在其应用的 classpath 中将 lucene-core.2.4.1.jar 替换成 lucene-core-gaze.2.4.1.jar 即可。这样,开发者无需对其源码做出任何改变。而对于那些无法获得应用程序源代码的情况,该产品也能派上用场。

LucidGaze 给开发者提供了一系列分析方法,以观察搜索转换为文档检索操作的状况,索引分析分解用户输入处理的效果,以及文本处理和索引构建的过程。该工具使用 5 个不同的监视器来搜集统计数据:

  1. 分析统计数据:Analyzer、TokenFilter、TokenStream 和 Tokenizer 的相关数据,以及哪一个 Analyzer 被用来为特定域产生 TokenStream。
  2. 文档统计数据:已建索引文档的总数、以及索引的各个域。
  3. 索引统计数据: IndexReader 和 IndexWriter 的活动和行为,比如查看每个实例、跟踪其每个相关方法的调用、查看缓存及内存使用情况、以及索引增加和提交的平均时间。
  4. 搜索统计数据:查询操作、搜索器性能和处理时间、方法调用统计、以及对大多常用执行的查询。
  5. 存储统计数据: Lucene 存储架构的目录实例(directory instance)。

运行所有监视器的开销相当大。在与 Lucid Imagination 技术团队成员之一 Grant Ingersoll 的交谈过程中,我们得知这一范围大概在 10-15%。但是通过配置需要收集哪些统计数据以及这些数据是否需要被持久化,可以减少这一开销。

InfoQ 还与 Ingersoll 谈到了 LucidGaze 的一些典型应用。他所强调的第一种应用就是用其发现普通开发者使用 Lucene 时的常犯错误:没有关闭 IndexReader 而导致的内存泄漏。LucidGaze 搜集当前打开的 Indexeader 数量,IndexReader#reopen() 的调用次数以及其中哪一次调用是在 IndexReader 的新实例里,除此之外还有 JVM 中正在用的所有 IndexReader 所消耗的 RAM 总数。在捕捉因没有关闭 reader 而引起的内存泄漏时这些统计数据很有用处——如果你认为使用了两个 IndexReader 而内存中却有 10 个,那基本上可以肯定有地方泄漏了。第二个常见情况是在海量数据(创建和删除大量文档)站点的大量数据测试期间查看重建索引策略。Lucene 的索引数据库是由几个独立的“段(segment)”组成,每个都存储在一个独立的文件中。当你给索引增加一个文档时,可能会产生新的段。你可以压缩数据库以减少段的数量,从而加速查询,但是这样做是有开销的,而且计算出最佳策略需要大量的反复运算。LucidGaze 所提供的新创建索引段的数量、段合并的数量以及其发生的平均时间,可以帮助开发者调优其实现。该工具还可以用来查看在大量数据测试期间遇到的特定问题——分理出长时间运行的消耗过量资源的查询,或者精确定位导致处理瓶颈的域或文档。

尽管没有开源,但该产品是免费提供的,可以从 Lucid Imagination 的 Web 站点上下载。目前该软件只支持Lucene 2.4.1,但Lucid Imagination 表示如果需求量大,他们可能会提供对其它版本的支持。

查看英文原文: Lucid Imagination Releases Performance Monitoring Utility for Apache Lucene

2009-09-11 08:593050
用户头像

发布了 150 篇内容, 共 52.9 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

全新一代北斗三号短报文通信SoC芯片在北斗规模应用国际峰会发布

江湖老铁

云栖2025 | 阿里云自研大数据平台ODPS 重磅升级:全面支持AI计算和服务

阿里云大数据AI技术

大数据 阿里云 AI ODPS

双碳不是 “选择题”:EMS 让中小制造企业也能 “零成本启动减碳”

开源能源管理系统

开源 能源管理系统

从人工到AI,源码全送!我用华为云MaaS+OpenTiny 实现商城商品智能化管理

OpenTiny社区

前端 智能化 agent OpenTiny MCP

暴力拓客游戏小程序:助力商家高效引流与裂变的智能解决方案

微擎应用市场

扫码签到赢大奖小程序:助力多场景获客的智能工具

微擎应用市场

快递重量体积查询怎样实现用API来实现?

快递鸟

海信发布3A原画显示器G7 Ultra,首发价3299元

新消费日报

将 Claude Code 预置模型替换为火山方舟 Kimi-K2 指南

源鉴

AI kimi Claude-Code 火山方舟 claude-code-router

当 Chat BI 遇到瓶颈,“无问智推”如何改变工业数据消费范式?

TDengine

tdengine AI idmp

Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用

Immerse

众智FlagOS 1.5发布:统一开源大模型系统软件栈,更全面、AI赋能更高效

智源研究院

舆情监测的全球拼图:海外社交媒体监控如何补全战略视野

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

融合多元定位技术,帮助应用破解精准定位难题

HarmonyOS SDK

HarmonyOS NEXT HarmonyOS SDK应用服务

Qwen3-Omni发布:端到端全模态Thinker-Talker架构;Meta真实世界智能体基准Kimi K2开源最佳|日报

声网

就业驿站系统

深圳亥时科技

别等碳超支才慌!EMS 像 “碳导航”,提前预警能耗 “堵点”,双碳路上不绕路

开源能源管理系统

开源 能源管理系统

百度Feed实时数仓架构升级

百度Geek说

实时数仓 feed 流式计算

CAD块统计不用愁!一键操作轻松搞定

在路上

cad cad看图 CAD看图王

新活动抽奖小程序系统:开启高效互动新体验

微擎应用市场

快微同城小程序管理系统:打造专属同城综合信息服务平台

微擎应用市场

设施管理是干什么的?-ManageEngine卓豪

ServiceDesk_Plus

ManageEngine卓豪

如何分辨住宅 IP 与数据中心 IP ?

kookeey代理严选

数据中心 住宅ip 海外代理IP

CAD弧长测量:1 秒出结果,简单又准确!

在路上

cad

随笔丨唯有超越范式

阿星AI工作室

学习 AI 思考 工具 思维

唯品会商品列表API全解析:从搜索条件到分页查询的实战指南

tbapi

唯品会商品数据采集 唯品会API 唯品会商品列表接口 唯品会商品数据分析

从“被动付费”到“主动节流”:MyEMS如何用开源能力破解能源管理高成本困局?

开源能源管理系统

开源 开源能源管理系统

华为新品发布会迎来首款鸿蒙智慧屏!全新应用市场为您发现精品应用

最新动态

星云架构全景图解:从服务引擎到渲染层的组件流转路径

星云低代码中间件

低代码 中间件 开发工具 数字化 业务系统

KWDB MVP 计划正式启动!速来加入!

KaiwuDB

数据库

2025六恒系统品牌排行榜

新消费日报

Lucid Imagination发布了Apache Lucene性能监测工具_Java_Charles Humble_InfoQ精选文章