写点什么

Lucene.Net: 一个顶级 Apache 项目和它的未来

  • 2012-12-25
  • 本文字数:1151 字

    阅读完需:约 4 分钟

Lucene.Net Lucene 全文检索开发库的 C#移植版本。其已经从孵化工场毕业并成为一个顶级的 Apache 项目。本文内容是采访 Prescott Nasser 时其谈到的有关该项目和 Solr.NET 的未来。

Lucene.Net 是对于 Java 版 Lucene 全文检索开发库逐字逐句的移植版本。在 2006 年时就已成为 Apache 的孵化项目但开发进展在某些时刻陷于停滞,尤其是在 2010 年 SVN 中几乎没有提交新内容。这个项目在2011 年重新启动并接连发布了 2.9.2,2.9.4 和 2.9.4g 版。最近 Lucene.Net 从孵化工场毕业成为一个顶级的 Apache 工程,并且将在接下来的几周建立一个新网站。这表明 Lucene.Net 项目目前比较活跃而且 Apache 委员会对该项目的健康发展充满信心。

在 InfoQ 采访一位代码贡献者 Prescott Nasser 时,其透露 Lucene.Net 团队正在准备发布 3.0.3 版本。每个版本都会与 Lucene 的 Java 版保持一致。

以下为采访稿:

“3.0.3 版与 Java 版的 Lucene3.0.3 在功能上将是一样的,两者之间的关系就是版本号相互匹配。而 Lucene.Net 的自行编译包的特性可能不会一模一样。毕竟我们的社区规模还比较小,时刻保持最新的工作量还是比较大的。”

日前,团队已有两个.NET 发布版,其中一个支持泛型,但在将来可能会有所变化:

“我们已经谈过很多关于如何使 API 更贴近.NET 使用规范的话题 (而不是 Java 规范)。泛型分支(2.4.9g)相比 2.9.4 版应用了更多的相关规范。我认为接下来我们会首先试着追上 Java 版 Lucene 的发布速度,之后将集中精力使其贴近于.NET 规范。这些工作将会逐渐融合在一起,像 2.9.4g 这样的分支版本会逐渐消失,在主版本中会将这些特性逐步的合并进来。”

虽然该项目路线图的规划意向是要赶上 Lucene/Java 的进度,但是这没有最后期限,就像 Nasser 承认的那样:“我们对于如何才能保持同步比较模糊,然而这没有划定时间表。对于我们接下来马上要做的就是完成 3.6 版,而且我们希望不用拖延太久就升级到 4.0 版本。”

至于谈到建立一个 Solr.Net 项目的时机,Nasser 是这样解释的:

“我们以前谈论过 Solr.Net,但现实是我们没有精力去完成它。我们绝对是认可它的价值的,而且知道我们的社区有这方面的需求。我们其实也想做些像 tiki 项目的.NET 版本。”

与此同时,Apache 基金会宣布了 Java 版 Lucene 和 Solr 的 4.0Beta 版,该版本有些新功能:可插拔式代码结构,灵活的评分机制,文档值 API,领域 API,优化及其他,详细内容可参看由 Mike McCandless(Lucene 参与者和 PMC 成员)发表的博客

查看英文原文 On Lucene.Net: Becoming a Top-level Apache Project and Its Future


感谢贾国清对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-12-25 01:414325
用户头像

发布了 21 篇内容, 共 74731 次阅读, 收获喜欢 1 次。

关注

评论

发布
暂无评论
发现更多内容

Milvus×Florence:一文读懂如何构建多任务视觉模型

Zilliz

微软 计算机视觉 Milvus 向量数据库 Florence

API 之旅的三个阶段

NGINX开源社区

读书笔记 最佳实践 API

新技术架构给集团企业身份管理体系带来的挑战

芯盾时代

身份安全 iam 数字化经济

如何评估测试工时?

老张

项目管理 软件测试 需求管理

淘宝直播弹幕数据接口爬虫项目技术文档

tbapi

淘宝API接口 淘宝直播间弹幕接口 淘宝直播间接口 淘宝数据分析接口

GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试

INSVAST

基因测序 基因数据分析 生信服务 生信分析 Sentieon

CRISPR-detector:快速、准确地检测、可视化和注释基因组编辑事件引起的全基因组范围突变

INSVAST

基因测序 基因数据分析 生信服务 生信分析 Sentieon

如何降低大模型训练与推理计算成本,以确保它们在软件研发中的有效应用?

思码逸研发效能

DevOps 研发效能 大模型 AI 基础设施 思码逸

构建高效AI工作流:打造灵活自动化的分步指南

代码忍者

Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

阿里云大数据AI技术

人工智能 最佳实践 PAI Qwen2.5-Coder

选择好的数据产品应当避免的六大坑|StartDT Talk

奇点云

大数据

昆仑万维「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试

新消费日报

开放创新,释放云上生产力 | 2024华为云开源开发者论坛盛大开启,邀您相约上海

华为云开发者联盟

开源 大会

RAG搭建中,如何选择最合适的向量索引?

Zilliz

向量数据库 rag 向量索引

软件测试丨Pytest生命周期与数据驱动

测试人

软件测试

火山引擎VeDI在AI+BI领域的演进与实践

字节跳动数据平台

华为鸿蒙智家,推开未来之家的三重门

脑极体

AI 鸿蒙智家

文献解读-Transcriptional Start Site Coverage Analysis in Plasma Cell-Free DNA Reveals Disease Severity and Tissue Specificity of

INSVAST

基因检测 基因数据分析 生信分析 Sentieon

PHP 互斥锁:如何确保代码的线程安全?

左诗右码

Lucene.Net:一个顶级Apache项目和它的未来_.NET_Abel Avram_InfoQ精选文章