
OpenSearch软件基金会宣布 OpenSearch 3.0 正式发布,这是三年来的第一个主要版本,也是该项目加入 Linux 基金会以来的第一个版本。这个版本引入了对模型上下文协议(MCP)的原生支持,以及基于拉取(pull-based)的数据摄取和 gRPC 支持,旨在提高可扩展性和集成性。
OpenSearch 于 2021 年由 AWS 推出,作为Elasticsearch 7.10的一个分支,紧随 Elastic 的许可证变更之后。性能是本次发布的关键焦点,OpenSearch 3.0 提供了比 1.3 版本快 9.5 倍的向量搜索能力,这要感谢对 GPU 加速和更高效的索引支持。
OpenSearch 3.0 升级到 Apache Lucene 10,并引入了数据摄取、传输和管理方面的增强功能。AWS 的高级产品营销经理James McIntyre、AWS 的工程主管Saurabh Singh和 AWS 的高级系统开发工程师 Jiaxiang (Peter) Zhu 解释道:
最新版本的 Apache Lucene 在性能、效率和向量搜索功能方面有了显著的改进。这些类型的改进为更大的向量和搜索部署铺平了道路,使 AI 工作负载能够随着时间的推移而成倍扩展。
Lucene 10 在 I/O 和搜索并行性方面引入了改进,并且需要 JVM 版本 21 或更高的版本支持——这导致了一些破坏性的变更,并促使了主要版本的更新。Elasticsearch 去年在 AGPL 许可证下恢复了开源模式,最近发布了9.0.0-rc1版本,该版本也支持最新版本的 Lucene。
最新的 OpenSearch 版本还增加了对 gRPC 和基于拉取(pull-based)的摄取的支持,并引入了读写分离。这允许独立配置索引和搜索工作负载,确保每个工作负载的一致和高性能操作。McIntyre、Singh 和 Zhu 补充道:
得益于底层 HTTP/2 基础设施,gRPC 支持多路复用和双向数据流,使客户端能够在同一 TCP 连接上并发地发送和接收请求。对于处理大型复杂查询的用户来说,性能的提升尤其明显,因为在使用 JSON 时,反序列化请求的开销可能会增加。
OpenSearch 现在还支持索引类型检测,并集成了动态数据管理框架 Apache Calcite,支持迭代查询构建和探索。这是通过将查询生成器合并到 OpenSearch SQL 和 PPL 中来实现的。在Hacker News的一个热门帖子中,Joe Johnston 写道:
Elastic 在功能上仍然有优势。特别是 Kibana 比亚马逊的分支有有更多的功能(...)我的许多咨询客户最近似乎更喜欢 Opensearch。这主要是因为它的许可证更简单,以及 AWS 支持。
对比 OpenSearch 和 Elasticsearch,用户 Macha 补充道:
Opensearch 忽略了一件在最近的项目中非常好的事情,那就是丰富的处理器。
OpenSearch 在 Apache 2.0 许可证下是开源的。关于最新版本的更多详细信息可以在 GitHub 的发布说明中找到。
原文链接:
https://www.infoq.com/news/2025/05/opensearch-30-performance/
评论