AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278546
用户头像

发布了 501 篇内容, 共 267.2 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

Forrester发布中国数据治理生态报告,亚信科技AntDB数据库等四款数智产品入选

亚信AntDB数据库

AntDB AntDB数据库

如何建设前端物料平台?

龙之幽谷

前端 组件化

企业级前端组件建设

龙之幽谷

前端 组件库

软件测试 | 测试开发 | InfluxDB 2.0 原理与应用实践

测吧(北京)科技有限公司

测试

用 nodejs 搭建脚手架

coder2028

node.js

软件测试 | 测试开发 | 一种能有效缓解环境噪声对音频质量干扰的方案

测吧(北京)科技有限公司

测试

元年洞察|数字化转型进程中的创新技术菜谱

元年技术洞察

数据中台 数字化转型 趋势研究

新书上市 | 连接组,向人类科学的最终前沿进军

图灵教育

神经网络 大脑 脑科学

运维学网络安全还是云计算好?哪个更有前景?

行云管家

云计算 运维 网络安全

javascript 高级编程 之 Array 用法总结

hellocoder2029

Vue

软件测试 | 测试开发 | Golang死信队列的使用

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Shell 进程通过 ContentProvider 实现跨进程通信

测吧(北京)科技有限公司

测试

Eclipse Theia技术揭秘——初识Theia

龙之幽谷

开发工具

Eclipse Theia技术揭秘——脚手架源码分析

龙之幽谷

开发工具

Eclipse Theia技术揭秘——自定义布局

龙之幽谷

开发工具

软件测试 | 测试开发 | 利用 rpush 和 blpop 实现 Redis 消息队列

测吧(北京)科技有限公司

测试

医疗卫生机构应该多久进行一次等保测评?

行云管家

网络安全 信息安全 等保测评 等级测评

软件测试 | 测试开发 | Pytorch GPU 训练环境搭建

测吧(北京)科技有限公司

测试

边缘计算在视频直播场景的应用与实践

火山引擎边缘云

边缘计算 视频直播 火山引擎边缘计算

JS基础——JS数据类型

龙之幽谷

前端 js

Eclipse Theia技术揭秘——构建桌面IDE

龙之幽谷

开发工具

软件测试 | 测试开发 | 自定义form表单验证

测吧(北京)科技有限公司

测试

AntDB数据库与鼎甲科技完成产品互认证,共筑数据安全防线

亚信AntDB数据库

AntDB AntDB数据库

新书上市 | 连接组,向人类科学的最终前沿进军

图灵社区

神经网络 大脑 脑科学

架构实战营模块1作业

乖乖IvyShine

软件测试 | 测试开发 | gitlab 服务端 hook, 拦截糟糕的提交到仓库

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Spring boot 之 RestTemplate访问

测吧(北京)科技有限公司

测试

认识 ESP-IDF-v4.3+工程结构(ESP32-C3应用调整示例)

矜辰所致

ESP32-C3 9月月更 ESP-IDF

企业级npm仓库搭建

龙之幽谷

前端 nexus NPM仓库

VSCode技术揭秘(一)

龙之幽谷

vscode 开发工具

leetcode 572. Subtree of Another Tree 另一棵树的子树 (简单)

okokabcd

LeetCode 数据结构与算法

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章