【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278258
用户头像

发布了 501 篇内容, 共 248.9 次阅读, 收获喜欢 57 次。

关注

评论

发布
暂无评论
发现更多内容

架构师训练营第一期 - 第三周课后作业

卖猪肉的大叔

【架构师训练营 1 期】第三周作业

诺乐

小伙伴问我:如何搭建Maven私服?我连夜肝了这篇实战文章!!

冰河

maven 私服 仓库

让人一夜暴富的区块链,新时代革命的开始

CECBC

区块链 时代革命

团队出游筹备清单

boshi

团队建设 团队文化

一个草根的日常杂碎(10月4日)

刘新吾

随笔杂谈 生活记录 社会百态

架构师训练营 - 命题作业 - 第三周

徐时良

极客大学架构师训练营

第二节课后作业

happy

架构师训练营第一期-第三周学习总结

卖猪肉的大叔

极客大学架构师训练营

【架构师训练营 1 期】第三周学习总结

诺乐

Serverless Frist 的渐进式应用开发框架 Malagu

木香丘

开源 Serverless 云原生 Malagu Framework

架构师训练营第 1 期 - 第 3 周 - 学习总结

wgl

极客大学架构师训练营

Architecture Phase1 Week4:HomeWork

phylony-lu

极客大学架构师训练营

给计算机专业学生的几条建议

MySQL从删库到跑路

GitHub Linux vmware 大学生日常 计算机

Appium之「元素定位和UiAutomator表达式」

清菡软件测试

CECBC区块链专委会副主任吴桐主讲光大证券法定数字货币讲座

CECBC

区块链 数字货币

架构师训练营第 1 期 - 第 3 周 - 作业

wgl

极客大学架构师训练营

架构师训练营 Week4 - 课后作业

缓存 自动化 异步 集群 冗余

Serverless与传统Web框架的迁移

刘宇

Serverless

区块链与分布式存储构建数据要素市场基础设施

CECBC

区块链 分布式

Web Storage API的介绍和使用

程序那些事

web tech web storage web storage api storage api

架构师训练营第三周学习笔记

一马行千里

学习 极客大学架构师训练营

一个草根的日常杂碎(10月2日)

刘新吾

随笔杂谈 生活记录 社会百态

一个草根的日常杂碎(10月3日)

刘新吾

随笔杂谈 生活记录 社会百态

BigDecimal是如何搞定精度缺失的

hasWhere

LeetCode题解:49. 字母异位词分组,数组计数+哈希表,JavaScript,详细注释

Lee Chen

大前端 LeetCode

理想的程序员

极客思享

spring-boot-route(五)整合Swagger生成接口文档

Java旅途

Java springboot swagger

架构师训练营第四周学习总结

邓昀垚

极客大学架构师训练营

VUE第一个项目怎么读懂

MySQL从删库到跑路

Java html5 Vue 大前端 vux

架构师训练营 - 学习笔记 - 第三周

徐时良

极客大学架构师训练营

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章