阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278248
用户头像

发布了 501 篇内容, 共 248.3 次阅读, 收获喜欢 57 次。

关注

评论

发布
暂无评论
发现更多内容

Vue-4-模板语法-1

Python研究所

前端 6月月更

『Three.js』起飞!

德育处主任

JavaScript canvas 前端可视化 three.js 6月月更

如何在使用 Flutter时切换应用时隐藏应用预览

坚果

6月月更

InfoQ 极客传媒 15 周年庆征文|Socket请求和Http请求特点、区别及适用场景

No Silver Bullet

HTTP请求 6月月更 InfoQ极客传媒15周年庆 Socket请求

Linux编程_网页视频监控项目

DS小龙哥

6月月更

HPCA名人堂成员蒋晓维博士,任职大禹智芯首席科学家

硬科技星球

人工智能 阿里巴巴 大禹智芯 蒋晓维

Java中的static关键字

龙空白白

运算符 (第二天)

Jason199

运算符 js 6月月更

python小知识-python作用域和闭包

AIWeker

Python python小知识

C#入门系列(十) -- 一维数组

陈言必行

C# 6月月更

悬赏任务源码开发设计构建时,要留意哪些事项

开源直播系统源码

源码 软件开发 直播系统 悬赏任务源码

Neo 黑客松获奖名单揭晓,上万美金花落谁家?

TinTinLand

区块链

企业无忧 | Apipost私有化部署活动即将火热开启

Xd

后端 apipost 接口测试工具

Django API 开发:视图设置和路由

宇宙之一粟

django 6月月更

Google搜索为什么不能无限分页?

蝉沐风

elasticsearch 深度分页

InfoQ 极客传媒 15 周年庆征文|【Python技能树共建】异常捕获预处理

梦想橡皮擦

Python 6月月更 InfoQ极客传媒15周年庆

Python时区转换的两种方式

红毛丹

Python 6月月更

SAP 云平台多目标应用 Multi-Target Application 的开发技术介绍

Jerry Wang

云原生 Cloud SAP CloudFoundry 6月月更

ADB 日志抓取

甜甜的白桃

android adb APK 6月月更

NFT链游GameFi系统开发,元宇宙游戏搭建

薇電13242772558

NFT 元宇宙 链游

设计千万级学生管理系统的考试试卷存储方案

Fan

架构师实战营

漫谈测试覆盖率

老张

软件测试 质量保障 质量度量

NFT铸造交易平台开发市场详情

开发微hkkf5566

【高并发】关于乐观锁和悲观锁,蚂蚁金服面试官问了我这几个问题!!

冰河

并发编程 多线程 高并发 异步编程 6月月更

Vue中created和mounted的区别

devpoint

Vue Vue3 InfoQ极客传媒15周年庆

SpringBoot应用使用自定义的ApplicationContext实现类

程序员欣宸

Java spring springboot Spring Framework 6月月更

知识图谱、图数据平台、图技术如何助力零售业飞速发展

蓝海大脑GPU

图计算 图数据分析 图数据一体机

MySql事务

工程师日月

6月月更

互联网公司研发效能团队为啥必须独立?何时独立?

laofo

互联网 DevOps cicd 研发效能 工程效率

ES6新特性class类

大熊G

JavaScript 前端 6月月更

Linux测试端口的连通性

龙空白白

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章