写点什么

基于 Lucene 的分布式搜索引擎: Elasticsearch 1.3.0 发布

  • 2014-08-04
  • 本文字数:1010 字

    阅读完需:约 3 分钟

ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 的搜索引擎,且遵守 Apache2 协议。ElasticSearch 还能够用于云计算中,且能够满足实时搜索的需要,具有稳定、可靠、快速、安装使用方便等特点。它支持通过HTTP 使用JSON 进行数据索引,还可以通过集成插件的方式,支持Thrift、Servlet、Memcached、ZeroMQ 等的传输协议。近日, Elasticsearch 1.3.0 版本发布,它是最新的稳定版本,且基于 Lucene 4.9。该版本不仅添加了许多新功能,还提高了安全性、稳定性和性能,同时修复了大量的 bug,建议对索引性能有很高要求的应用进行版本升级。主要改进包括:

  • 默认禁用了 JSONP,提高了安全性
  • 默认启用磁盘空间分配决策者
  • 提高了 StemmerTokenFilter 的性能
  • 移除不必要的中间接口
  • 移除不安全的、非法的内存访问方法
  • 实现了主机的在异步方式下即可更新映射
  • 使用 429 错误码替换 503 的错误码反馈到客户端
  • 新增了 percentiles_rank 聚集
  • 新增了 top_hits 聚集
  • 新增了 Lucene 表达式脚本引擎
  • 新增了对 Groovy 脚本语言支持和 Groovy 沙盒
  • 实现了存储在索引中的搜索模板在搜索时可以被检索和使用
  • 能够运行存储在.scripts 索引中的脚本或者模板
  • Elasticsearch 可以在内存里跟踪最近索引文档的版本,自动清理版本映射
  • Translog 刷新阀值不再由日志的数量控制,而是以日志的字节数量大小控制。
  • 在索引过程中可以自动调整用做索引缓存区的 RAM 数量

由于 Elasticsearch 具有能够实时搜索、开源、稳定、快速、支持分布式等众多优点,所以许多国外著名的公司都在使用 ElasticSearch,如 Github、Mozilla、Sony 等公司,其中我们所熟知的 Github 在 2013 年 1 月升级了他的代码搜索,由 Solr 转为 Elasticsearch。目前它的集群规模为 26 个索引存储节点和 8 个客户端节点(负责处理搜索请求),能够搜索 20TB 的数据,这些数据包括 13 亿的文件和 1300 亿行的代码。

Elasticsearch 1.3.0 发布的同时, Elasticsearch 1.2.3 也发布了,它是 1.2.x 系列版本的一个 bug 修复版本,详细信息参见该版本的发布页面

欲知Elasticsearch 更多相关详细信息,请登录其首页查看。 Elasticsearch 1.3.0 已经提供了 ZIP TAR.GZ DEB RPM 多种格式的下载源,开发者可以根据自己的操作系统选定合适的格式下载。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-04 01:414730
用户头像

发布了 92 篇内容, 共 52.0 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

开发质量提升系列:checklist投产检查列表(上)

罗小龙

代码质量 28天写作 checklist

碎碎念之「技术文档写作风格」

Justin

碎碎念 文档 28天写作 写作技巧

架构师训练营 - 第四周作业

Mark

LeetCode题解:105. 从前序与中序遍历序列构造二叉树,Simple O(n) without map,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

第九周作业

Binary

Hive操作异常总结

小马哥

大数据 hive 数据仓库

学习“利益相关者”后对自己工作的一点思考

隋泽

产品训练营第二章作业(一)

Arnold

【JS】Array.of() 创建数组

德育处主任

JavaScript 大前端 js ES6 28天写作

微信直播也有跳舞小姐姐了 | 视频号28天(17)

赵新龙

28天写作

批判性思维自修课(一)

石君

28天写作 批判性思维

架构师训练营第4周作业



架构师训练营第四周作业 - 命题作业

阿德儿

线程的三种等待唤醒机制(面试必问)

hepingfly【gzh:和平本记】

Java 线程 等待唤醒

Redis为什么变慢了?一文讲透如何排查Redis性能问题 | 万字长文

Kaito

redis 性能优化 后端

产品 0 期 - 第一章作业

让时间说真话

产品经理

产品经理训练营第二周作业-利益相关者

隋泽

产品经理训练营

如何基于海思芯片快速搭建Agora RTC应用

Hanson

WebRTC

28天瞎写的第二百二十七天:离开后要留下什么?

树上

28天写作

架构师训练营第四周作业 - 学习总结

阿德儿

架构师训练营第4周学习总结



请用思维导图画出架构师训练营所有技术知识点

DL

第二章作业

DF

大数据知识专栏 - 数据仓库

小马哥

大数据 hive 数据仓库 七日更

机器学习·学习笔记之:无监督学习

Nydia

第九周学习总结

Binary

【CSS】页面顶部阴影

德育处主任

CSS 大前端 html/css CSS小技巧 28天写作

云游戏的那些事儿!读《大厂们的下一件大事儿》有感

李忠良

28天写作

时间复杂度与常见排列算法

Changing Lin

算法

在 ArrayList 使用冒泡法

sinsy

ArrayList 冒泡法

第二章作业(一)

LouisN

基于Lucene的分布式搜索引擎: Elasticsearch 1.3.0发布_语言 & 开发_李士窑_InfoQ精选文章