AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

基于 Lucene 的分布式搜索引擎: Elasticsearch 1.3.0 发布

  • 2014-08-04
  • 本文字数:1010 字

    阅读完需:约 3 分钟

ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 的搜索引擎,且遵守 Apache2 协议。ElasticSearch 还能够用于云计算中,且能够满足实时搜索的需要,具有稳定、可靠、快速、安装使用方便等特点。它支持通过HTTP 使用JSON 进行数据索引,还可以通过集成插件的方式,支持Thrift、Servlet、Memcached、ZeroMQ 等的传输协议。近日, Elasticsearch 1.3.0 版本发布,它是最新的稳定版本,且基于 Lucene 4.9。该版本不仅添加了许多新功能,还提高了安全性、稳定性和性能,同时修复了大量的 bug,建议对索引性能有很高要求的应用进行版本升级。主要改进包括:

  • 默认禁用了 JSONP,提高了安全性
  • 默认启用磁盘空间分配决策者
  • 提高了 StemmerTokenFilter 的性能
  • 移除不必要的中间接口
  • 移除不安全的、非法的内存访问方法
  • 实现了主机的在异步方式下即可更新映射
  • 使用 429 错误码替换 503 的错误码反馈到客户端
  • 新增了 percentiles_rank 聚集
  • 新增了 top_hits 聚集
  • 新增了 Lucene 表达式脚本引擎
  • 新增了对 Groovy 脚本语言支持和 Groovy 沙盒
  • 实现了存储在索引中的搜索模板在搜索时可以被检索和使用
  • 能够运行存储在.scripts 索引中的脚本或者模板
  • Elasticsearch 可以在内存里跟踪最近索引文档的版本,自动清理版本映射
  • Translog 刷新阀值不再由日志的数量控制,而是以日志的字节数量大小控制。
  • 在索引过程中可以自动调整用做索引缓存区的 RAM 数量

由于 Elasticsearch 具有能够实时搜索、开源、稳定、快速、支持分布式等众多优点,所以许多国外著名的公司都在使用 ElasticSearch,如 Github、Mozilla、Sony 等公司,其中我们所熟知的 Github 在 2013 年 1 月升级了他的代码搜索,由 Solr 转为 Elasticsearch。目前它的集群规模为 26 个索引存储节点和 8 个客户端节点(负责处理搜索请求),能够搜索 20TB 的数据,这些数据包括 13 亿的文件和 1300 亿行的代码。

Elasticsearch 1.3.0 发布的同时, Elasticsearch 1.2.3 也发布了,它是 1.2.x 系列版本的一个 bug 修复版本,详细信息参见该版本的发布页面

欲知Elasticsearch 更多相关详细信息,请登录其首页查看。 Elasticsearch 1.3.0 已经提供了 ZIP TAR.GZ DEB RPM 多种格式的下载源,开发者可以根据自己的操作系统选定合适的格式下载。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-04 01:414416
用户头像

发布了 92 篇内容, 共 48.3 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

百度连续四年亮相全球量子信息处理顶会QIP 宣布量子战略规划升级

百度大脑

模块化编程及LCD1602调试工具

謓泽

3月月更

实用机器学习笔记二十六:NAS

打工人!

学习笔记 NAS 机器学习算法 3月月更 神经网络架构搜索

做一个小程序到底要多少钱?都有哪些费用?

源字节1号

开源 前端开发 后端开发 开发小程序

使用关键点检测打造小工具Padoodle,让涂鸦小人跟随真人学跳舞

百度大脑

微博评论的高性能高可用计算架构

AragornYang

架构训练营 架构实战营

口腔数字化时代:AI牙医的防御基建与攻坚

脑极体

Linux之telnet命令

入门小站

Linux

一文彻底搞懂原型链

CRMEB

建设领先的AI原生云,百度智能云落地新一代高性能AI计算集群

百度大脑

架构训练营毕业总结

Geek_e6f7f6

架构实战营

LeetCode刷题笔记:数组中重复的数据

OpenHacker

JavaScript 算法 LeetCode

在线JSON转toml工具

入门小站

工具

吉利控股集团与百度深化战略合作

百度大脑

面向智能合约、区块链、Web3、以太坊开发工具指南

devpoint

Ethereum infura Solidity Web3.0 3月月更

Web 键盘输入法应用开发指南 (7) —— 开发实战(二)

天择

JavaScript 键盘 实战 输入法 3月月更

AI语音识别-我给浏览器加了个语音搜索功能

DS小龙哥

语音识别 3月月更

[算法练习]2 二进制中1的个数

暖蓝笔记

3月月更

Eclipse 不为人所知的另一面 - 企业管理软件领域 ABAP 编程语言开发利器

汪子熙

eclipse ide 开发者 abap 3月月更

持续集成工具篇:Jenkins与流水线管理

自动化 持续集成 jenkins 持续交付 构架

Spring cloud 之 CircuitBreaker篇

邱学喆

Spring Cloud circuit break Resilience4j

微博评论系统的高性能高可用计算架构

阿卷

架构实战营

图灵奖得主Yann LeCun走进百度,与世界研究工作者展开交流

百度大脑

报名啦!中小企业如何借力AI逆势突围?飞桨中国行定档3月23日!

百度大脑

纯CSS 神奇的边框特效

德育处主任

css3 纯CSS 前端可视化 css动画

【建议收藏】Kafka 面试连环炮, 看看你能撑到哪一步?(上)

王江华

大数据 kafka 面试 中间件 消息队列

RENO: Netflix的快速事件通知系统

俞凡

架构 netflix 大厂实践 3月月更

关于云端应用开发语言选择

穿过生命散发芬芳

3月月更

IntellJ IDEA诺依开发部署文档

北极的大企鹅

开源 开源技术

有温度的人工智能,零门槛助力企业“鲤跃”智能化“龙门”

百度大脑

12个iOS技术面试题及答案总结

原来是泽镜啊

ios 程序员 架构师 ios开发

基于Lucene的分布式搜索引擎: Elasticsearch 1.3.0发布_语言 & 开发_李士窑_InfoQ精选文章