在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

基于 Lucene 的分布式搜索引擎: Elasticsearch 1.3.0 发布

  • 2014-08-04
  • 本文字数:1010 字

    阅读完需:约 3 分钟

ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 的搜索引擎,且遵守 Apache2 协议。ElasticSearch 还能够用于云计算中,且能够满足实时搜索的需要,具有稳定、可靠、快速、安装使用方便等特点。它支持通过HTTP 使用JSON 进行数据索引,还可以通过集成插件的方式,支持Thrift、Servlet、Memcached、ZeroMQ 等的传输协议。近日, Elasticsearch 1.3.0 版本发布,它是最新的稳定版本,且基于 Lucene 4.9。该版本不仅添加了许多新功能,还提高了安全性、稳定性和性能,同时修复了大量的 bug,建议对索引性能有很高要求的应用进行版本升级。主要改进包括:

  • 默认禁用了 JSONP,提高了安全性
  • 默认启用磁盘空间分配决策者
  • 提高了 StemmerTokenFilter 的性能
  • 移除不必要的中间接口
  • 移除不安全的、非法的内存访问方法
  • 实现了主机的在异步方式下即可更新映射
  • 使用 429 错误码替换 503 的错误码反馈到客户端
  • 新增了 percentiles_rank 聚集
  • 新增了 top_hits 聚集
  • 新增了 Lucene 表达式脚本引擎
  • 新增了对 Groovy 脚本语言支持和 Groovy 沙盒
  • 实现了存储在索引中的搜索模板在搜索时可以被检索和使用
  • 能够运行存储在.scripts 索引中的脚本或者模板
  • Elasticsearch 可以在内存里跟踪最近索引文档的版本,自动清理版本映射
  • Translog 刷新阀值不再由日志的数量控制,而是以日志的字节数量大小控制。
  • 在索引过程中可以自动调整用做索引缓存区的 RAM 数量

由于 Elasticsearch 具有能够实时搜索、开源、稳定、快速、支持分布式等众多优点,所以许多国外著名的公司都在使用 ElasticSearch,如 Github、Mozilla、Sony 等公司,其中我们所熟知的 Github 在 2013 年 1 月升级了他的代码搜索,由 Solr 转为 Elasticsearch。目前它的集群规模为 26 个索引存储节点和 8 个客户端节点(负责处理搜索请求),能够搜索 20TB 的数据,这些数据包括 13 亿的文件和 1300 亿行的代码。

Elasticsearch 1.3.0 发布的同时, Elasticsearch 1.2.3 也发布了,它是 1.2.x 系列版本的一个 bug 修复版本,详细信息参见该版本的发布页面

欲知Elasticsearch 更多相关详细信息,请登录其首页查看。 Elasticsearch 1.3.0 已经提供了 ZIP TAR.GZ DEB RPM 多种格式的下载源,开发者可以根据自己的操作系统选定合适的格式下载。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-04 01:414739
用户头像

发布了 92 篇内容, 共 52.1 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

新思科技聚焦开源治理 助力提升中国开源产业安全及合规水平

InfoQ_434670063458

开源 软件 供应链 新思科技

将 Terraform 生态粘合到 Kubernetes 世界

阿里巴巴云原生

阿里云 容器 云原生 KubeVela terrafrom

百问百答第46期:极客有约——可观测四类问题的核心思想解析

博睿数据

APM 智能运维 博睿数据 可观测 性能监测

TDesign 组件库技术方案指北

TDesign

开源 Vue React 组件库

软件架构-概述

架构

AOP 注解详解

武师叔

7月月更

Node.js异步编程之Promise

是乃德也是Ned

node.js 前端 7月月更

注意!软件供应链安全挑战持续升级

SEAL安全

安全 软件供应链

面对裁员?焦虑?不如好好投资自己

沃德

程序员 7月月更

6月月更开奖!速来领取你的奖品!

InfoQ写作社区官方

热门活动 6月月更

数据治理实施前必须准备的21条锦囊妙计

雨果

数据治理

JS 逆向 SMZDM 的登录加密,你学过全文扣JS代码解密吗?

梦想橡皮擦

Python 爬虫 7月月更

多传感器时间同步

秃头小苏

时间同步 7月月更

自己搭建git服务器:linux自己Gitlab服务

zhoulujun

gitlab git私有参考 git部署 git服务端

官宣|九章云极DataCanvas核心产品通过 “可信大数据”权威评测

九章云极DataCanvas

人工智能 大数据 数据处理 中国信通院 实时决策

QT实现 文件夹复制

小肉球

qt 7月月更

SLSA 框架与软件供应链安全防护

SEAL安全

SLSA 软件供应链安全

项目git commit时卡主不良代码:husky让Git检查代码规范化工作

zhoulujun

git husky lint-stated

《看完就懂系列》聊聊CSS3的 calc() 函数

南极一块修炼千年的大冰块

7月月更

查找——概念了解

乔乔

7月月更

阿里云机器学习平台PAI论文高效大模型训练框架Whale入选USENIX ATC'22

阿里云大数据AI技术

深度学习 分布式训练 异构计算

一文搞懂│工厂模式、单例模式、策略模式、适配器模式、观察者模式的原理和使用

已注销

设计模式 策略模式 观察者模式 适配器模式 7月月更

得物App数据模拟平台的探索和实践

得物技术

大前端 方案设计 Mooncake 数据模拟平台

在线直播系统源码——开源源码

开源直播系统源码

软件开发 直播源码 开源源码 在线直播系统源码

大数据基础知识介绍

Lansonli

大数据 7月月更 大数据基础

一文读懂:本地数据湖丨数据仓库丨云数据湖的利与弊

雨果

数据仓库 数据湖

离线批处理的咽喉——Flume基础配置简析

怀瑾握瑜的嘉与嘉

flume 7月月更

新思科技助力提升开源治理水平

InfoQ_434670063458

开源 新思科技 软件供应链

web前端培训4个常见的算法问题分享

@零度

算法 前端开发

数据架构师、数据分析师、数据工程师哪个工资更高?

雨果

数据分析师 数据工程师 数据架构师

纯CSS实现四种方式文本反差色效果

南城FE

CSS 前端 css动画 7月月更 反差色

基于Lucene的分布式搜索引擎: Elasticsearch 1.3.0发布_语言 & 开发_李士窑_InfoQ精选文章