阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

Elasticsearch 1.0.0 发布

  • 2014-02-18
  • 本文字数:1528 字

    阅读完需:约 5 分钟

Elasticsearch发布了以其自身命名的开源分析工具的1.0.0 版本。Elasticsearch 是一款分布式搜索引擎,支持在大数据环境中进行实时数据分析。它基于 Apache Lucene 文本搜索引擎,内部功能通过 ReST API 暴露给外部。除了通过 HTTP 直接访问 Elasticsearch,还可以通过支持 Java、JavaScript、Python 及更多语言的客户端库来访问。它也支持集成 Apache Hadoop 环境。Elasticsearch 在有些处理海量数据的公司中已经有所应用,如 GitHub、Foursquare 和 SoundCloud 等。

Elasticsearch 的基本特性主要围绕可伸缩性、高可用性和实时分析。进入搜索引擎的数据会立即建立索引,在集群中复制,并为分析做好准备。

  • 可伸缩性:Elasticsearch 是为在集群环境中工作而设计的。一个节点一启动,就会自动寻找网络中的其他节点并连接过去。索引以分片方式组织,分布在集群中。因此搜索索引是分布式操作,会在所有集群节点上并行运行。如果需要更好的性能,只需要将额外的节点加入集群,分片会自动识别。
  • 可用性:数据库分片不仅用于水平伸缩,也有可用性考虑。对于每个分片,都有一个保存在不同的集群节点上的复制分片,所以如果一个节点当掉,并不会丢失数据。Elasticsearch 会探测到故障节点,将其集群中移除。在故障节点移除之后,考虑到伸缩性和弹性,分片会重组,以便优化。 为支持整个集群重启,Elasticsearch 所需要的所有元数据能够持久化到各种存储类型上。数据可以借助所谓的网关来存储,网关目前支持本地存储和共享的文件系统。
  • 实时:Elasticsearch 是无模式的,而且支持索引任意的 JSON 文档。它会分析文档的结构,甚至还能自动探测某些数据类型,如时间戳。默认情况下,文档中的所有字段都会被索引,而且是可以搜索的。除了简单的全文搜索之外,分面(facets,提供聚合的分析函数,如日期范围、距离、柱状图等)和度量指标(metrics,如求和、平均和统计等)可以直接应用于索引。

Elasticsearch 1.0.0 的新特性

1.0.0 版本对 API 进行了很多修改,并带来了很多功能增强,使 Elasticsearch 用起来更为直观和高效了。功能增强包括备份和恢复索引、分析数据并使 Elasticsearch 更有弹性的新方法:

  • 快照/恢复:新版本提供了一个简单的 API,用来生成整个集群的快照,以创建备份。Elasticsearch 集群的状态——包括元数据和索引——可以保存在快照仓库中。仓库通常放在共享的文件系统中,而且可以保存任意数量的快照。如果发生了内置的容错和弹性机制无法处理的问题,集群可以根据仓库中的任何快照重建。
  • ** 聚集(Aggregation):** 相对于之前版本中已有的分面,聚集为分析现有数据提供了更强大的功能。分面仅为分析功能提供了少量结果(比如,特定距离内的商店数),聚集则会保存某次查询实际找到的文档,并支持将生成的文档集作为新查询的输入(比如,特定距离内所有商店的季度平均销售额)。
  • ** 断路开关(Circuit Breaker):** 系统将添加断路开关,以阻止操作或运行时错误对搜索索引造成严重的不利影响。Elasticsearch 1.0.0 添加的第一重保护是监控空余内存,并评估搜索或分析操作所需要的内存量。如果某个操作需要的内存超出了可用内存,就阻塞该操作,这样就不会导致 OutOfMemory 异常了。未来的版本中将实现更多断路开关。

Elasticsearch 使用修改主版本号的方式来整理现有的 API,它也接受不向后兼容的修改。在升级到 1.0.0 版本之前,用户应该备份所有数据,并阅读所有破坏性修改的列表。

Elasticsearch 还提供了用于处理数据获取和分析的额外工具。连同 Logstash Kibana ,Elasticsearch 还创建了 ELK-stack 来分析日志文件和其他与时间相关的信息源,并以不同的方式对这些数据进行分析和可视化。

也可以通过 Elasticsearch 的商业分支购买专业支持。

查看英文原文: Elasticsearch 1.0.0 released

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2014-02-18 19:212703
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 130.1 次阅读, 收获喜欢 34 次。

关注

评论

发布
暂无评论
发现更多内容

云服务器vCPU与物理CPU关系?

百度搜索:蓝易云

运维 cpu 云服务器 vCPU

CentOS7系统GitLab安装部署教程。

百度搜索:蓝易云

git Linux gitlab 运维 云服务器

代码随想录 Day14 - 二叉树(一)

jjn0703

代码随想录 Day15 - 二叉树(二)

jjn0703

centos7系统安装xrdp教程。

百度搜索:蓝易云

云计算 Linux centos 运维 xrdp

低代码为运营需求发力 | 社区征文

--linshuai

前端 低代码 年中技术盘点

C++中map的使用方法

二哈侠

Linux(CentOS7)安装最新版Python

百度搜索:蓝易云

Python 云计算 Linux centos7 运维

阿里云容蓓:DCDN 助力云原生时代的应用构建及最佳实践

阿里云视频云

云计算 阿里云

AIGC时代:未来已来

EquatorCoco

人工智能 AIGC

倒计时 2 天|请收好 Kyligence 用户大会参会指南

Kyligence

数据分析 指标平台

PyTorch: nn网络层-卷积层

timerring

PyTorch

给 ES 插上向量检索的翅膀 | DataFunSummit 2023 峰会演讲内容速达

极限实验室

ES 分布式存储 向量数据库 极限科技 2023数据基础架构峰会

OCR技术的昨天今天和明天!2023年最全OCR技术指南!

合合技术团队

人工智能 合合信息 OCR技术

用 Spring 管理 Controller,你觉得可行吗?

江南一点雨

Java spring

从0-100:约拍小程序开发笔记

CC同学

聊聊微服务 架构思想

EquatorCoco

架构 微服务

华为云CodeArts Check代码检查插件3大版本使用指南

华为云PaaS服务小智

华为云 代码检查 华为开发者

没收入是表象,UMU CEO李东朔的出海经验:第一年破100国家

B Impact

AIGC 对程序员的影响 | 社区征文

sidiot

AI AIGC 年中技术盘点

Centos7系统路由追踪安装使用教程。

百度搜索:蓝易云

云计算 Linux centos 运维 云服务器

go 实现ringbuffer以及ringbuffer使用场景介绍

蓝胖子的编程梦

TCP 网络 epoll ringbuffer 环形缓冲区

从0到100:定制公交预约小程序开发笔记

CC同学

CentOS7安装MySQL8

百度搜索:蓝易云

MySQL Linux centos 运维 Web

2023-07-12:RocketMQ如何做到消息不丢失?

福大大架构师每日一题

福大大架构师每日一题

Centos7系统拒绝国外IP海外IP访问的几种方法

百度搜索:蓝易云

云计算 Linux centos 运维 服务器

你信不信,只要学几天javascript就可以使用纯原生实现五星评分效果 【附完整代码】

极客小俊

JavaScript 前端开发 函数 前端基础 DOM操作

从0到1:垃圾上门回收预约小程序开发笔记

CC同学

机器学习洞察 | 挖掘多模态数据机器学习的价值

亚马逊云科技 (Amazon Web Services)

机器学习

阿里云Redis与Tair压力测评

WizInfo

百度iOS端长连接组件建设及应用实践

百度Geek说

网络编程 移动端 即时通讯IM 长连接 企业号 7 月 PK 榜

Elasticsearch 1.0.0发布_数据库_Ralph Winzinger_InfoQ精选文章