NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Amazon 发布 Kinesis 服务更新

  • 2016-05-29
  • 本文字数:1414 字

    阅读完需:约 5 分钟

Amazon 最近公布了旗下Amazon Kinesis Service 的更新。在此次更新中,Amazon Kinesis Streams 和Amazon Kinesis Firehose 服务增加了三个新功能,包括支持Elasticsearch Service Integration(Elasticsearch 服务集成)、Shard-Level Metrics(Shard 级度量指标),以及Time-Based Iterators(基于时间的迭代器)。

Amazon Elasticsearch 服务集成

Kinesis Firehose 与 Amazon Elasticsearch 的集成使得开发者能够将数据从 Amazon Kinesis Firehose 交付流(Delivery stream)移动至 Amazon Elasticsearch 服务群集。

随着数据进入 Kinesis Firehose 交付流,将根据配置进行缓冲,随后通过批量插入的方式将其存入 Elasticsearch 服务。这些交付流还可以通过 AWS 管理控制台进行压缩和加密。

这种集成的使用场景包括服务器日志的索引和分析,点击流和社交媒体流量等。AWS 产品战略总经理 Matt Wood表示,这个新功能“非常适合日志分析和应用程序监视”。

一旦将数据发布至Elasticsearch,随后即可使用诸如 Kibana 等工具对其进行分析和可视化。

Shard 级度量指标

一个 Kinesis Stream 可包含一个或多个 Shard。Kinesis Stream 中的 Shard 代表读写能力。每个 Shard 可提供 1MB/ 秒数据输入和 2MB/ 秒数据输出。Shard 将按照使用小时数收费,每秒钟最多可处理 1000 条记录。

新提供的 Shard 级度量指标可供用户了解 Kinesis Stream 中每个 Shard 性能的详细信息。总的来说,目前共有 6 个可用度量指标,每个指标的状态每分钟更新一次。这些度量指标将按照 CloudWatch 每个指标的定价模型进行收费。

Amazon 已经公布了目前 Kinesis Streams 可用的每个度量指标的详细信息:

  • IncomingBytes – 已经成功 PUT 至 Shard 的字节数量。
  • IncomingRecords – 已经成功 PUT 至 Shard 的记录的数量。
  • IteratorAgeMilliseconds – 针对一个 Shard 调用GetRecords所返回的最后一条记录的寿命(以毫秒计)。值为“0”意味着目前正在读取的记录已经完全赶上了流的速度。
  • OutgoingBytes – 从 Shard 获得的字节数量。
  • OutgoingRecords – 从 Shard 获得的记录数量。
  • ReadProvisionedThroughputExceeded - 通过GetRecords获取的超过每秒 5 次读取或每秒 2MB 数据的限制的 Shard 数量。
  • WriteProvisionedThroughputExceeded – 由于超出 Shard 每秒 1000 条记录或每秒 1MB 数据的限制而进行限流后,已经被拒绝的记录数量。

用户可以使用这些信息估算自己的系统性能。例如可以检测上游应用程序发布数据的速度是否过快,超过了下游应用程序(Consuming application)的处理能力进而产生吞吐率瓶颈。

基于时间的迭代器

当应用程序从流中读取数据时,为了以正确的顺序拉取正确的数据,需要追踪数据在流中的位置。在 Kinesis Streams 中可以使用迭代器实现该功能。在本次更新之前可以使用顺序号、最老记录或最新记录作为迭代器。

在 AWS 的此次更新中,用户已经可以指定时间戳决定要从哪里开始处理自己的流。这种功能的一个用例是:当下游应用程序经历计划内停机时,发布方可能依然在向流中发布新数据。默认情况下,Kinesis Stream 最多可存储 24 小时的数据,这样消费应用程序就可以通过提供时间戳,从上次中断的地方继续处理流中发布的数据。

查看英文原文 Amazon Releases Kinesis Service Update


感谢侠天对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-29 19:001794
用户头像

发布了 283 篇内容, 共 102.1 次阅读, 收获喜欢 61 次。

关注

评论

发布
暂无评论
发现更多内容

ES Client性能测试初探

FunTester

什么?比 MySQL 性价比更高的 TiDB Cloud Serverless Tier 来了?

PingCAP

#TiDB

架构训练营模块三作业

现在不学习马上变垃圾

架构训练营10期

ChatGPT 最近火得不要不要的

HoneyMoose

2022年人民满意手机银行服务白皮书

易观分析

金融 白皮书 手机银行 用户

PingCAP 与 Wisconsin-Madison 大学建立科研合作,探索 Key-Value 存储系统的智能管理与自动调整

PingCAP

TiDB

TiCDC 源码阅读(一)TiCDC 架构概览

PingCAP

TiCDC

TiDB 首批通过信通院 HTAP 数据库基础能力评测

PingCAP

#TiDB

2023-01-04:有三个题库A、B、C,每个题库均有n道题目,且题目都是从1到n进行编号 每个题目都有一个难度值 题库A中第i个题目的难度为ai 题库B中第i个题目的难度为bi 题库C中第i个题目

福大大架构师每日一题

算法 rust Solidity 福大大

TableLayout(表格布局)

智趣匠

Android Studio tablelayout 表格布局

JVM 如何获取当前容器的资源限制?

阿里巴巴云原生

Java 阿里云 容器 云原生

解读重要功能特性:新手入门 Apache SeaTunnel CDC

Apache SeaTunnel

CDC 数据变更捕获

LiveMe x TiDB丨单表数据量 39 亿条,简化架构新体验

PingCAP

#TiDB

链上隐私交易成新刚需,Unijoin.io或成该赛道新契机

股市老人

5A原则

穿过生命散发芬芳

1月月更

时序数据库 TDengine 3.0 参数体系使用方式汇总

TDengine

数据库 tdengine 时序数据库

澳鹏中国第三年,缘何成为AI训练数据服务行业领头羊?

澳鹏Appen

人工智能 数据采集 数据安全 数据标注 AI向善

数益工联 x TiDB丨如何运用 HTAP 挖掘工业数据价值?

PingCAP

#TiDB

TiCDC 源码阅读(二)TiKV CDC 模块介绍

PingCAP

#TiDB

TiCDC 在大单表场景下的性能优化:我们如何将吞吐量提升 7 倍?

PingCAP

#TiDB

如何确定解决的问题的价值?

珑彧

方法论

属于 PingCAP 用户和开发者的 2022 年度记忆

PingCAP

#TiDB

2022年11月中国网约车领域月度观察

易观分析

网约车 行业 打车

探索工业互联网领域中的设备通信协议

JustYan

物联网 工业互联网 物联网协议

架构实战 3 - 外包学生管理详细架构

架构实战营 「架构实战营」

基于低代码平台构筑金融行业IT运维服务体系

明道云

2022年中国证券类APP创新专题分析

易观分析

金融 证券 证券app

九科信息超级自动化平台前景广阔——Gartner:超级自动化是RPA行业未来发展的必然趋势

九科Ninetech

极光笔记 | 当前最佳实践:Header Bidding 与瀑布流混合请求技术

极光JIGUANG

后端 营销 运营

欢迎来到,个人数据安全“世界杯”

脑极体

《解构领域驱动设计》-软件复杂度解析

珑彧

读书笔记 方法论 领域驱动设计 DDD 复杂

Amazon发布Kinesis服务更新_亚马逊云科技_Kent Weare_InfoQ精选文章