「如何实现流动式软件发布」线上课堂开课啦,快来报名参与课堂抽奖吧~ 了解详情
写点什么

亚马逊发布 Kinesis Firehose

2015 年 11 月 10 日

近期,准确的说是 2015 年 10 月 7 日,亚马逊发布了一款新的服务,叫做亚马逊 Kinesis FireHose。Kinesis FireHose 是亚马逊 2 年前发布的 Kinesis 服务的后继服务。为了避免产生歧义,旧的 Kinesis 服务已经被重命名为亚马逊 Kinesis 流。

亚马逊 Kinesis Firehose 是一款托管服务,只需要很少的管理。可让用户传输应用、监控和日志数据到亚马逊S3 (简单存储服务)或是亚马逊Redshift 表,而无须使用定制的代码。

图片来源:截屏自 YouTube

来自亚马逊 Kinesis 的总经理,Roger Barga 将亚马逊 Kinesis Firehose分解为以下三个概念:

  1. 交付流均被配置以识别目的地,为了那些进行处理的数据流。
  2. 记录指的是一个发布者以数据块地形式让交付流可用的数据,数据块的大小可以达到 1000KB。
  3. 数据生产者,或发布者,将会作为记录到交付流,比如一个 web 服务器发送的日志数据。

该服务是在数据被持久化的地方,或者是级联的地方,是面向批处理场景的,在摄入之前时间间隔在 60 秒到 15 分钟之间。系统管理员控制缓冲大小和缓冲时间,从而确定移动数据的频率。以下图像描述了这些输入参数是如何被管理的。

图片来源:亚马逊官方博客

在所支持的特性中也包含了压缩和加密,压缩使用的是gzip 压缩,加密是通过亚马逊的 KMS (密钥管理服务)。通过利用中心化的安全服务,也就意味着其它服务也可使用亚马逊的密钥来解密此数据。

像其它的亚马逊服务一样,Kinesis firehose 也提供了自动伸缩的能力,但是需要一点系统管理员的参与。它还提供一些高级功能,包括文件轮询、通过 Kinesis代理的检查点、以及若一个S3 的bucket 不可用了,允许数据持久化保留24 小时。

Kinesis Firehose 的目标是那些没有任何代码和配置经验的系统管理员。但是,在更加高级别的场景中,开发者还是可以利用 Kinesis Firehose 所提供的高级 API 将之整合进他们的应用中。API 所提供的操作有:

  • CreateDeliveryStream -通过所提供的用户的数据将要传输的 S3 bucket 信息来创建一个交付流。
  • DeleteDeliveryStream - 删除一个交付流。
  • DescribeDeliveryStream - 返回一个交付流的配置信息。
  • ListDeliveryStreams -列出 AWS 账户下所有可用的交付流。
  • UpdateDestination - 为一个交付流更新 S3 bucket 的配置。
  • PutRecord - 将一个单独的达到 1000KB 的纪录数据放入交付流。
  • PutRecord Batch - 将一批纪录(500 条纪录或 50MB)放入交付流。

亚马逊为用户提供了统一的终端,让用户可以使用一套工具来同时管理 Kinesis Firehose 和流。但是对于熟悉亚马逊 Kinesis 流的用户来说,这两个服务之间还是有着几个非常重要的区别的。亚马逊按照下面方法进行了分类

  • Amazon Kinesis Streams 是针对哪些每个输入纪录都需定制处理负载的服务,再就是一些小的特性,如可允许 1 秒钟的处理延时、可选择流的处理框架。
  • Amazon Kinesis Firehose 是针对哪些无需任何管理的负载的服务,且可使用现有的基于 S3 或 RedShift 的分析工具、数据延时可达 60s 甚至更高。

查看英文原文: Amazon Release Kinesis FireHose


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015 年 11 月 10 日 18:001312
用户头像

发布了 30 篇内容, 共 95763 次阅读, 收获喜欢 0 次。

关注

评论

发布
暂无评论
发现更多内容

企业的数字化转型探索

松子(李博源)

企业架构 数字化 企业数字化转型

你有认真了解过自己的“Java对象”吗

海星

Java JVM

练习 6-1

闷骚程序员

2020,是中国SaaS行业的机遇之年?

ToB行业头条

【融云分析】融云实时音视频 SDK 对智能硬件的视频适配

Geek_116789

《中国区块链产业园15强名录》

CECBC区块链专委会

架构师是怎样炼成的 6-1

闷骚程序员

Redis基础:redis特点

奈学教育

redis

快来!我从源码中学习到了一招Dubbo的骚操作!

why技术

源码 面试 dubbo 动态代理

支付公司如何赚钱?支付网关如何设计?

诸葛小猿

微信 支付宝 聚合支付 第三方支付 支付网关

Worktile完成新一轮融资,将发力研发管理赛道

Worktile

融资

微信小程序使用GoEasy实现websocket实时通讯

GoEasy消息推送

小程序 websocket 即时通讯

啃碎并发(10):内存模型之内部原理

猿灯塔

将设计模式应用到日常的curd中—分离关联查询

LSJ

Java 设计

Redis基础:redis特点

古月木易

redis

​中国SaaS处在什么阶段?

ToB行业头条

数据库周刊32丨Oracle自治数据库大动作;腾讯云MySQL 8.0上线;华为数据库工程师认证发布;update引起业务卡顿;PostgreSQL安全加固;openGauss单机安装;中国DBA联盟"ACDU"邀您加入……

墨天轮

MySQL 数据库 oracle postgresql

一口气讲透一致性哈希(Hash),助力「码农变身」

码农神说

一致性算法 一致性哈希 一致性hash 一致性Hash算法

话题讨论|在编程中,有哪些好习惯是应该一直坚持下去的?

InfoQ写作平台官方

写作平台 话题讨论 话题

火焰图:全局视野的Linux性能剖析

Marionxue

Markdown工具Typora结合gitee码云图床自动上传云端图片

Flychen

Typora markdown gitee

腾讯的ToB梦想

ToB行业头条

讲烂了的mysql,今天再给大家重温一下

爱嘤嘤嘤斯坦

Java MySQL 数据库 编程 mysql事务

为什么单元测试不是持续交付的唯一答案

禅道项目管理

持续集成 单元测试

我的程序跑了60多小时,就是为了让你看一眼JDK的BUG导致的内存泄漏。

why技术

Java 源码 jdk 并发 bug

java 后端博客系统文章系统——No4

猿灯塔

猿灯塔:spring Boot Starter开发及源码刨析(四)

猿灯塔

Java 猿灯塔 spring Boot Starter

Spring Boot 2.3.0正式发布:优雅停机、配置文件位置通配符新特性一览

YourBatman

spring springboot

MySql的Dockerfile编写

玏佾

统一物品编码 破解追溯“断链”困局

CECBC区块链专委会

解读:新基建为区块链带来的新机遇

CECBC区块链专委会

亚马逊发布Kinesis Firehose-InfoQ