【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Apache Flink 社区发布的 Stateful Functions 2.2.0 是什么?

  • 2020-11-26
  • 本文字数:2907 字

    阅读完需:约 10 分钟

Apache Flink 社区发布的 Stateful Functions 2.2.0 是什么?

本文最初发表在 Apache Flink 官博,经原作者授权,InfoQ 中文站翻译并分享。


Apache Flink 开源的 StatefulSet Functions 可以极大降低构建和编排分布式有状态应用程序的复杂性,集成了 Apache Flink 和函数即服务(Function-as-a-Service,FaaS)的流处理优点,为下一代事件驱动架构提供了强大的抽象能力。日前,StatefulSet Functions 2.2.0 现已发布。


Apache Flink 社区很高兴宣布 Stateful Functions 2.2.0 的发布!这个版本引入了扩展 SDK 的主要功能,例如 Python SDK 中对异步函数的支持、新的持久化构造,以及允许在 Flink DataStream 作业中嵌入 StateFun 函数的新 SDK。此外,我们还包括一些重要的更改,这些更改提高了常见工作负载的开箱即用稳定性,并提高了操作目的的可观察性。


自上个版本发布以来,我们也看到了新的第三方 SDK 正在为 StateFun 开发。虽然它们并不是发布版本的一部分,但是看到这些由社区驱动的新增功能,我们还是很高兴的!我们在下面的公告中,强调了这些努力。


二进制发行版和源码产品现在就可以在 Flink 网站的更新下载页面上获得,最新的 Python SDK 发行版可以在 PyPI 上获得。有关更多详细信息,请查阅完整的版本变更日志更新文档。我们鼓励你下载这一版本,并通过 Flink 邮件列表JIRA 与社区分享你的反馈意见。

新功能

Python SDK 中的异步函数


此版本通过在 Python SDK 中引入新的处理程序,可以将异步 Python 函数注册为有状态函数:AsyncRequestReplyHandler 这允许使用 Python Web 框架提供 StateFun 函数,这些框架本身就支持本地异步 IO(例如 aiohttp):


from statefun import StatefulFunctionsfrom statefun import AsyncRequestReplyHandler

functions = StatefulFunctions()

@functions.bind("example/greeter")async def greeter(context, message): html = await fetch(session, 'http://....') context.pack_and_reply(SomeProtobufMessage(html))

# expose this handler via an async web frameworkhandler = AsyncRequestReplyHandler(function
复制代码

有关更多详细信息,请参阅有关公开 Python 函数的文档。

Flink DataStream 集成 SDK


使用这个 SDK,你可以将使用 Flink DataStream API 或更高级别的库(如 Table API、CEP 等等,基本上是任何可以使用或生成 DataStream 的东西)与 StateFul Functions 提供的编程结构结合起来,如下所示:


StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

DataStream<RoutableMessage> namesIngress = ...

StatefulFunctionEgressStreams egresses = StatefulFunctionDataStreamBuilder.builder("example") .withDataStreamAsIngress(namesIngress) .withRequestReplyRemoteFunction( RequestReplyFunctionBuilder.requestReplyFunctionBuilder( REMOTE_GREET, URI.create("http://...")) .withPersistedState("seen_count") .withFunctionProvider(GREET, unused -> new MyFunction()) .withEgressId(GREETINGS) .build(env);

DataStream<String> responsesEgress = getDataStreamForEgressId(GREETINGS
复制代码


来自 DataStream 入口的事件被路由到绑定函数,发送到出口的事件被捕获为 DataStream 出口。这为构建复杂的流媒体应用提供了可能性。

动态状态注册的构造


在这个版本之前,Java SDK 中的持久状态构造,如 PersistedValuePersistedTable 等,必须在一个有状态函数的类中即时定义。在某些场景中,函数所需的状态是事先未知的,并且只能在运行时动态注册(例如,在调用函数时)。


这个版本通过提供新的 PersistedStateRegistry 构造实现了这一点:


public class MyFunction implements StatefulFunction {    @Persisted    private final PersistedStateRegistry registry = new PersistedStateRegistry();    private final PersistedValue<String> myValue;

public void invoke(Context context, Object input) { if (myValue == null) { myValue = registry.registerValue(PersistedValue.of("my-value", String.class)); } ... }}
复制代码

改进

远程函数通信稳定性


在观察到常见工作负载之后,我们调整了一些与远程函数通信的配置,以获得更好的开箱即用连接稳定性。这包括以下内容:


  • 底层连接池是为低延迟、高吞吐量的工作负载而调整的。这使得 StateFun 能够更积极地重用现有的连接,从而避免为每个请求重新建立连接。


  • 一旦未完成的请求总数达到每个 JVM 的阈值(statefun.async.max-per-task),StateFun 就会施加背压,但观察典型的工作负载,我们发现默认值设置得过高了。在这个版本中,为提高稳定性和资源消耗,我们降低了默认值,以应对响应缓慢的远程函数。

StateFun 应用程序的操作可观察性


这个版本的一个主要目标是采取必要的步骤来支持远程函数的自动扩展。为此,我们已经公开了几个与远程函数的工作负载以及由此产生的函数调度器施加的背压有关的指标。这包括以下内容:


  • 每个函数类型调用持续时间/延迟直方图。

  • 每个函数类型的积压规模。

  • 每个 JVM(StateFun 工作器)和每个函数类型的正在执行的调用函数。


度量标准及其描述的完整列表可以在这里找到。

对远程连接生命周期的细粒度控制


在这个版本中,可以通过远程函数为 HTTP 请求的总持续时间和单个读写 IO 才做设置单独的超时。你可以在定义这些超时值的函数规范中找到相应的字段名称。

第三方 SDK


自从上一个版本发布以来,我们已经看到在 StateFun 的远程函数 HTTP 请求-应答协议之上实现了针对不同语言的新的第三方 SDK,包括 GoRust 实现。虽然这些 SDK 没有得到 Apache Flink PMC 的认可或维护,目前也不是当前版本的一部分,但看到这些新功能的添加,证明了框架的可扩展性是非常棒的。


出于这一原因,我们在文档中添加了一个新页面,列出了社区所了解的第三方 SDK。

重要补丁说明


下面是面向用户的界面和配置更改、依赖关系版本升级或删除受支持版本的列表,当你将 StateFun 应用程序升级到此版本时,需要注意的重要事项:


  • [FLINK-18812] StateFun 2.2 中的 Flink 版本已升级为 1.11.1。

  • [FLINK-19203] 将 Scala 版本升级到 2.12,并放弃了对 2.11 的支持。

  • [FLINK-19190] 所有现有度量名称都采用驼峰式命名法(camel-cased),而不是蛇形命名法(snake-cased),以符合 Flink 度量命名约定。如果你依赖于之前的度量标准,这将会破坏现有的部署

  • [FLINK-19192] 远程函数 HTTP 请求的连接池大小已增加到 1024,其中失效 TTL 为 1 分钟。

  • [FLINK-19191] 每个 JVM(StateFun 工作器)的默认最大异步操作数已减少到 1024 个。

发行说明


如果你计划将安装程序升级到 Stateful Functions 2.2.0,请查看发行说明以获取更改和新功能的详细列表。


作者介绍:


Tzu-Li(Gordon)Tai,Apache Flink 代码提交者、PMC 会员,Ververica 软件工程师;Sebastian Riedel,Apache Flink 原创者,Ververica 软件工程师。


原文链接:

https://issues.apache.org/jira/secure/ReleaseNote.jspa?projectId=12315522&version=12348350

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-11-26 07:001712

评论

发布
暂无评论
发现更多内容

构建基于React18的电子表格程序

葡萄城技术团队

React 表格 纯前端表格技术

Springcloud Oauth2 HA篇

Damon

微服务架构 安全架构 6月月更

陕西西安等保测评单位有哪些?在哪里可以查到?

行云管家

西安 等保测评 等保测评机构

分布式数据对象:超级终端的"全局变量"

OpenHarmony开发者

OpenHarmony

基于模板配置的数据可视化平台

百度Geek说

企业数字化转型该如何做?三个融合、三个转换

小炮

数据安全刻不容缓,国产智能化厂商首获SOC 2鉴证报告有何意义?

王吉伟频道

RPA 数据安全 机器人流程自动化 智能自动化 SOC 2

各厂商的数据湖解决方案

五分钟学大数据

数据湖 6月月更

细说腾讯如何做到直播延时降低90%以上方案

C++后台开发

WebRTC CDN 音视频开发 视频直播 直播低延迟

5年“研究”3年“实战” 之后的满分答卷

青藤云安全

网络安全 容器安全 安全服务 云原生安全

Java 对象如何安全的 toString

HoneyMoose

元宇宙产业投资全景图,快人一步走进元宇宙新时代!

博文视点Broadview

技术干货 | Linkis实践:新引擎实现流程解析

康月牙

Apache 开源社区 WeDataSphere Linkis 使用实践

直播预告 | 社交新纪元,共探元宇宙社交新体验

ZEGO即构

喜报 | 旺链科技签约汨罗市文旅体产业项目,打造“链”上数字乡村

旺链科技

区块链 产业区块链 乡村振兴 汨罗市

数据产品学习-实时计算平台

第519区

实时计算 数据产品 数据开发 大数据平台

defi存币生息理财dapp系统开发逻辑

开发微hkkf5566

大数据培训Flink高频面试题

@零度

flink 大数据开发

618 大促来袭,浅谈如何做好大促备战

阿里巴巴云原生

阿里云 微服务 高可用 云原生

从 0 到 1,探究百亿流量验证下的 MVVM 框架设计

图灵教育

百度 MVVM 全栈设计

为什么 SQL 语句使用了索引,但却还是慢查询?

okokabcd

MySQL

后端适用,Apifox接口文档设计和调试教程【工具篇】

Liam

Java 后端 Postman 后端开发 API文档

Ubuntu20.04设置静态IP

echeverra

Linux 静态IP

网络安全等级测评和商用密码应用安全性评估是一回事吗?

行云管家

网络安全 等级保护 商用密码

工资管理系统该如何使用?

低代码小观

企业管理 工资 管理系统

ARM64 上的性能怪兽:API 网关 Apache APISIX 在 AWS Graviton3 上的安装和性能测试

API7.ai 技术团队

AWS 网关 arm APISIX

资深OpenStacker - 彭博、Vexxhost升级为OpenInfra基金会黄金成员

Geek_2d6073

InfoQ 极客传媒 15 周年庆征文|在Flutter中自定义应用程序内键盘

坚果

InfoQ极客传媒15周年庆

技术干货 | Linkis1.0.2安装及使用指南

康月牙

开源社区 微众银行 WeDataSphere Linkis 使用实践

低代码分析盘点:银行业低代码应用需要规避两大误区

易观分析

代码 银行

flutter系列之:Material主题的基础-MaterialApp

程序那些事

flutter 程序那些事 6月月更 widget

Apache Flink 社区发布的 Stateful Functions 2.2.0 是什么?_AI&大模型_Tzu-Li(Gordon)Tai_InfoQ精选文章