写点什么

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势

  • 2022-05-12
  • 本文字数:2641 字

    阅读完需:约 9 分钟

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势

日前,以“云领数智融合,重塑创新引领”为主题的亚马逊云科技大数据与机器学习媒体沟通会在北京举行。亚马逊云科技大中华区产品部总经理陈晓建、亚马逊云科技大中华区产品部技术专家团队总监王晓野、亚马逊云科技大中华区产品部机器学习产品高级经理张洋接受了 InfoQ 在内的少数几家媒体采访。

 

随着信息技术日益发展,近几年,全球数据量激增。统计显示,2020 年,全球数据量达到了 60ZB,其中中国数据量增速迅猛。预计 2025 年中国数据量将增至 48.6ZB,占全球数据量的 27.8%。

 

毋庸置疑,数据早已成为企业最重要的资产,但数据价值却未得到充分利用。福布斯调研报告数据显示,如果能够成为一个数据驱动型公司,那么公司收入会增加 20%,成本会减少 30%。

 

亚马逊云科技认为,企业要想重塑数据洞察,一定要做到数智融合,将数据(大数据技术)和智能(机器学习技术)进行融合和统一。从而更加高效地围绕数据构建和实施项目,使得数据在两者之间无缝流转,成员快速具备相关能力,推动公司企业数字化转型迈向新的高度。

当大数据遇上机器学习

 

IT 时代产生的数据呈指数级增长,而数据也被应用到了更多的领域中。与过去相比,数据的规模日益庞大,应用场景日益复杂,这些都给大数据计算提出了更高的挑战。而企业对大数据服务也提出了更高的要求。越来越多的企业希望拥有按小时,甚至按分钟级实时的大数据服务。

 

与此同时,随着 AI 技术不断发展,AI 技术的应用深度和广度也在不断加深。根据 IDC 报告显示,到 2023 年,AI 系统支出将达到 979 亿美元(约合 6557 亿元人民币),比 2019 年增加 2.5 倍。另外根据 Gartner 的分析,到 2024 年,75% 的企业将把机器学习技术真正用于生产,为业务所赋能。

 

“从这两点来看,大数据和机器学习技术会对企业业务产生越来越大的作用,越来越多的企业希望能够通过融合大数据和机器学习能力来提供业务产出,以充分发挥数据的价值。”陈晓建说道。

 

可以看到的企业需求趋势是,在组织架构层面,企业将原来分散在各个部门的机器学习实践进行整合,并与大数据项目进行统一协调和资源配置;在人员能力层面,企业要求和安排原有传统的大数据实践者掌握机器学习技术,应用到大数据具体项目或承接新的机器学习相关的项目需求,要求机器学习从业者也要掌握大数据处理能力,更好、更便捷地完成模型所需的数据准备和加工;在项目实施层面,仅依靠传统的大数据技术是无法全方位提供充足的数据见解,仍需要机器学习的模型能力补充,越来越多的数据项目会融合大数据和机器学习两者的能力;在工具支撑层面,企业需要面向大数据技术和机器学习构建统一的开发平台和技术基础,可能是对已有大数据平台进行改造增加机器学习相关场景和能力,或是完全推倒重新构建一个面向两者的通用的平台。

 

陈晓建认为,数智融合需要解决三个问题:

 

第一,数据和机器学习分而治之,数据及技术孤岛制约敏捷迭代。数据的丰富性、准确性和质量,直接决定了机器学习最终的效果。但企业通常分开独立建设大数据能力和机器学习能力,多个部门数据孤岛式呈现。

 

第二,数据处理能力不足。在生产制造企业,机器学习帮助客户对产品售后维修需求进行预测,由被动响应变为主动规划。但由于不具备足够的大数据处理能力,模型开发成功后 ,不能够有效收集处理海量的运营数据,致使预测不准确,无法达到预期业务目标。

 

第三,数据分析人员参与度低。现实情况经常是,模型在实验环节效果良好,但实际使用中却不尽人意,实验环境只是对真实环境的简单模拟,生产环境要复杂得多。

实现数智融合需要构建三大核心能力

 

“企业在云中要打造统一的数据基础底座,实现大数据和机器学习的’双剑合璧’,为企业发展提供创新引擎。这是我认为实现数智融合最有效的一条途径。”

 

陈晓建表示,实现数智有效融合的途径一是建立统一融合的治理底座,如数据质量、数据权限、数据开发、数据工作流、可视化;二是要让大数据和机器学习之间高效充分的双向互动,互为支撑,互为因果,形成正向循环。

 

而企业要想实现数智融合需要构建三大核心能力:

 

  • 统一数据共享。让数据资产化,打破数据孤岛。

  • 统一权限管控。因为只有具备完善的权限控制能力,放心的让数据在不同的业务系统之间流转。

  • 统一开发及流程编排。融合端到端的大数据和机器学习任务,提升整体的开发效率。

 

亚马逊云科技的经验之一就是构建云中统一的数据治理底座,打破数据及技能孤岛。企业需要构建统一的数据治理底座,实现大数据和机器学习的数据共享,数据权限的统一管控,以及两者统一的开发和流程编排。云中统一的数据治理底座不仅能提升大数据和机器学习的高效融合,还能减少大数据和机器学习重复构建的工作,并且显著降低成本。

 

“在 2021 re:Invent 期间,我们的 Amazon SageMaker Studio 进行了能力升级,通过 Amazon SageMaker Studio 统一的开发界面,现在可以实现数据科学家或是数据工程师用统一的界面实现机器学习、算法模型开发之外的能力,还可以通过 Amazon Athena 访 问不同数据源的数据,也可以通过 Amazon EMR 实现大数据处理,也可以通过同样的界面,通过代码调用 Amazon Redshift,访问数据仓库里的数据。”王晓野说道。

 

此外,还需要助力机器学习由实验转为实践,为机器学习提供生产级别的数据处理能力。机器学习项目成功的关键,就是对复杂的数据进行加工和准备。

 

最后,让数据分析智能化,赋能业务人员探索创新。比较常见的方式是通过一些工具降低探索机器学习建模难度,比如亚马逊深度集成机器学习 Amazon SageMaker 模型预测能力的 Amazon QuickSight 、在分析结果中添加基于模型预测的 Amazon Athena ML,都可以帮助开发者使用熟悉的技术,甚至通过自然语言来使用机器学习。

 

“大数据技术与机器学习技术,其实有着非常不同的发展路径。但是有一部分的企业已经走在了数据驱动转型的前沿,借助云计算实现了它们二者有机的融合。”王晓野说道。

人工智能将无处不在

 

人工智能从出现到发展至今不过十年。不过根据 IDC 2022 年中国人工智能及自动化市场的十大预测,人工智能将无处不在。

 

IDC 中国助理研究总监卢言霞表示,到 2022 年,60% 的中国 1000 强公司将在所有关键业务的横向职能中扩大使用 AI/ML,如营销、法务、人力资源、采购和供应链、物流等。由于机器学习更加依赖算力、算法、数据,人工智能的快速发展拉动了对 AI 基础数据服务的需求,预计在未来几年内将稳步增长。

 

而随着 AI 技术进一步发展,大数据与 AI 结合的优势也将进一步显现。可以预见的是,云上企业要想加速创新,或将必然加入这场数智融合之旅中。

2022-05-12 11:022455

评论

发布
暂无评论
发现更多内容

Sight AI 入门:5分钟实现OpenAI兼容的多模型AI调用

SightAI

MaaS 大模型 API 工具 开源‘

焱融科技携手哈工大(深圳)共启AI推理存储研究,推进AI基础设施创新

焱融科技

AI推理 焱融存储 KVCache 哈尔滨工业大学(深圳)

作为测试工程师,我们该如何应用AI?

思码逸研发效能

AI 自动化测试 API测试 AI编程 思码逸

复盘:如何用Coze+Kimi,搭建一个能自动分析财报的“金融助理”?

测试人

自动化运维新时代:智能调度与监控让集成更简单

谷云科技RestCloud

数据传输 数据同步 ETL 数据监控 数据集成工具

Nginx的ngx_thread_pool模块解析:提升性能与可伸缩性

天翼云开发者社区

nginx CDN

怎么避免无意义劳动?奇富科技摈弃分库分表后,代码改造成本节省90%

老纪的技术唠嗑局

数据库 TiDB #OceanBase

面向软件厂商的低代码解决方案:如何无需重构现有系统即可满足客户定制化需求?

星云低代码中间件

低代码 数字化 业务系统

【数组与链表】数组的基本演绎法与排序“大乱斗”

华为云开发者联盟

c++ 数据结构 数组 华为开发者空间

【数组与链表】循环链表实战 - 约瑟夫问题求解

华为云开发者联盟

c++ 数据结构 华为开发者空间

新手该如何选择AI编程工具?文心快码Comate全方位体验

Comate编码助手

AI编程 文心快码 AI编程助手

StarRocks 数据分析加速:ETL 如何实现实时同步与高效查询

谷云科技RestCloud

数据处理 数据同步 ETL 数据集成 StarRocks

行业热点丨仿真驱动设计:兼顾性能、可持续性与效益

Altair RapidMiner

汽车 制造业 仿真 CAE hyperworks

微擎:让每个创意都能开花的小程序生态引擎

微擎应用市场

Sight AI 入门:5分钟实现OpenAI兼容的多模型AI调用

SightAI

MaaS 大模型 API 工具 开源‘

工业设计 自控设计经验总结(12)

万里无云万里天

设计师 工业 工厂运维

高达 30% 合作收益,TDengine 合作伙伴计划重磅发布

TDengine

tdengine 时序数据库

智能制造 柔性制造经验总结(5)

万里无云万里天

工业 智能制造 柔性制造

破壁者万里眼,点亮示波器的东方之眼

脑极体

AI

斩获双项第一,天翼云问鼎中国医学影像云解决方案市场!

天翼云开发者社区

云服务 医疗云

企业发展的刚需:零碳园区如何为入园企业创造价值?

西格电力

绿色能源转型 碳中和碳达峰 零碳园区 能源可再生 智能化技术

🔥 2025 OCP 峰会大爆点抢先看

GPU算力

夜莺监控设计思考(二)边缘机房架构思考

巴辉特

Nightingale 监控告警 夜莺监控 开源监控

Sight AI 入门:5分钟实现OpenAI兼容的多模型AI调用

SightAI

MaaS 大模型 API 工具 开源‘

医疗公有云市场第一!

天翼云开发者社区

公有云 天翼云

云栖实录 | 通义实验室基于MaxCompute进行大模型数据管理及处理

阿里云大数据AI技术

阿里云 数据处理 大模型 MaxCompute 通义实验室

AI不再“卖梦想”,Anthropic教行业用CFO的语言讲价值

Alter

AI

云栖实录|MaxCompute全新升级:AI时代的原生数据仓库

阿里云大数据AI技术

阿里云 数据仓库 MaxCompute

火山引擎Data Agent再拓新场景,重磅推出用户研究Agent

字节跳动数据平台

低代码新建表单实操:纯表单 / 列表表单配置 + 表名避坑

引迈信息

动态加速中优化失败路径反馈的方法

天翼云开发者社区

CDN 全站加速

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势_AI&大模型_凌敏_InfoQ精选文章