写点什么

火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享 LAS Daft 多模态数据引擎的架构与应用

  • 2025-08-04
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大小:573.79K时长:03:15
火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享LAS Daft 多模态数据引擎的架构与应用

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


火山引擎 AI 数据湖服务架构师琚克俭已确认出席并发表题为LAS Daft 多模态数据引擎的架构与应用的主题分享。在 AI 应用加速演进的背景下,如何高效处理和调度海量、多模态数据,已成为构建高质量 AI 系统的关键挑战之一。本演讲将介绍火山引擎面向 AI 任务推出的数据处理引擎——LAS Daft。该系统基于云原生湖仓一体架构,结合开源分布式执行引擎 Daft,支持图文、音视频、点云等多模态数据的统一处理,覆盖数据清洗、格式转换、零拷贝对接训练框架等关键环节。


演讲将重点解析 Daft 在分布式 Python 计算、多模算子处理、流式调度等方面的核心设计,以及在智能驾驶大规模数据处理、LLM 离线推理等实际应用场景中的落地经验,探讨如何在保证成本可控的前提下,实现 AI 数据处理能力的可扩展性与工程化落地。


琚克俭是火山引擎 AI 数据湖服务架构师,拥有 10 年 + 大数据领域实战经验,深耕数据架构设计、AI Infra 的构建。曾先后就职于字节跳动(EMR/LAS 核心团队)、阿里巴巴数据库、蚂蚁等团队,参与多项基础设施的平台构建,在大吞吐、低延迟的离线和实时数据引擎开发等领域具备丰富经验。他在本次会议的详细演讲内容如下:


演讲提纲:

1、Daft 背景及定位

2、Daft 核心场景介绍

  • Python 计算分布式

  • 流式异构调度

  • 多模算子处理

  • 图文混排

  • AI 数据湖的 Python 生态圈

3、Daft 技术原理介绍

  • 执行框架介绍

4、Daft 大规模数据处理实践案例

  • 智驾(大规模离线处理数据)

  • LLM 离线推理

5、未来展望

听众收益:

  • 了解 AI 时代下多模态数据高效处理的技术需求

  • 了解 LAS 结合 Daft 在数据预处理、训练加载上的实践


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。



2025-08-04 10:413464

评论

发布
暂无评论

GPU 降成本免运维,睿观 AI 助手选择函数计算

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

CIO 落地 AI 的最佳伙伴,飞书开发套件助力企业提升 AI 生产力

ToB行业头条

飞书 大模型

吉他小白必看:吉他初学者指法如何训练,Guitar Pro如何辅助新手理解复杂指法?

阿拉灯神丁

吉他学习 Guitar Pro 音乐制作工具 乐谱软件

gpt4all for mac(Mac本地部署deepseek)

晨光熹微

【CMDB治理】多角色驱动:精准规划CMDB数据消费场景指南

嘉为蓝鲸

AIOPS CMDB IT资产管理

Post-Training on PAI (3): 自研高性能强化学习框架PAI-ChatLearn

阿里云大数据AI技术

人工智能 开源 模型 强化学习 大数据、

在AI时代,如何从开源项目中发现真实需求?

qife122

开源项目 AI技术

从语义检索到精准匹配:智能运维OpsPilotV3.5问答对能力解读

嘉为蓝鲸

智能运维 weops OpsPilot 问答对

Veeam Data Platform 12.3.2 (Windows) - 数据保护和管理解决方案

sysin

veeam

VMware Aria Operations for Networks 6.14 - 网络和应用监控工具

sysin

vmware

再获5亿元融资加持,云深处何时走向“C位”?

趣解商业

科技 人形机器人 云深处科技

教培行业首发!腾讯云 X 咕泡科技 AI 实训 CDE 平台正式落地

咕泡科技

人工智能 腾讯云 AI 咕泡科技 实训平台

破解异构日志清洗五大难题,全面提升运维数据可观测性

阿里巴巴云原生

阿里云 云原生 sls

Steinberg HALion Mac(专业虚拟采样与声音合成)

晨光熹微

优化测试执行:嘉为蓝鲸CTest测试管理平台结构化用例提升效率与缺陷追踪能力

嘉为蓝鲸

DevOps 测试用例 CTest

通过ETL工具,高效完成达梦数据库数据同步至数仓Oracle的具体实现

谷云科技RestCloud

oracle 数据处理 数据同步 ETL 达梦数据库

3小时成为百万富翁 | 金融科技漏洞赏金实战(第一篇)

qife122

漏洞赏金 GraphQL漏洞

Apache Cloudberry 向量化实践(三):Gandiva 优化实战

酷克数据HashData

技术领跑!Apache IoTDB 6 篇论文入选数据库国际顶会 SIGMOD、ICDE 2025

Apache IoTDB

天晟科技携手万表平台,共同推动RWA项目发展

科技汇

加工进化论:SPL 一键加速日志转指标

阿里巴巴云原生

阿里云 云原生 SPL sls

高德智能手表解决方案,助力荣耀手表5 Ultra开启智慧出行

高德开放平台

高德地图 智能穿戴 RTOS

信创 CDC 实战 | TiDB 实时入仓难点与解决方案解析(以 ClickHouse 为例)

tapdata

tidb实时同步 tidb数据同步 信创数据库同步 tidbcdc clickhouse入仓

订单初版—取消订单链路中的技术问题说明文档(二)

量贩潮汐·WholesaleTide

Java 数据库 服务器

提升研发效能:CCode代码管理平台用自动化CI校验规范代码合并流程

嘉为蓝鲸

DevOps 代码管理 CCode

吉他检查换弦准确度的方法有哪些呢?Guitar Pro如何帮助吉他新手检查换弦准确度

阿拉灯神丁

吉他学习 Guitar Pro8 音乐软件 技巧分享

Invicti v25.7.0 发布,新增功能简介

sysin

invicti

Vue 3 赋能低代码:构建高性能、可定制化企业级应用的新范式

不在线第一只蜗牛

Vue 低代码

Krita 5.2.10 (Linux, macOS, Windows) - 开源免费绘画软件

sysin

Krita

四季沐歌携手天润融通,用Agent干掉80%重复工作

天润融通

OpenLLMetry 助力 LLM 应用实现可观测性

观测云

LLM

火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享LAS Daft 多模态数据引擎的架构与应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章