AICon 深圳站 Keynote 嘉宾官宣!共探AI价值转化的实践路径 了解详情
写点什么

火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享 LAS Daft 多模态数据引擎的架构与应用

  • 2025-08-04
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大小:573.79K时长:03:15
火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享LAS Daft 多模态数据引擎的架构与应用

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


火山引擎 AI 数据湖服务架构师琚克俭已确认出席并发表题为LAS Daft 多模态数据引擎的架构与应用的主题分享。在 AI 应用加速演进的背景下,如何高效处理和调度海量、多模态数据,已成为构建高质量 AI 系统的关键挑战之一。本演讲将介绍火山引擎面向 AI 任务推出的数据处理引擎——LAS Daft。该系统基于云原生湖仓一体架构,结合开源分布式执行引擎 Daft,支持图文、音视频、点云等多模态数据的统一处理,覆盖数据清洗、格式转换、零拷贝对接训练框架等关键环节。


演讲将重点解析 Daft 在分布式 Python 计算、多模算子处理、流式调度等方面的核心设计,以及在智能驾驶大规模数据处理、LLM 离线推理等实际应用场景中的落地经验,探讨如何在保证成本可控的前提下,实现 AI 数据处理能力的可扩展性与工程化落地。


琚克俭是火山引擎 AI 数据湖服务架构师,拥有 10 年 + 大数据领域实战经验,深耕数据架构设计、AI Infra 的构建。曾先后就职于字节跳动(EMR/LAS 核心团队)、阿里巴巴数据库、蚂蚁等团队,参与多项基础设施的平台构建,在大吞吐、低延迟的离线和实时数据引擎开发等领域具备丰富经验。他在本次会议的详细演讲内容如下:


演讲提纲:

1、Daft 背景及定位

2、Daft 核心场景介绍

  • Python 计算分布式

  • 流式异构调度

  • 多模算子处理

  • 图文混排

  • AI 数据湖的 Python 生态圈

3、Daft 技术原理介绍

  • 执行框架介绍

4、Daft 大规模数据处理实践案例

  • 智驾(大规模离线处理数据)

  • LLM 离线推理

5、未来展望

听众收益:

  • 了解 AI 时代下多模态数据高效处理的技术需求

  • 了解 LAS 结合 Daft 在数据预处理、训练加载上的实践


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。



2025-08-04 10:4111

评论

发布
暂无评论

MySQL 扛不住了,来试试这款平替的“国产化改造”必入手的国产数据库吧!

TiDB 社区干货传送门

三国策略游戏下载:三国志11威力加强版 (Win&Mac)版下载

你的猪会飞吗

三国志11威力加强版 Mac游戏下载 mac破解软件下载

NPU 与 GPU 相比,有什么差别?| 技术速览

Baihai IDP

程序员 AI gpu 企业 9 月 PK 榜 NPU

超级驾趣学院 长安马自达MAZDA EZ-6驾驭全场景出行

极客天地

火山引擎VeDI核心产品DataTester再进化,A/B大模型应用评测功能上线

字节跳动数据平台

大数据 A/B 测试 对比实验 数字化增长

金蝶云·苍穹OEM版产品正式发布!AI时代共创软件产业新质生产力

金蝶云·苍穹

金蝶 生态伙伴 金蝶云苍穹

mes系统在新材料行业中的应用价值

万界星空科技

mes 万界星空科技 生产管理MES系统 新材料mes 新材料行业

对比传统数据库,TiDB 强在哪?谈谈 TiDB 的适应场景和产品能力

TiDB 社区干货传送门

非凸科技钻石赞助第四届Rust China Conf 2024

非凸科技

一文说清楚数据集成中的流处理与批处理的区别

RestCloud

Apache 数据处理 批处理 ETL 流处理

SQL 中 Drop、Delete 与 Truncate 的区别

Chat2DB

数据库 开源 AI sql

几张图带你了解TiDB架构演进

TiDB 社区干货传送门

版本升级

交换机是什么?云管理平台可以管理交换吗?

行云管家

云计算 云服务 交换机 云管理

NocoBase 与 NocoDB:开源无代码工具深度对比

NocoBase

开源 低代码 无代码开发 低代码开发 无代码

2024 医疗 Datathon 又叕来啦~!“理-工-医-信”跨学科联合科研,以数据驱动医疗实践

ModelWhale

R 语言 datathon 医疗大数据

《黑神话:悟空》真的带火云电脑了吗?

脑极体

AI

软件测试 | 手工转测试开发轻松实现薪资 50%涨幅的逆袭之路

测试人

软件测试

参与“2024,我想和 TDengine 谈谈”有奖征文活动,赢 AirPods

TDengine

数据库 tdengine 时序数据库

TiDB在 G7 的实践和未来

TiDB 社区干货传送门

🌍 "独立开发者出海技术栈和工具" 现已上线!

Immerse

独立开发者 工具 技术栈 出海 工具站

襄阳等保测评机构有哪些?在哪里?

行云管家

等保 等保测评

关于新版本 tidb dashboard API 调用说明

TiDB 社区干货传送门

集群管理 管理与运维 故障排查/诊断 新版本/特性解读 7.x 实践

Percona Toolkit 神器全攻略(性能类)

GreatSQL

How Can Unity+腾讯云开发=微信小游戏?

蛋先生DX

腾讯云 Unity 数据模型 云开发 微信小游戏

天猫商品详情数据接口:利用接口工具获取数据

tbapi

天猫API接口 天猫商品详情接口

【黄金圆环】在研发领域的实践分享

京东科技开发者

How to Add a Built-in Function to TiDB Using a Cursor in 20 Minutes

TiDB 社区干货传送门

TiDB 源码解读

火山引擎 AI 数据湖服务架构师琚克俭确认出席 AICon 深圳,分享LAS Daft 多模态数据引擎的架构与应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章