写点什么

AI 时代数据基础设施:向量数据库与云原生进化之路|AICon 北京

  • 2025-06-17
    北京
  • 本文字数:1867 字

    阅读完需:约 6 分钟

大小:986.92K时长:05:36
AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


Zilliz 技术总监武云峰已确认出席并发表题为《AI时代数据基础设施:向量数据库与云原生进化之路》的主题分享。


在 GenAI 快速发展的背景下,企业在使用向量数据库时面临多重挑战。当前用户在大量使用向量数据库过程中遇到的主要痛点有:

  • 数据迁移复杂,切换成本高:随着业务需求的变化,企业可能需要更换向量数据库。然而,不同向量数据库在数据格式、查询接口和性能指标等方面存在差异,导致数据迁移成为一项复杂且高成本的任务。传统的 ETL 工具主要针对结构化数据,缺乏对向量数据特性的支持,使得向量数据库之间的数据迁移更加困难。

  • 数据合规性与主权问题:在全球部署 AI 应用时,企业需遵守各地的数据保护法规,如 GDPR 等。传统基础设施在灵活适应不同地区的合规需求方面存在限制,难以满足数据主权和合规性的要求。

  • 数据模型演进(Schema Evolution)困难:随着业务的发展,数据模型可能需要变更,例如增加新的向量或标量字段,并填充历史数据。在传统数据库中,模式演进可能导致数据不一致或需要大量的手动干预


过去一年,Zilliz Cloud 在这几个问题上取得了一些关键进展:开发专门针对向量数据的迁移工具,如基于 Apache SeaTunnel 的 VTS(Vector Transport Service),以支持向量和非结构化数据的高效迁移;采用 BYOC(Bring Your Own Cloud)模式,使组织能够在自己的私有云环境中托管数据,确保数据主权和合规性。同时,实施透明加密机制和严格的访问控制,保障数据安全;引入支持 Schema Evolution with data backfill 的机制,保证上层业务模型发生改变时,能够快速应对。



武云峰是前百度 Elasticsearch 负责人、Apache Doris Committer,现任 Zilliz 技术总监,专注于向量数据库在全球 AI 场景中的落地与创新。拥有多年开源搜索引擎与 OLAP 数据库研发经验,精通数据库 SaaS 产品的架构设计与体系化建设。


在百度期间,曾主导百度云 Elasticsearch 以及百度云 Elasticsearch PaaS 平台从零到一的搭建,打造国内领先的搜索引擎服务平台,推动多项技术创新并实现商业化重大突破。此后曾主导国内知名 OLAP 数据库 SaaS 产品的北美落地与商业化进程,实现从 0 到 1 的出海突破,积累了具备丰富的数据库产品全球化实战经验,并在数据安全与合规策略方面有深厚经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. AI 基础设施的行业重塑浪潮

  • AI Gen 时代对数据基础设施的新需求

  • 向量数据库在生成式 AI 中的关键角色

  • 从存储数据到理解数据:基础设施的范式转变

2. 当前用户或业务遇到痛点问题

  • 数据迁移复杂,切换成本高

  • 数据合规性与主权问题

  • 数据模型演进(Schema Evolution)困难

3. 核心能力进展与技术亮点

  • 数据迁移复杂,切换成本高,让数据迁移更像“流动”而不是“搬家”

  • 向量数据从本地、第三方云无缝迁移

  • 集群内迁移场景的灵活调度:降低业务中断、支持弹性资源伸缩

  • 用例:客户在训练/推理阶段的多集群协同处理

  • 数据合规性与主权问题,引入 BYOC Deployment Mode

  • 企业能够在自己的云环境中托管数据,确保数据主权和合规性,又可以实现服务的完全托管

  • TDE(Transparent Data Encryption)如何守护 AI 时代的数据隐私

  • 高级数据处理:从数据库走向智能数据平台

  • 支持数据模型的演化

  • 更适配 AI 场景中的模型重训练、数据补充等操作

4. 构建全球分布式的 AI 数据云

  • Geo Replication:多地域/多云同步,提升响应速度与容灾能力

  • 托管模型(Model Hosting):下一步计划支持轻量推理与在线嵌入

  • 服务全球 AI 开发者,打造“模型 + 数据 + 算法”的一体化平台


听众收益

  • 理解向量数据库在 AI 系统中的核心价值与应用场景

  • 获取 AI 基础设施在数据迁移、安全合规、数据处理方面的最新实践经验

  • 了解如何通过 Zilliz Cloud 快速构建企业级、可演进的 AI 数据平台

  • 获取 Zilliz Cloud 在 Geo Replication、托管模型等未来能力的前瞻信息


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。



2025-06-17 09:293636

评论

发布
暂无评论

一文搞懂设计模式—适配器模式

Java随想录

Java 设计模式

海上风电:2024智慧海上风电场数字孪生系统

2D3D前端可视化开发

智慧电力 三维可视化 智慧风电场 智慧海上风电场 数字孪生风电场

6个受欢迎的 Angular 库

伤感汤姆布利柏

万界星空科技电子机电行业MES系统,2000元/年起

万界星空科技

制造业 mes 电子 电子mes 电子行业

【线上直播】KaiwuDB 分布式系统 Range Split & Merge 原理详解

KaiwuDB

数据库 数据分区

基于 Fluid+JindoCache 加速大模型训练的实践

阿里巴巴云原生

阿里云 云原生 Fluid

即时通讯技术文集(第33期):IM开发综合技术合集(Part6) [共12篇]

JackJiang

网络编程 即时通讯 IM

Linux操作系统中软件安装

小魏写代码

信创的全称是什么?与非信创有什么区别?

行云管家

IT 信创 国产化 非信创

测试管理进阶 | 量力而行:避免成为替罪羊

测试人

软件测试 测试开发 测试管理

金芮学院派的优秀践行者

极客天地

深耕人工智能技术创新,天翼云荣获AAAI 2024竞赛冠军

编程猫

Web3.0区块链技术开发方案:mint铭文铭刻制度开发

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

干货 | 汽车行业研发效能提升的挑战与实践案例

思码逸研发效能

【论文解读】| 通过大语言模型实现通用模糊测试

云起无垠

测试管理进阶 | 量力而行:避免成为替罪羊

测吧(北京)科技有限公司

详解 API 设计最佳实践

Noah

AI Agent深入浅出——以ERNIE SDK和多工具智能编排为例

飞桨PaddlePaddle

百度 BAIDU 百度飞桨 开发者说 AI Agent

思码逸荣获汽车数智未来创新峰会“年度数字化创新产品奖”

思码逸研发效能

TPC-H 基准测试:Databend Cloud 与 Snowflake 对比

Databend

小程序生命周期解析(从概念、启动、运行、销毁场景的全面解析)

天津汇柏科技有限公司

小程序开发 开发小程序

回顾 | E³CI效能认知与改进论坛,助力企业研发效能度量和提升

思码逸研发效能

测试管理忠告|量力而行:避免成为替罪羊

霍格沃兹测试开发学社

AI给我们带来哪些方面惊喜呢?

小齐写代码

Google Adsense探索系列_第二弹(成功通过审核)

fkys

网站 Google 审核 adsense

墨天轮2023年度数据库获奖名单

墨天轮

数据库 opengauss oceanbase 达梦 polarDB

Go 首次冲进前八!曾两次夺得年度编程语言,也曾跌至百名开外 | TIOBE 2 月榜单发布

博文视点Broadview

AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章