写点什么

AI 时代数据基础设施:向量数据库与云原生进化之路|AICon 北京

  • 2025-06-17
    北京
  • 本文字数:1867 字

    阅读完需:约 6 分钟

大小:986.92K时长:05:36
AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


Zilliz 技术总监武云峰已确认出席并发表题为《AI时代数据基础设施:向量数据库与云原生进化之路》的主题分享。


在 GenAI 快速发展的背景下,企业在使用向量数据库时面临多重挑战。当前用户在大量使用向量数据库过程中遇到的主要痛点有:

  • 数据迁移复杂,切换成本高:随着业务需求的变化,企业可能需要更换向量数据库。然而,不同向量数据库在数据格式、查询接口和性能指标等方面存在差异,导致数据迁移成为一项复杂且高成本的任务。传统的 ETL 工具主要针对结构化数据,缺乏对向量数据特性的支持,使得向量数据库之间的数据迁移更加困难。

  • 数据合规性与主权问题:在全球部署 AI 应用时,企业需遵守各地的数据保护法规,如 GDPR 等。传统基础设施在灵活适应不同地区的合规需求方面存在限制,难以满足数据主权和合规性的要求。

  • 数据模型演进(Schema Evolution)困难:随着业务的发展,数据模型可能需要变更,例如增加新的向量或标量字段,并填充历史数据。在传统数据库中,模式演进可能导致数据不一致或需要大量的手动干预


过去一年,Zilliz Cloud 在这几个问题上取得了一些关键进展:开发专门针对向量数据的迁移工具,如基于 Apache SeaTunnel 的 VTS(Vector Transport Service),以支持向量和非结构化数据的高效迁移;采用 BYOC(Bring Your Own Cloud)模式,使组织能够在自己的私有云环境中托管数据,确保数据主权和合规性。同时,实施透明加密机制和严格的访问控制,保障数据安全;引入支持 Schema Evolution with data backfill 的机制,保证上层业务模型发生改变时,能够快速应对。



武云峰是前百度 Elasticsearch 负责人、Apache Doris Committer,现任 Zilliz 技术总监,专注于向量数据库在全球 AI 场景中的落地与创新。拥有多年开源搜索引擎与 OLAP 数据库研发经验,精通数据库 SaaS 产品的架构设计与体系化建设。


在百度期间,曾主导百度云 Elasticsearch 以及百度云 Elasticsearch PaaS 平台从零到一的搭建,打造国内领先的搜索引擎服务平台,推动多项技术创新并实现商业化重大突破。此后曾主导国内知名 OLAP 数据库 SaaS 产品的北美落地与商业化进程,实现从 0 到 1 的出海突破,积累了具备丰富的数据库产品全球化实战经验,并在数据安全与合规策略方面有深厚经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. AI 基础设施的行业重塑浪潮

  • AI Gen 时代对数据基础设施的新需求

  • 向量数据库在生成式 AI 中的关键角色

  • 从存储数据到理解数据:基础设施的范式转变

2. 当前用户或业务遇到痛点问题

  • 数据迁移复杂,切换成本高

  • 数据合规性与主权问题

  • 数据模型演进(Schema Evolution)困难

3. 核心能力进展与技术亮点

  • 数据迁移复杂,切换成本高,让数据迁移更像“流动”而不是“搬家”

  • 向量数据从本地、第三方云无缝迁移

  • 集群内迁移场景的灵活调度:降低业务中断、支持弹性资源伸缩

  • 用例:客户在训练/推理阶段的多集群协同处理

  • 数据合规性与主权问题,引入 BYOC Deployment Mode

  • 企业能够在自己的云环境中托管数据,确保数据主权和合规性,又可以实现服务的完全托管

  • TDE(Transparent Data Encryption)如何守护 AI 时代的数据隐私

  • 高级数据处理:从数据库走向智能数据平台

  • 支持数据模型的演化

  • 更适配 AI 场景中的模型重训练、数据补充等操作

4. 构建全球分布式的 AI 数据云

  • Geo Replication:多地域/多云同步,提升响应速度与容灾能力

  • 托管模型(Model Hosting):下一步计划支持轻量推理与在线嵌入

  • 服务全球 AI 开发者,打造“模型 + 数据 + 算法”的一体化平台


听众收益

  • 理解向量数据库在 AI 系统中的核心价值与应用场景

  • 获取 AI 基础设施在数据迁移、安全合规、数据处理方面的最新实践经验

  • 了解如何通过 Zilliz Cloud 快速构建企业级、可演进的 AI 数据平台

  • 获取 Zilliz Cloud 在 Geo Replication、托管模型等未来能力的前瞻信息


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。



2025-06-17 09:293802

评论

发布
暂无评论

IDEA 不为人知的 5 个骚技巧!真香!

王磊

Java 工具 IDEA

「架构师训练营」第 5 周作业 - 一致性哈希算法

guoguo 👻

极客大学架构师训练营

写给大忙人看的内存管理

苹果看辽宁体育

后端 操作系统

超级专家术语学习机

程李文华

因为我的一个低级错误,生产数据库崩溃了将近半个小时

鄙人薛某

Java MySQL 数据库 故障定位

架构师训练营第 5 周——学习总结

在野

极客大学架构师训练营

你那么追捧的 SpringBoot,到底替你做了什么?

爱java爱自己

spring

工业4.0|振动分析能做到预防性维护吗?

清水河路人甲

老是自以为JVM懂了,那你知道 i = i++和 i = ++i 的区别吗?

小谈

Java 面试 编程语言 JVM 程序

如何通过调试学习 nginx ?

张小方

c++ nginx 后端 高性能 服务器端开发

数酒瓶童谣:从99数到0

程李文华

Cordova项目使用Android Studio真机调试

麦洛

android Android Studio 真机调试

对mysql事务的认识,再不懂我就捶死我自己!

你是人间四月天

MySQL 面试 mysql事务

解决死锁的4种基本方法(建议收藏)

小吴选手

Java 死锁

面试官80%会问的分布式事务中的“最大努力通知”事务

无予且行

Java MySQL 面试 事务

架构师训练营 一致性Hash算法Java实现

Cloud.

架构师训练营第5周-一致性hash算法总结及作业

傻傻的帅

极客大学架构师训练营

Hash一致性算法的Java实现

wei

游戏夜读 | 跟风说一说爬虫

game1night

架构师训练营作业 (第五周)

王海

极客大学架构师训练营

没有微服务项目经验,就别去面试官那里送人头了

小谈

Java 架构 面试 微服务 SpringCloud

架构师课程第五周 作业

杉松壁

计算机操作系统基础(十三)---线程同步之读写锁

书旅

php laravel 线程 操作系统 进程

k6简单入门

风中之心

性能测试

熟悉JVM吗?为什么新生代内存需要有两个Survivor区?

南南

Java 面试 深入理解JVM JVM原理

面试官:反射都不会,还敢说自己会Java?

码农月半

Java 面试 反射 java反射

深入理解ThreadLocal:拨开迷雾,探究本质

itlemon

源码分析 ThreadLocal

架构师训练营第五周 - 总结

Eric

极客大学架构师训练营

hash一致性算法与优化

Mr.Monkey

这是什么神仙面试宝典?半月看完25大专题,居然斩获阿里P7offer

码哥小胖

Java spring 面试

阿里P7岗位面试,面试官问我:为什么HashMap底层树化的标准元素个数是8

鄙人薛某

Java 面试 hashmap 哈希

AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章