2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

AI 时代数据基础设施:向量数据库与云原生进化之路|AICon 北京

  • 2025-06-17
    北京
  • 本文字数:1867 字

    阅读完需:约 6 分钟

大小:986.92K时长:05:36
AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


Zilliz 技术总监武云峰已确认出席并发表题为《AI时代数据基础设施:向量数据库与云原生进化之路》的主题分享。


在 GenAI 快速发展的背景下,企业在使用向量数据库时面临多重挑战。当前用户在大量使用向量数据库过程中遇到的主要痛点有:

  • 数据迁移复杂,切换成本高:随着业务需求的变化,企业可能需要更换向量数据库。然而,不同向量数据库在数据格式、查询接口和性能指标等方面存在差异,导致数据迁移成为一项复杂且高成本的任务。传统的 ETL 工具主要针对结构化数据,缺乏对向量数据特性的支持,使得向量数据库之间的数据迁移更加困难。

  • 数据合规性与主权问题:在全球部署 AI 应用时,企业需遵守各地的数据保护法规,如 GDPR 等。传统基础设施在灵活适应不同地区的合规需求方面存在限制,难以满足数据主权和合规性的要求。

  • 数据模型演进(Schema Evolution)困难:随着业务的发展,数据模型可能需要变更,例如增加新的向量或标量字段,并填充历史数据。在传统数据库中,模式演进可能导致数据不一致或需要大量的手动干预


过去一年,Zilliz Cloud 在这几个问题上取得了一些关键进展:开发专门针对向量数据的迁移工具,如基于 Apache SeaTunnel 的 VTS(Vector Transport Service),以支持向量和非结构化数据的高效迁移;采用 BYOC(Bring Your Own Cloud)模式,使组织能够在自己的私有云环境中托管数据,确保数据主权和合规性。同时,实施透明加密机制和严格的访问控制,保障数据安全;引入支持 Schema Evolution with data backfill 的机制,保证上层业务模型发生改变时,能够快速应对。



武云峰是前百度 Elasticsearch 负责人、Apache Doris Committer,现任 Zilliz 技术总监,专注于向量数据库在全球 AI 场景中的落地与创新。拥有多年开源搜索引擎与 OLAP 数据库研发经验,精通数据库 SaaS 产品的架构设计与体系化建设。


在百度期间,曾主导百度云 Elasticsearch 以及百度云 Elasticsearch PaaS 平台从零到一的搭建,打造国内领先的搜索引擎服务平台,推动多项技术创新并实现商业化重大突破。此后曾主导国内知名 OLAP 数据库 SaaS 产品的北美落地与商业化进程,实现从 0 到 1 的出海突破,积累了具备丰富的数据库产品全球化实战经验,并在数据安全与合规策略方面有深厚经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. AI 基础设施的行业重塑浪潮

  • AI Gen 时代对数据基础设施的新需求

  • 向量数据库在生成式 AI 中的关键角色

  • 从存储数据到理解数据:基础设施的范式转变

2. 当前用户或业务遇到痛点问题

  • 数据迁移复杂,切换成本高

  • 数据合规性与主权问题

  • 数据模型演进(Schema Evolution)困难

3. 核心能力进展与技术亮点

  • 数据迁移复杂,切换成本高,让数据迁移更像“流动”而不是“搬家”

  • 向量数据从本地、第三方云无缝迁移

  • 集群内迁移场景的灵活调度:降低业务中断、支持弹性资源伸缩

  • 用例:客户在训练/推理阶段的多集群协同处理

  • 数据合规性与主权问题,引入 BYOC Deployment Mode

  • 企业能够在自己的云环境中托管数据,确保数据主权和合规性,又可以实现服务的完全托管

  • TDE(Transparent Data Encryption)如何守护 AI 时代的数据隐私

  • 高级数据处理:从数据库走向智能数据平台

  • 支持数据模型的演化

  • 更适配 AI 场景中的模型重训练、数据补充等操作

4. 构建全球分布式的 AI 数据云

  • Geo Replication:多地域/多云同步,提升响应速度与容灾能力

  • 托管模型(Model Hosting):下一步计划支持轻量推理与在线嵌入

  • 服务全球 AI 开发者,打造“模型 + 数据 + 算法”的一体化平台


听众收益

  • 理解向量数据库在 AI 系统中的核心价值与应用场景

  • 获取 AI 基础设施在数据迁移、安全合规、数据处理方面的最新实践经验

  • 了解如何通过 Zilliz Cloud 快速构建企业级、可演进的 AI 数据平台

  • 获取 Zilliz Cloud 在 Geo Replication、托管模型等未来能力的前瞻信息


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。



2025-06-17 09:2917

评论

发布
暂无评论
AI时代数据基础设施:向量数据库与云原生进化之路|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章