2025云栖大会,开启通往AGI的未来之旅 了解详情
写点什么

AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海

  • 2025-04-23
    北京
  • 本文字数:1573 字

    阅读完需:约 5 分钟

大小:846.96K时长:04:49
AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


字节跳动 A/B 测试技术负责人韩云飞已确认出席 AICon 上海并将在AI for Data,数据管理与价值挖掘实践专题发表题为《AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环》的主题分享。字节跳动 A/B 测试平台(内部名称 Libra,对外产品 DataTester)是全球领先的 A/B 测试与智能优化平台,累计支持超 340W 次实验,同时运行 7W+实验,覆盖抖音、今日头条等数百业务。平台脱胎于字节跳动 2012 年引入的 A/B 测试体系,2016 年实现产品化,2021 年通过火山引擎开放给企业客户,融合了科学分流、智能分析、多场景特型实验等能力,成为驱动业务增长的核心基础设施。在 AI 时代,平台正从“功能策略验证工具”向“企业创新加速引擎”升级,探索推理模型+数据+工程的自动化决策范式。


韩云飞作为字节跳动 A/B 测试技术负责人,负责字节跳动通用实验平台,致力于打造业界最科学好用的实验平台,把 A/B 测试变成驱动业务创新的新基建。从 0 到 1 参与搭建了字节跳动内 A/B 测试与智能优化平台 Libra,服务于抖音、番茄小说、今日头条等数百个业务;对外发布火山引擎 A/B 测试 DataTester 等产品。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 传统 A/B 测试的挑战与 AI 的颠覆性机会

  • 传统 A/B 测试的“天花板”

  • 人工设计依赖经验,实验效率低(如多变量组合爆炸问题)

  • 样本偏差与统计显著性陷阱(尤其在小流量场景)

  • 长反馈周期无法匹配业务实时决策需求

  • AI 的颠覆性价值

  • 从“假设驱动”到“智能驱动”:AI 自动生成实验假设和设计、自主分析结果

  • 从“串行分工”到“智能协同”:面向 PM、DA、RD 等实验 Role 的 AI Team 协同

  • 从“结果验证”到“决策生成”:模拟海量用户在线实验效果提前敏捷决策

2. 字节跳动 A/B 测试平台的进化路径

  • 第一阶段:规模化实验基础设施

  • 超大规模和复杂场景实验引擎

  • 科学高效的实验科学分析引擎

  • 第二阶段:AI 增强的智能实验

  • 超参数优化:基于历史数据的贝叶斯优化,自动优化参数组合

  • 流量智能调优:基于多臂老虎机,在实验运行中动态调整流量

  • 因果推断增强:通过异质人群挖掘,自动下钻出实验影响维度

  • 第三阶段:决策智能体生态

  • 智能实验设计:通过自然语言交互定义实验假设和设计

  • 智能实验分析:分析智能体助力日常实验分析与写报告

  • 海量用户模拟:基于 AI 的预实验模拟,规避策略冲突与业务风险

3. 未来展望:A/B 测试的终极形态

  • 个性化实验设计:未来的 A/B 测试将从"一刀切"的分组进化为针对不同用户精准设计的个性化实验,大幅提高实验效率和精度

  • 因果推断的突破:AI 系统将帮助企业从相关性分析迈向更深层次的因果推断,从"发现现象"升级为"理解原因",为决策提供更深刻的洞察

  • 闭环决策系统:A/B 测试将从独立工具演变为完整的决策闭环系统,整合假设生成、实验设计、结果分析和自动执行,实现决策过程的高度自动化,进化为企业创新操作系统


听众收益:

  • 战略视角:理解 AI 如何将 A/B 测试从“辅助工具”升级为“决策核心”,重塑企业竞争力

  • 技术前瞻:掌握 A/B 测试与生成式 AI、因果推断等新技术融合最新技术路径

  • 实践洞察:借鉴字节跳动亿级用户场景的实战经验,规避规模化实验的典型陷阱


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-23 17:004053

评论

发布
暂无评论

日记 2021年2月22日(周一)

Changing Lin

2月春节不断更

Apache Flink 在快手的过去、现在和未来

Apache Flink

flink

浅谈nodejs进程和线程

梁龙先森

大前端 nodejs 2月春节不断更

JVM又曾放过谁,垃圾终将被回收!

Simon郎

Java 大数据 架构 后端 JVM

先收藏!关于Java类、接口、枚举的知识点大汇总

华为云开发者联盟

Java 接口 枚举

Flink SQL 性能优化:multiple input 详解

Apache Flink

flink

电影台词反向搜索视频片段,这个工具也太好用了吧|33 台词

彭宏豪95

效率 效率工具 电影

基于证券云服务的总体架构设计应该怎么做?

Jason Tien

一文带你熟悉Pytorch->Caffe->om模型转换流程

华为云开发者联盟

网络 模型 PyTorch caffe 算子边界

话题讨论 | 你在互联网大厂是个啥级别?

架构精进之路

话题讨论 28天写作 话题王者

【LeetCode】托普利茨矩阵Java题解

Albert

算法 LeetCode 28天写作 2月春节不断更

WinDbg 分析高内存占用问题

dotnet windbg

架构师不至于“架构”-《架构师应该知道的37件事》阅读笔记

Harris

读书笔记 架构 架构师

话题讨论 | 现实中程序员是怎样飞快敲代码的?

xcbeyond

程序人生 话题讨论

技术扫盲:关于低代码编程的可持续性交付设计和分析

小傅哥

Java 小傅哥 服务端 低代码开发 可持续交付

架构设计篇之微服务实战笔记(三)

小诚信驿站

架构师 刘晓成 小诚信驿站 28天写作 架构师成长笔记

我与技术面试那些事儿

我是哪吒

CSS html 大前端 28天写作 2月春节不断更

诊所数字化:诊所开展私域运营的优劣势

boshi

医疗 私域运营 七日更 28天写作

话题讨论 | 程序员是做前端开发好,还是后端开发好呢?

xcbeyond

程序人生 话题讨论

为图片添加Emoji,微信这隐藏功能让你不花冤枉钱

彭宏豪95

微信 效率 效率工具 emoji

MySQL查看及杀掉链接方法大全

Simon

MySQL

配合Github Actions 做一个自动推送的 Rss 订阅机器人

Leetao

Python RSS Github Action

技术解析 | Doris SQL 原理解析

百度开发者中心

百度 Doris SQL优化

容器 & 服务:一个Java应用的Docker构建实战

程序员架构进阶

Docker 容器 七日更 28天写作 2月春节不断更

为什么不推荐使用汉字作为密码?

不脱发的程序猿

程序人生 密码学 28天写作 二月春节不断更

还愁追不到女神吗?一键生成舔狗日记,一秒速成舔狗之王

不脱发的程序猿

程序人生 28天写作 二月春节不断更 舔狗文化

我身边的高T,问了Java面试者这样的问题......

京东科技开发者

MySQL 数据库

超强前端面试真题+资源推荐

爱学习

面试 大前端 面经

Dapr 知多少 | 分布式应用运行时

架构 云原生 k8s dapr

用Stylish精简极客时间专栏页面

Tao

CSS

2021最新百度/平安/蚂蚁金服/腾讯/拼多多面经总结(附答案解析)

比伯

Java 编程 架构 面试 计算机

AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章