写点什么

AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海

  • 2025-04-23
    北京
  • 本文字数:1573 字

    阅读完需:约 5 分钟

大小:846.96K时长:04:49
AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


字节跳动 A/B 测试技术负责人韩云飞已确认出席 AICon 上海并将在AI for Data,数据管理与价值挖掘实践专题发表题为《AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环》的主题分享。字节跳动 A/B 测试平台(内部名称 Libra,对外产品 DataTester)是全球领先的 A/B 测试与智能优化平台,累计支持超 340W 次实验,同时运行 7W+实验,覆盖抖音、今日头条等数百业务。平台脱胎于字节跳动 2012 年引入的 A/B 测试体系,2016 年实现产品化,2021 年通过火山引擎开放给企业客户,融合了科学分流、智能分析、多场景特型实验等能力,成为驱动业务增长的核心基础设施。在 AI 时代,平台正从“功能策略验证工具”向“企业创新加速引擎”升级,探索推理模型+数据+工程的自动化决策范式。


韩云飞作为字节跳动 A/B 测试技术负责人,负责字节跳动通用实验平台,致力于打造业界最科学好用的实验平台,把 A/B 测试变成驱动业务创新的新基建。从 0 到 1 参与搭建了字节跳动内 A/B 测试与智能优化平台 Libra,服务于抖音、番茄小说、今日头条等数百个业务;对外发布火山引擎 A/B 测试 DataTester 等产品。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 传统 A/B 测试的挑战与 AI 的颠覆性机会

  • 传统 A/B 测试的“天花板”

  • 人工设计依赖经验,实验效率低(如多变量组合爆炸问题)

  • 样本偏差与统计显著性陷阱(尤其在小流量场景)

  • 长反馈周期无法匹配业务实时决策需求

  • AI 的颠覆性价值

  • 从“假设驱动”到“智能驱动”:AI 自动生成实验假设和设计、自主分析结果

  • 从“串行分工”到“智能协同”:面向 PM、DA、RD 等实验 Role 的 AI Team 协同

  • 从“结果验证”到“决策生成”:模拟海量用户在线实验效果提前敏捷决策

2. 字节跳动 A/B 测试平台的进化路径

  • 第一阶段:规模化实验基础设施

  • 超大规模和复杂场景实验引擎

  • 科学高效的实验科学分析引擎

  • 第二阶段:AI 增强的智能实验

  • 超参数优化:基于历史数据的贝叶斯优化,自动优化参数组合

  • 流量智能调优:基于多臂老虎机,在实验运行中动态调整流量

  • 因果推断增强:通过异质人群挖掘,自动下钻出实验影响维度

  • 第三阶段:决策智能体生态

  • 智能实验设计:通过自然语言交互定义实验假设和设计

  • 智能实验分析:分析智能体助力日常实验分析与写报告

  • 海量用户模拟:基于 AI 的预实验模拟,规避策略冲突与业务风险

3. 未来展望:A/B 测试的终极形态

  • 个性化实验设计:未来的 A/B 测试将从"一刀切"的分组进化为针对不同用户精准设计的个性化实验,大幅提高实验效率和精度

  • 因果推断的突破:AI 系统将帮助企业从相关性分析迈向更深层次的因果推断,从"发现现象"升级为"理解原因",为决策提供更深刻的洞察

  • 闭环决策系统:A/B 测试将从独立工具演变为完整的决策闭环系统,整合假设生成、实验设计、结果分析和自动执行,实现决策过程的高度自动化,进化为企业创新操作系统


听众收益:

  • 战略视角:理解 AI 如何将 A/B 测试从“辅助工具”升级为“决策核心”,重塑企业竞争力

  • 技术前瞻:掌握 A/B 测试与生成式 AI、因果推断等新技术融合最新技术路径

  • 实践洞察:借鉴字节跳动亿级用户场景的实战经验,规避规模化实验的典型陷阱


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-23 17:003604

评论

发布
暂无评论

你不是说你会Aop吗?

Java旅途

读书笔记:Google软件测试之道【二】

Man

测试 测试文化

原创 | 使用JPA实现DDD持久化- O:对象的世界(1/3)

编程道与术

Java hibernate DDD JDBC jpa

从0到1搭建大数据平台之调度系统

数据社

大数据 工作流调度

读书笔记:Google软件测试之道【三】

Man

测试 测试文化

ElasticSearch笔记

石刻掌纹

企业玩转DevOps转型:由弱到强,只需7步

华为云开发者联盟

DevOps 软件工程 组织转型 软件开发 华为云

聚焦智慧城市生活服务,百度携手贝塔智能按下“加速键”

百度大脑

人工智能 人脸识别 AR 百度大脑 智慧城市

MySQL 的 crash-safe 原理解析

vivo互联网技术

MySQL 数据库 开源

3行!仅3行代码就能抓取B站(弹幕、评论、用户)数据

华为云开发者联盟

数据 B站 代码 词云图 API

从0到1搭建大数据平台之数据采集系统

数据社

大数据 数据采集

计算机网络基础(十二)---网络层-外部网关路由协议

书旅

计算机网络 网络 协议栈 BGP

阿里巴巴《Java 开发手册》—嵩山版发布,附下载链接!

程序员生活志

Java 学习 阿里巴巴 手册

读书笔记:Google软件测试之道【一】

Man

测试 测试文化

成功的9大步骤:从手动测试转为自动化测试

禅道项目管理

测试 自动化测试

话题讨论 | 哪本极具影响力的书,是每位程序员都应该读的?

InfoQ写作社区官方

写作平台 话题讨论

区块链在这些生活场景中悄然落地了......

CECBC

区块链 落地应用

JVM系列之:JIT中的Virtual Call接口

程序那些事

Java JVM JIT

Flink x Zeppelin ,Hive Streaming 实战解析

Apache Flink

flink hive Zeppelin

自主管理——对人性的假设

zhongzhq

自主管理 组织

如何从0到1搭建大数据平台

数据社

大数据 中台

30秒,2种方法解决SQL Server的内存管理问题

华为云开发者联盟

数据库 sql 内存 服务器 华为云

实时计算的业务劣势、思维误区和改进之道

KAMI

大数据 flink 方法论 实时计算

LeetCode题解:70. 爬楼梯,DP遍历,变量缓存结果,JavaScript,详细注释

Lee Chen

大前端 LeetCode

什么样的服务器适合做APP?

德胜网络-阳

架构师训练营第九周作业

一剑

ARTS-WEEK9

一周思进

从0到1搭建大数据平台之计算存储系统

数据社

大数据 中台 计算引擎

LeetCode 328. Odd Even Linked List

liu_liu

算法 LeetCode

糟糕,你写的 BUG 要被存1000年了!

华为云开发者联盟

GitHub 开源 代码 bug 卤化银胶片

写作社区划线笔记新功能全新上线!给你带来不一样的写作学习体验~

InfoQ写作社区官方

写作平台 玩转写作平台 热门活动

AI 时代实验平台演进之路,从 A/B 测试到智能决策闭环|AICon 上海_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章