写点什么

如何利用在线实验提升算法工程效率

  • 2019-08-27
  • 本文字数:992 字

    阅读完需:约 3 分钟

如何利用在线实验提升算法工程效率

稳定压倒一切,如何在阿里巴巴的钱袋子做高频线上实验?A/B Testing 是算法模型进行在线实验的经典方法。Google 于 2010 年发表了分层正交实验论文,各大公司依此思想建立了分层实验平台,可以对流量多层正交,互不影响,从而最大化提升实验效率。 随着大规模机器学习技术的发展,高度复杂的深度模型被广泛使用,在线实验参数的变更,在后台会涉及复杂分布式系统数据切换,在线服务上线等一系列操作,会面临相当多问题,严重影响迭代效率。 阿里妈妈作为国内最大的商业广告提供商,高度依赖在线实验。在投放系统的各个阶段,如检索召回、排序、竞价,涉及系统上下游多个模块,同时迭代模型版本近百个,每日实验发布近百次。而在线学习等新技术使用,使模型变更更加高频化。错误实验会对系统造成急性或慢性损害,如分布式系统宕机,营收缓慢下跌,从而引发严重金融故障。 为了在金融系统做好在线实验,平衡效率与安全,我们研发了在线实验平台 WhaleShark,运用多种技术为业务提供最大帮助。目前已承载阿里妈妈所有场景广告,覆盖搜索直通车、超级推荐、品牌等多个业务场景,赋能用户进行模型、数据、配置、应用等多维高频变更。阿里巴巴高级技术专家向杭即将在 QCon 全球软件开发大会(上海站)2019分享《如何利用在线实验提升算法工程效率

内容大纲

  1. 阿里妈妈业务与架构;

  2. 在线实验平台的挑战、产品与架构 ;

  3. 新一代分层实验机制,包括独立分区,联合实验,混竞路由 ;

  4. 容器化隔离,动态路由,环境自动构建;

  5. 模型特征交付与自动验证;

  6. 监控与自动容灾;

  7. 全链路数仓。

听众受益

  1. 如何利用在线实验提升算法系统迭代效率;

  2. 新一代分层实验机制,如何流量复用最大化支持搜索广告场景;

  3. 如何利用容器化隔离、动态路由、环境一键构建、灰度发布、模型交付等技术提升效率与稳定性;

  4. 深度模型与特征的自动质量方案;

  5. 如何进行实验级实时监控与容灾;

  6. 如何信息化建设,关联利用算法各阶段数据,赋能业务演进。


嘉宾介绍


向杭,花名刑志,高级技术专家,2013 年加入阿里巴巴。现任阿里妈妈事业部工程生产力团队负责人。方向包括大规模算法与数据系统质量保证、实验效率提升、算法分析平台构建等。致力于运用技术手段,提升 AI 系统质量、监控、调试与分析能力,从而提升工业级算法迭代效率。带领团队在 SIGIR、KDD 发表多篇论文,涉及 CTR 预估模型可视化,大规模稀疏数据异常检测等多领域。


更多以云为始的工程效率实战的相关分享请访问 QCon 上海 2019 官网。


2019-08-27 16:224609

评论

发布
暂无评论
发现更多内容

NeurIPS 2025 | 从数据微调到反馈优化!可灵团队提出基于人类反馈的视频生成训练范式

快手技术

大语言模型 NeurIPS 顶会论文

在AI技术唾手可得的时代,挖掘新需求成为制胜关键——某知名Android通讯应用框架功能探索

qife122

移动应用 AI技术

大数据-163 Apache Kylin Segment 合并实战:手动/自动合并、保留策略与 JDBC 示例

武子康

scala 大数据 kylin 分布式 Apache Kylin

IP应用场景全图谱:你的IP属于哪一类?

郑州埃文科技

Web信息的物联网设备指纹如何生成

郑州埃文科技

为什么70%的品牌企业都在关注生成式AI营销,但是行动者寥寥

易观分析

营销 geo 生成式AI

IP定位精度疑问:有些IP为什么难以达到街道级准确度?

郑州埃文科技

面对网络攻击告警 IP地址如何实现自动化封禁

郑州埃文科技

分布式光伏 “四可” 装置:“发电孤岛” 到 “电网友好” 的关键跨越

西格电力

智能化技术 分布式光伏并网 光伏四可装置 分布式光伏发电 分布式光伏产品

内网视频会议:构筑医院安全高效的协同生命线

BeeWorks

即时通讯 IM 私有化部署

楼宇间网络拓扑测绘 从原理到精准部署

郑州埃文科技

数据如何赋能出版 解锁乘数效应

郑州埃文科技

静态IP详解 与动态IP的区别及其核心应用

郑州埃文科技

【HarmonyOS 6】UIAbility跨设备连接详解(分布式软总线运用)

GeorgeGcs

6G移动网络需三倍于当前频谱资源以满足激增数据需求。

财见

ExecuTorch越界访问漏洞深度解析

qife122

网络安全 机器学习框架

Playwright MCP:AI自动化测试,告别传统脚本编写

测吧(北京)科技有限公司

Visual Studio 2026 现已正式发布,更快、更智能!

追逐时光者

微软 visual studio2026

稳不稳?LED地砖屏承重标准大揭秘!

Dylan

广告 广告业 LED LED display LED屏幕

在AI技术唾手可得的时代,挖掘新需求成为核心竞争力——某知名AI开发框架需求洞察

qife122

AI开发 产品创新

从枯竭到无限:IPv6如何解决IPv4的危机?

郑州埃文科技

设备指纹技术 从特征选择到应用实践

郑州埃文科技

数据会说话,但你真的听懂了吗?

HuiZhuDev

数据分析 商业洞察 AI工具 数据驱动决策 数据分析报告

数据流通合规新基建 隐私计算平台的三重安全防线

郑州埃文科技

微软2017年6月安全更新指南:关键漏洞修复与技术防护

qife122

网络安全 Windows安全

亲测有效!用Dify工作流+AI智能体,我们的测试效率提升了300%

测吧(北京)科技有限公司

OpenTenBase 部署规模超50万,开源数据库加速拥抱AI时代

极客天地

《爱立信移动市场报告》:差异化连接服务加速增长

财见

IP归属地颗粒度和IP应用场景的关系

郑州埃文科技

1688商品详情API完整指南

Datafox(数据狐)

1688商品详情接口 1688API 1688商品数据采集 1688商品详情API

如何利用在线实验提升算法工程效率_QCon_向杭_InfoQ精选文章