写点什么

如何利用在线实验提升算法工程效率

  • 2019-08-27
  • 本文字数:992 字

    阅读完需:约 3 分钟

如何利用在线实验提升算法工程效率

稳定压倒一切,如何在阿里巴巴的钱袋子做高频线上实验?A/B Testing 是算法模型进行在线实验的经典方法。Google 于 2010 年发表了分层正交实验论文,各大公司依此思想建立了分层实验平台,可以对流量多层正交,互不影响,从而最大化提升实验效率。 随着大规模机器学习技术的发展,高度复杂的深度模型被广泛使用,在线实验参数的变更,在后台会涉及复杂分布式系统数据切换,在线服务上线等一系列操作,会面临相当多问题,严重影响迭代效率。 阿里妈妈作为国内最大的商业广告提供商,高度依赖在线实验。在投放系统的各个阶段,如检索召回、排序、竞价,涉及系统上下游多个模块,同时迭代模型版本近百个,每日实验发布近百次。而在线学习等新技术使用,使模型变更更加高频化。错误实验会对系统造成急性或慢性损害,如分布式系统宕机,营收缓慢下跌,从而引发严重金融故障。 为了在金融系统做好在线实验,平衡效率与安全,我们研发了在线实验平台 WhaleShark,运用多种技术为业务提供最大帮助。目前已承载阿里妈妈所有场景广告,覆盖搜索直通车、超级推荐、品牌等多个业务场景,赋能用户进行模型、数据、配置、应用等多维高频变更。阿里巴巴高级技术专家向杭即将在 QCon 全球软件开发大会(上海站)2019分享《如何利用在线实验提升算法工程效率

内容大纲

  1. 阿里妈妈业务与架构;

  2. 在线实验平台的挑战、产品与架构 ;

  3. 新一代分层实验机制,包括独立分区,联合实验,混竞路由 ;

  4. 容器化隔离,动态路由,环境自动构建;

  5. 模型特征交付与自动验证;

  6. 监控与自动容灾;

  7. 全链路数仓。

听众受益

  1. 如何利用在线实验提升算法系统迭代效率;

  2. 新一代分层实验机制,如何流量复用最大化支持搜索广告场景;

  3. 如何利用容器化隔离、动态路由、环境一键构建、灰度发布、模型交付等技术提升效率与稳定性;

  4. 深度模型与特征的自动质量方案;

  5. 如何进行实验级实时监控与容灾;

  6. 如何信息化建设,关联利用算法各阶段数据,赋能业务演进。


嘉宾介绍


向杭,花名刑志,高级技术专家,2013 年加入阿里巴巴。现任阿里妈妈事业部工程生产力团队负责人。方向包括大规模算法与数据系统质量保证、实验效率提升、算法分析平台构建等。致力于运用技术手段,提升 AI 系统质量、监控、调试与分析能力,从而提升工业级算法迭代效率。带领团队在 SIGIR、KDD 发表多篇论文,涉及 CTR 预估模型可视化,大规模稀疏数据异常检测等多领域。


更多以云为始的工程效率实战的相关分享请访问 QCon 上海 2019 官网。


2019-08-27 16:224558

评论

发布
暂无评论
发现更多内容

圆桌派来啦!与行业大咖聊聊Dapr的发展与实践

行云创新

云原生 dapr

【高并发】解密导致并发问题的第三个幕后黑手——有序性问题

冰河

并发编程 多线程 协程 异步编程 精通高并发系列

Apache flink - PartitionNotFoundException

李印

flink 消费 kafak 错误排查

互联网的下一站,大概率是能源

脑极体

《数字经济全景白皮书》Z世代用户洞察篇(1)重磅发布!

易观分析

Z世代

智能化时代的数据集成技术革新

Apache SeaTunnel

大数据 开源 数据同步 Meetup Apache SeaTunnel

无需编程,基于甲骨文oracle数据库零代码生成CRUD增删改查RESTful API接口

crudapi

oracle 零代码 API crud 增删改查

预约中,2022京东云产业融合新品发布会线上开启

京东科技开发者

云计算 京东云 产品发布会 直播预约

Redis集群架构剖析(5):复制与故障转移

非晓为骁

主从复制 redis cluster master

数字产业化快于产业数字化?

BeeWorks

传统链游的革新,PlatoFarm用实际行动回馈Dao社区

BlockChain先知

HertzBeat入GVP啦,并 v1.0.beta.7 发布,易用友好的云监控系统

TanCloud探云

开源 APM angular java;

中国SaaS的增长真相|ToB大师课

ToB行业头条

netty系列之:netty中的核心解码器json

程序那些事

Java Netty 程序那些事 4月月更

EMQ 映云科技为抗疫项目提供全托管 MQTT 云服务免费使用

EMQ映云科技

物联网 IoT mqtt emq 抗疫

领域驱动设计(DDD)靠谱么?

架构精进之路

DDD 4月日更 4月月更

【Zeekr_Tech】汽车软件敏捷开发和分支管理

Zeekr_Tech

敏捷开发 智能驾驶

传统链游的革新,PlatoFarm用实际行动回馈Dao社区

西柚子

怒肝 JavaScript 数据结构 — 栈篇(二)

杨成功

数据结构 4月月更

C++后端开发进阶学习大纲指南

赖猫

c++

云上MongoDB常见索引问题及最优索引规则大全

MongoDB中文社区

mongodb

博睿数据首批加入云科通明湖生态联盟,赋能信创生态谋未来

博睿数据

微信朋友圈的高性能复杂度

哈喽

「架构实战营」

在线XML转JSON工具

入门小站

工具

提升职场竞争力!低代码开发师(高级)认证发布

一只大光圈

低代码 数字化 钉钉宜搭 宜搭

linux之ssh命令

入门小站

Linux

我真不信,这年头还有人能懂SpringBoot的ClassLoader加载机制

Java工程师

Java spring 程序员 科技

C++11 智能指针之shared_ptr<void>

轻口味

c++ android 4月月更

PLG公司的机遇和挑战

LigaAI

SaaS LigaAI PLG

足不出户,搞定交付——独家交付秘籍(第二回)

阿里巴巴云原生

适合中小企业的知识库软件有哪些?

小炮

知识管理

如何利用在线实验提升算法工程效率_QCon_向杭_InfoQ精选文章