写点什么

如何利用在线实验提升算法工程效率

  • 2019-08-27
  • 本文字数:992 字

    阅读完需:约 3 分钟

如何利用在线实验提升算法工程效率

稳定压倒一切,如何在阿里巴巴的钱袋子做高频线上实验?A/B Testing 是算法模型进行在线实验的经典方法。Google 于 2010 年发表了分层正交实验论文,各大公司依此思想建立了分层实验平台,可以对流量多层正交,互不影响,从而最大化提升实验效率。 随着大规模机器学习技术的发展,高度复杂的深度模型被广泛使用,在线实验参数的变更,在后台会涉及复杂分布式系统数据切换,在线服务上线等一系列操作,会面临相当多问题,严重影响迭代效率。 阿里妈妈作为国内最大的商业广告提供商,高度依赖在线实验。在投放系统的各个阶段,如检索召回、排序、竞价,涉及系统上下游多个模块,同时迭代模型版本近百个,每日实验发布近百次。而在线学习等新技术使用,使模型变更更加高频化。错误实验会对系统造成急性或慢性损害,如分布式系统宕机,营收缓慢下跌,从而引发严重金融故障。 为了在金融系统做好在线实验,平衡效率与安全,我们研发了在线实验平台 WhaleShark,运用多种技术为业务提供最大帮助。目前已承载阿里妈妈所有场景广告,覆盖搜索直通车、超级推荐、品牌等多个业务场景,赋能用户进行模型、数据、配置、应用等多维高频变更。阿里巴巴高级技术专家向杭即将在 QCon 全球软件开发大会(上海站)2019分享《如何利用在线实验提升算法工程效率

内容大纲

  1. 阿里妈妈业务与架构;

  2. 在线实验平台的挑战、产品与架构 ;

  3. 新一代分层实验机制,包括独立分区,联合实验,混竞路由 ;

  4. 容器化隔离,动态路由,环境自动构建;

  5. 模型特征交付与自动验证;

  6. 监控与自动容灾;

  7. 全链路数仓。

听众受益

  1. 如何利用在线实验提升算法系统迭代效率;

  2. 新一代分层实验机制,如何流量复用最大化支持搜索广告场景;

  3. 如何利用容器化隔离、动态路由、环境一键构建、灰度发布、模型交付等技术提升效率与稳定性;

  4. 深度模型与特征的自动质量方案;

  5. 如何进行实验级实时监控与容灾;

  6. 如何信息化建设,关联利用算法各阶段数据,赋能业务演进。


嘉宾介绍


向杭,花名刑志,高级技术专家,2013 年加入阿里巴巴。现任阿里妈妈事业部工程生产力团队负责人。方向包括大规模算法与数据系统质量保证、实验效率提升、算法分析平台构建等。致力于运用技术手段,提升 AI 系统质量、监控、调试与分析能力,从而提升工业级算法迭代效率。带领团队在 SIGIR、KDD 发表多篇论文,涉及 CTR 预估模型可视化,大规模稀疏数据异常检测等多领域。


更多以云为始的工程效率实战的相关分享请访问 QCon 上海 2019 官网。


2019-08-27 16:224596

评论

发布
暂无评论
发现更多内容

盘点6个最受欢迎的 Vue.js UI 库

秃头小帅oi

对比传统主机,云主机贵吗?是否值得购买?

一只扑棱蛾子

云主机

AI PC的风刮到企业里,看英特尔vPro怎么做到的

E科讯

SD-WAN对云服务的影响

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

长期有效!开放原子基金会联合龙蜥社区推出的「人人都可以参与开源」学习赛上线

OpenAnolis小助手

开源 操作系统 龙蜥社区 开放原子 人人都可以参与开源

抢占市场先机:利用API商品数据接口激活您的数据资产

Noah

比特币价格突破62000美元,近一个月涨幅超过40%

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

什么是渗透测试?有哪些类型?

小齐写代码

『双向奔赴,绿动未来』 ——能效电气2024新品发布会

极客天地

商用AI PC,能帮企业带来什么?

E科讯

深度解析:Allure报告如何提升你的测试效率?

测试人

软件测试 自动化测试 测试开发

小红书笔记详情API入门指南

技术冰糖葫芦

API 文档

SD-WAN网络中,CPE设备的重要性与选择

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

电商卖家如何利用API获取用户行为数据

技术冰糖葫芦

API 文档 API 策略

MCtalk·CEO对话×影刀RPA丨不确定的周期,越要找到确定的竞争优势

ToB行业头条

7万张H100打造的Open AI文生视频Sora功能原理详解|Sora注册全攻略

GPU算力

立即报名|3 月 8 日北京,稳定性 & 可观测沙龙来了!

阿里巴巴云原生

阿里云 容器 微服务 云原生

跳槽必看MySQL索引:B+树原理揭秘与索引优缺点分析

王中阳Go

数据库 面试 金三银四 跳槽

杭州悦数受邀参加《大模型驱动的智能知识图谱》标准首次专家研讨会

悦数图数据库

IDC 中搭建 Serverless 应用平台:通过 ACK One 和 Knative 玩转云资源

阿里巴巴云原生

阿里云 云原生 容器服务

可用于智能客服的完全开源免费商用的知识库项目

不在线第一只蜗牛

架构 开源项目 技术栈 智能客服

SD-WAN技术:是挑战还是机遇?

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

超越传统模式:商品企划系统如何助力鞋服品牌创新突围?

第七在线

集成专栏丨解析WSDL自动生成API

inBuilder低代码平台

开源 低代码 集成 连接器

文心一言 VS 讯飞星火 VS chatgpt (204)-- 算法导论15.3 3题

福大大架构师每日一题

福大大架构师每日一题

从 0 开始构建知识图谱的 5 个启动建议

悦数图数据库

知识图谱

如何利用在线实验提升算法工程效率_QCon_向杭_InfoQ精选文章