写点什么

端计算 Walle:2235 亿次运算,为了无法计算的端智能价值(二)

  • 2020-01-07
  • 本文字数:1031 字

    阅读完需:约 3 分钟

端计算Walle:2235亿次运算,为了无法计算的端智能价值(二)

面临的挑战

今年我们加大投入,并联合了算法团队、搜索推荐工程团队、手淘基础链路团队,共建端计算的工程体系。随着端计算体系承载的业务数量与复杂度的快速增加,也对 DAI 等基础设施提出来了更多更严峻的挑战。


▐ 研发效率


初期的设计是算法同学通过控制台下发 TensorFlow 的 pb(protobuffer) 模型文件,所有的逻辑均在 pb 的网络结构中实现。这种模式下,存在如下一些不足的地方。


  • 由于端侧集成的为精简版 TF Mobile ,算法同学编写的 TF 代码在端侧可能存在缺少算子而跑失败的情况。

  • 新增或修改 Op 需要 Native 发版实现,周期长。

  • if、for 等流程控制在 TF 中难以处理。

  • TF 的端侧推理耗时较长,业务决策响应不及时。


▐ 稳定性


Android 出于包大小和动态性的考虑,采用了动态下发并加载动态库的模式。但是由于 Android 设备的碎片化,动态加载存在着诸多兼容性的问题,测试也不好验证。同时 JavaScriptCore 本身在 iOS 上是个黑盒,曾在 iOS9 上就出现过大量的 JavaScriptCore 的 Crash 问题。而端计算作为算法处理的基础设施,每日被调用的次数非常庞大。所以任何一个极小的不稳定因素,都有可能被放大。


并且端侧的故障,大部分是由于线上配置发布引起的。手淘对于线上变更有着严格的安全生产流程,涉及发布窗口、验证、灰度、观察等各个环节。而算法同学往往对端侧的指标不熟悉,一些潜在风险未必能及时发现。我们需要在各个环节加强完善设施能力,在风险发生前及时暴露,在发生中将影响减至最低。


▐ 任务治理


在年初的时候,我们进行了一次线上业务梳理。发现手淘环境中有 5+的特征提取任务、4+的曝光任务。很多基础的数据特征,在不同的业务场景下都需要使用到,且对于同一特征的加工方式往往相识。若所有的特征均由各业务方自行进行加工,难免会造成开发成本及端上计算成本的浪费。而且无法高效地将已有能力复用到更多业务和 App 上。


▐ 场景覆盖


在端计算模式快速发展中,我们关注到部分业务域虽然不具备算法资源,但是希望借鉴端计算的思路,在一些输入因素相对比较固定的场景下,对用户特定的行为进行快速的响应与干预。同时初期 DAI 的触达能力比较单一,仅将执行结果以广播的方式通知到业务方,由业务方自行实现通知后的触达响应逻辑。而一些常规的触达途径,在大部分业务域都是相识的。比如 Push、Poplayer(浮窗)、触发其他模型任务联动等。在这个环节需要有一套统一的多样的触达机制,满足不同场景不同定制。


本文转载自淘系技术公众号。


原文链接:https://mp.weixin.qq.com/s/V2QrhvW-F8asXvtyg7i0XA


2020-01-07 18:05794

评论

发布
暂无评论
发现更多内容

Mac电脑又卡又慢?一招解决,让你的电脑重获新生。

阿拉灯神丁

存储空间 电脑运行缓慢 如何清理Mac磁盘 CleanMyMac X中文版 苹果电脑系统优化

提示工程演进之旅

俞凡

人工智能 提示工程

巨头竞争,用户得利!大众CEO直言:有比亚迪这样的对手,最终受益的是顾客

爱极客侠

MIAOYUN | 每周AI新鲜事儿(07.04-07.11)

MIAOYUN

人工智能 云计算 AI 云原生 AI 原生

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

刘大猫

人工智能 算法 DolphinScheduler 调度器 大模型

华为入选2025年Gartner®文件与对象存储平台"客户之选",连续四年获此称号

财见

【AI编程】AI+高德MCP不到10分钟搞定上海三日游

卷福同学

AI编程 cursor Trae

Burp Suite JSON美化扩展

qife122

安全测试 burp

海信连续九年跻身凯度BrandZ中国全球化品牌十强

财见

开普勒宣布完成A+轮融资,强势实现半年三轮融资

财见

霍尼韦尔战略性收购Li-ion Tamer以增强火灾探测技术,加强智能建筑产品组合

财见

TeaCode for Mac:开发者的代码加速神器

兮兮立立

Mac读取不到移动硬盘的常见原因及有效解决方法

阿拉灯神丁

格式化 Mac 软件 NTFS磁盘管理器 Tuxera NTFS2024 磁盘格式读写软件

MCP 极简开发 读书笔记 1

wasa

系统综述:全同态加密友好的对称密码与密文转换技术

qife122

全同态加密 密文转换

ROG 绝神 RO姬x初音未来版电竞显示器与双模新品BW2025首秀!

新消费日报

为文字预测建立数学模型

江南一点雨

HR Path达成新收购,强化在德外包专长

财见

下一代AI应用架构:LangChain工作流设计+70%内存优化方案

聚客AI学院

人工智能 agent langchain AI Agent AI 智能体

Chunked-Prefills 分块预填充机制详解

Se7en

大数据-40 Redis 类型集合 string list set zsorted hash 详解

武子康

Java redis 大数据 分布式 后端

Coco AI 实战(二):摄入MongoDB 数据

极限实验室

mongodb CocoAI

PID控制算法理论学习基础——单级PID控制

芯动大师

PID

全球MBA项目需求呈多样化趋势,考生偏好与项目类型高度关联

财见

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

刘大猫

人工智能 算法 数据分析 DolphinScheduler 调度器

基于强化学习的智能体自主决策

申公豹

智能体

IDM(Internet Download Manager)下载器的安装激活与换机方法

阿拉灯神丁

网络加速 下载器 IDM 下载工具

Perfectly Clear Video for Mac:一键焕活视频质感的神器

兮兮立立

深度RAG笔记01:核心概念与诞生背景

王翊仰

LLM rag

第七在线成功入选中服协《2025中国服装行业创新推荐目录》

第七在线

大数据-39 Redis 源码编译安装 启动 redis-server redis-cli

武子康

Java redis 大数据 分布式

端计算Walle:2235亿次运算,为了无法计算的端智能价值(二)_语言 & 开发_淘系技术_InfoQ精选文章