【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

揭秘阿里价值百亿的深度学习算法

  • 2019-08-15
  • 本文字数:1625 字

    阅读完需:约 5 分钟

揭秘阿里价值百亿的深度学习算法

阿里妈妈是阿里巴巴集团旗下的大数据营销平台,拥有阿里巴巴集团的核心商业数据。每天有超过 50 亿推广流量完成超过 3 亿件商品推广展现,覆盖高达 98%的网民。



智能数字化营销是阿里妈妈重要的营销形态,其实数字化营销并不只是我们普遍认为竞价词拍卖、搜索推荐等技术,在这个社交数据爆炸的时代,我们完全可以利用AI技术加上大数据分析,从用户的更多数据中分析用户的行为,记录他的喜好,这也是 AI 技术在工业界成功的应用场景之一。


机器学习技术的应用改变了数字化营销的效率和形态,阿里妈妈结合机器学习、深度学习等人工智能技术,在内容理解、用户理解、用户行为预估、智能出价、商品周期优化等方面进行数字化营销的技术和业务创新。


作为推动工业级深度学习应用的先行者之一,阿里妈妈从 2015 年开始一系列探索,并在 2016 年尝试了第一代深度学习算法,在后续几年里,深度学习算法模型不断更新迭代,为阿里妈妈带来了大量红利。以阿里妈妈定向广告场景为例,深度学习算法直接带来的收入增长红利在 2018 年就已经超过百亿。


关于深度学习和机器学习在阿里妈妈内部的应用,InfoQ 曾经采访过阿里妈妈深度学习算法平台负责人朱小强老师。他提到人工智能技术在互联网行业核心业务实践应该分为两个阶段。第一阶段从 2010-2015 年之间,机器学习技术在谷歌、百度等这样的大公司开始赋能业务,规模化落地。但这个过程中大家发现工业界的数据规模实在太大了,企业需要付出很高的成本去训练算法模型,所以后来出现了大规模分布式机器学习架构和 Hadoop、Spark 等大数据架构的兴起。


第二阶段是 2016 年初开始,以广告、推荐和搜索为代表的互联网公司开始发现,新一轮爆发于学术界和传统 AI 领域(如语音、图像等)的深度学习浪潮,也给互联网技术带来了全新的机会。


过去的机器学习模型本身相对来讲比较固化和简单,还是偏重以人工先验设计加工的数据模式为主,但这一代的深度学习技术带来了更彻底的变革。首先深度学习本身的模型容量更大、变化更丰富,可以针对具体的场景数据进行模型的自由定制。


其次,模型的设计变得更加简单,基于标准化的深度学习训练框架可以非常容易地实现一个全新的算法模型并进行大规模的分布式训练,普通的算法工程师就能轻松完成这个过程。而在以前的大规模机器学习阶段,需要非常强大的专业团队花费大量时间才能定制式地研发出一个工业级可用的新模型算法;此外,当模型训练出来之后,现在已经有一个非常体系化的流水线来支持任意复杂算法模型快速部署到线上提供服务。



阿里妈妈从 2015 年底开始进行工业级深度学习的探索,2016 年启动大规模深度学习框架以及算法的研发,到 2017 年的时候,阿里妈妈已经走在了深度学习的主航道上面,核心算法已经全部深度学习化,取得了显著的发展。这成为了业界的一个技术样本间。今天业界很多企业在看到了这条道路的可行性后,也纷纷跟随头部企业的脚步、开启了大规模的深度学习技术升级的浪潮。


在今年 11 月的AICon全球人工智能与机器学习技术大会上,朱小强老师将会来到现场跟大家分享深度学习技术在阿里妈妈内部的发展现状[strong_end]。作为现任阿里妈妈深度学习算法平台负责人、兼任定向广告 &信息流广告排序技术团队负责人。他主持了三代核心算法架构(大规模、深度端到端、深度实时化)的设计和落地,驱动了深度学习对阿里广告技术的全面变革与创新,领导了阿里开源深度学习框架 X-DeepLearning 从 0 到 1 的自研、从 1 到开源演进的全过程。相信到时他一定会带来很多技术干货,感兴趣的朋友可以来现场看看。


AICon全球人工智能与机器学习技术大会,将于 11 月 21-22 日在北京国际会议中心举行。颜水成、贾扬清、崔宝秋等 AI 技术大咖届时也会来现场,跟大家聊一聊今年在 AI 商业化场景落地的大背景下,又涌现出了哪些新技术。本次大会我们设立了机器学习、计算机视觉、NLP、AI 芯片、搜索推荐、产业互联网、硅谷 AI 技术实践等 13+技术专场,细分到 AI 技术的各个领域,为大家全方位的展示 AI 技术在国内目前发展的现状。


2019-08-15 11:253435

评论

发布
暂无评论
发现更多内容

产品需求交付质量保证的“七重门” | 京东云技术团队

京东科技开发者

测试 交付质量 企业号10月PK榜

峰会倒计时 3 天!互联网与文娱论坛演讲亮点预告!

SelectDB

数据库 大数据 数据仓库 实时数仓 apache doris

哪家堡垒机支持国密算法?有哪些功能?

行云管家

运维 堡垒机 安全运维 国密浏览器 国密算法

CrossOver for Mac(Mac安装exe应用)23.6中文激活版

芷水微澜_cde4d8

crossover CrossOver2023 CrossOver Mac下载 crossover mac 破解版

一款兼容微信抖音支付宝小程序的工具可以直接把小程序搬到自己App

Onegun

小程序 小程序容器

梦幻西游手游详细图文架设教程

echeverra

梦幻西游

如何给模型换色

3D建模设计

3D模型 颜色 材质

高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来

蓝海大脑GPU

和鲸ModelWhale与中科可控X系列异构加速服务器完成适配认证,搭载海光芯片,构筑AI算力底座

ModelWhale

gpu 服务器 信创 算力 数据科学

瑞技伙伴 | ZPE 带外管理方案,稳固您的IT世界

Bytebridge

数据中心 带外管理方案 ZPE

OpenHarmony持久化存储UI状态:PersistentStorage

OpenHarmony开发者

OpenHarmony

浅析“代码可视化” | 京东云技术团队

京东科技开发者

架构 字节码 企业号10月PK榜 代码可视化

如何按照固定比例缩放模型

3D建模设计

3D模型 等比缩放

Elasticsearch Relevance Engine---为AI变革提供高级搜索能力[ES向量搜索、常用配置参数、聚合功能等详解]

汀丶人工智能

ES 向量检索 搜索系统 语义搜索

这一大波Offer来的太突然了

王磊

Java

如何合并模型对象

3D建模设计

模型 3D

如何修改模型粗糙度增强模型表面粗糙度

3D建模设计

3D模型 粗糙度

HarmonyOS音频开发指导:使用AVPlayer开发音频播放功能

HarmonyOS开发者

HarmonyOS

C4D 2024插件:Arnold for mac(C4D S2024阿诺德渲染器) v4.6.6.1完美激活版

mac

苹果mac Windows软件 Arnold for Cinema 4D C4D R24插件

云计算进入 AI 原生时代

Baidu AICLOUD

大模型 RDMA AI 原生云

即时通讯音视频开发(二十):一文读懂视频的颜色模型转换和色域转换

JackJiang

网络编程 即时通讯 IM

选择香港服务器发展线上业务的未来趋势:技术与市场的变化

一只扑棱蛾子

香港服务器

cpu温度监测推荐 Turbo Boost Switcher Pro激活最新版

胖墩儿不胖y

Mac软件 温度监测工具

深入理解 Netty FastThreadLocal

vivo互联网技术

性能优化 Netty ThreadLocal 内存泄漏 FastThreadLocal

万字长文:拆解银行数智运营之困!

京东科技开发者

人工智能 数字化转型 金融 企业号10月PK榜

对话在行人|九州通:携手用友打造招聘共享中心实现招聘数智化

用友BIP

2023全球商业创新大会 对话在行人

即刻报名,企业服务与新经济论坛亮点提前揭秘!

SelectDB

数据库 大数据 数据仓库 实时数仓 apache doris

如何设计一套基于API的会员系统

Kevin_913

架构设计实战 Java'

想让你的代码简洁,试试这个SimpleDateFormat类高深用法

华为云开发者联盟

Java 后端 开发 华为云 华为云开发者联盟

研发日常踩坑-Mysql分页数据重复 | 京东云技术团队

京东科技开发者

MySQL 数据库 分页 企业号10月PK榜

正确选择数据库安全运维平台的几个原则-行云管家

行云管家

数据库 数据安全 数据库安全 安全运维

揭秘阿里价值百亿的深度学习算法_AI&大模型_胡骁杰_InfoQ精选文章