【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

国际机器学习顶会 ICML,我们来了!

  • 2019-08-26
  • 本文字数:1392 字

    阅读完需:约 5 分钟

国际机器学习顶会ICML,我们来了!

当地时间 6 月 9 日,机器学习领域最具影响力的学术会议之一 ICML 2019 在美国长滩隆重开幕。在本次 ICML 上,支付宝展示了多篇入选论文成果,并在 6 月 9 日举行了专家云集的主题 workshop,现场与各位学者专家探讨了前沿金融智能技术和应用的发展。



据了解,本次 workshop 围绕金融智能展开,会上 AI 专家围绕金融智能应用实践、“小数据”、数据隐私安全等焦点问题进行了演讲分享,助力行业解决人工智能+金融融合创新中的技术难题。


workshop 结束后,仍有大批专家学者们留在现场热情交流。



而论文方面,本届 ICML 支付宝 AI 技术团队贡献了多篇论文研究成果,包括提出了用生成对抗用户模型来解决强化学习小样本的问题,并将此方法用在推荐系统的优化中;引入了分布梯度时序插分学习,在分布强化学习的基础上开辟了新的方向;提出了粒子流贝叶斯定理(particle flow Bayes’Rule)算法,实现对高维贝叶斯推理的精确度的提升优化等。


以下我们精选了其中 3 篇为大家介绍,分享支付宝 AI 在金融服务领域的最新研究:

Adversarial User Model for Reinforcement Learning BasedRecommendation System

简介:将强化学习(RL)用于推荐系统,能更好地考虑用户的长期效益,从而保持用户在平台中的长期满意度、活跃度。但是,强化学习需要大量训练样本。在这篇论文中,我们提出用生成对抗用户模型(GAN user model)作为强化学习的模拟环境,先在此模拟环境中进行线下训练,再根据线上用户反馈进行即时策略更新,以此实现对线上训练样本需求的极大降低。

Nonlinear distributional gradient temporal differencelearning

简介:我们在该篇论文中引入了分布梯度时序插分学习(distributional gradient temporal difference learnig)。近年来分布强化学习例如 DeepMind 的 c51 算法引起了学术界的广泛注意。相较于传统的强化学习算法,分布强化学习考虑到长期奖励(long term reward)的分布信息,使得其具有学习过程更稳定,收敛速度更快的优点。但是与神经网络相结合以及使用 off-policy 学习后,分布强化学习的收敛性依旧难以得到保证。因此我们将分布强化学习与梯度时序插分学习相结合,提出了 Distributional Mean Squared Bellman Error 做为我们的优化目标函数。该研究为分布强化学习提供了理论保障同时在其基础上开辟了新的研究方向。

Particle Flow Bayes Rule

简介:贝叶斯推理(Bayesian Inference)在高维问题中,由于高维积分带来一系列的计算和精度问题,计算后验概率(posterior)是一个重大挑战。除此之外,在许多现实的问题中,观测数据(observations)按顺序依次到达,贝叶斯推断需要反复迭代使用:在观察一些数据后得到的后验概率可以当作新的先验概率,再根据新的数据得到新的后验概率。这种问题需要算法能在不储存大量历史数据的情况下,在线执行快速、有效的贝叶斯更新(Bayesian updating)。为解决这一具有挑战性的问题,我们提出了粒子流贝叶斯定理(particle flow Bayes’ Rule),这是一个基于常微分方程(ODE)的贝叶斯算子。我们在几个经典、高维实验中展示了通过 meta learning 训练得到的粒子流贝叶斯算子(particle flowBayes’ Rule)的有效性以及泛化能力。尤其在高纬问题中,我们提出的算法对后验的估算比已有的算法在精确度以及计算效率上有明显的优势。


本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。


原文链接:


https://mp.weixin.qq.com/s/ISfL892oqYjc-eGMYwhUqw


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-08-26 10:56934
用户头像

发布了 150 篇内容, 共 31.9 次阅读, 收获喜欢 37 次。

关注

评论

发布
暂无评论
发现更多内容

强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动

2023年度解决方案大奖花落用友,人才发展解决方案备受瞩目

用友BIP

数智人力

一文了解Java低代码开发平台

互联网工科生

Java 低代码 JNPF java低代码开发平台

实录分享 | Alluxio Operator一体化部署方案

Alluxio

分布式 operator Alluxio 大数据 开源 容器化部署

阿里云EMAS超级App助力Agmo电动车超级应用程序发布

移动研发平台EMAS

阿里云 超级app解决方案

6 种方式读取 Springboot 的配置,老鸟都这么玩(原理+实战)

快乐非自愿限量之名

开发语言 spring-boot

EMQ & 明道云:零代码高效构建工业物联网设备管理平台

EMQ映云科技

IoT 工业物联网 明道云

智慧垃圾分类处理3D可视化系统

2D3D前端可视化开发

智慧环卫 智慧垃圾处理 智慧垃圾分类 智慧环保

镭速——简单、快速、自动备份数据到云端

镭速

谷歌推出“能讲会听”的大语言模型 AudioPaLM,实现语音理解和生成

Zilliz

谷歌 AIGC 大语言模型

低代码应用搭建平台,基于低代码快速开发管理系统

互联网工科生

低代码 低代码开发 JNPF

共建智能汽车数据管理方案 | 4.15 IoTDB X EMQ 主题 Meetup 回顾

Apache IoTDB

智能汽车 emq IoTDB

个推文案圈人模型助力TT语音智选人群,实现消息推送点击率提升120%

个推

消息推送 移动开发

Wise 的平台工程 KPI 探索之旅

快乐非自愿限量之名

KPI 平台工程 wise

AI+低代码:解密AI赋能,释放创新力量!

快乐非自愿限量之名

AI 低代码

超越极限!80Gbps高速传输,让您的数据瞬间飞速传递

镭速

集团公司该如何构建信息化系统?

优秀

信息化系统

国企为什么要建设数智底座?

用友BIP

数智底座 Pass平台

国外主机引领你的网站征服全球!

一只扑棱蛾子

国外主机

前端如何入门 Go 语言

高端章鱼哥

前端 Go 语言

3DCAT实时云渲染助力上海市乡村振兴可视化平台,展现数字乡村的魅力

3DCAT实时渲染

云渲染 数字孪生实时云渲染

2023-06-25:redis中什么是缓存穿透?该如何解决?

福大大架构师每日一题

redis 福大大架构师每日一题

深入理解并发编程艺术-内存模型篇

Java并发 内存模型 Java内存模型 多线程高并发 高并发编程

强化学习从基础到进阶-案例与实践[5]:梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动

略施小计,拥有自己的GPT

高端章鱼哥

人工智能 GPT ChatGPT

浅谈全面预算在交通运输与物流行业的应用

用友BIP

全面预算

SOFAStack 的下一个五年

SOFAStack

开源 SOFA 程序员 java

数字孪生城市革命!低代码开发平台引爆智慧未来

EquatorCoco

低代码 低代码开发 数字孪生城市

国际机器学习顶会ICML,我们来了!_文化 & 方法_Geek_cb7643_InfoQ精选文章