强化学习

关注
收录了强化学习频道下的 117 篇内容
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。
  • 全部
  • 文章
  • 视频
  • 电子书
基于自监督的可逆性强化学习方法
基于自监督的可逆性强化学习方法

本文提出了一种方法,该方法可以让强化学习智能体通过学习随机采样轨迹事件的时序模型来预测动作的可逆性,从而得到更好的探索和控制。

科大讯飞1024开发者节,发布开放平台2.0战略,李开复谈AI趋势
科大讯飞 1024 开发者节,发布开放平台 2.0 战略,李开复谈 AI 趋势

了解人工智能目前的发展现状和在各个领域的应用情况,以及未来的趋势预测。

AI 在视频领域运用—弹幕穿人
AI 在视频领域运用—弹幕穿人

如今,B 站已经成为了国内最大的视频弹幕网站,其他视频平台、漫画、阅 读等内容平台也都增加了弹幕功能。弹幕已经成为一种重要的内容互动的手段, 因此研发一套接入灵活、玩法丰富的弹幕组件就显得非常重要 。

七牛云产品发布会 | 以“PISA”之名开启智能运维新时代
七牛云产品发布会 | 以“PISA”之名开启智能运维新时代

诚邀您共同见证——PISA(Pandora Intelligent Service Analysis),并与汽车、金融等行业大咖探讨数智化下的决胜之道!

三位深度学习先驱联合发文:深度学习的挑战与未来
三位深度学习先驱联合发文:深度学习的挑战与未来

深度学习的三位先驱在 ACM 通讯期刊 7 月刊上发表的一篇论文中指出,深度神经网络将在没有来自符号人工智能的帮助的情况下迈过当下面临的种种障碍。

真香了!上手使用DeepMind分布式强化学习框架Acme ,对开发者超友好
真香了!上手使用 DeepMind 分布式强化学习框架 Acme ,对开发者超友好

这款框架不仅适用于高级研究人员,而且还能让初学者实现颇为简单的算法——这和对初学者与专家都很友好的 TensorFlow 和 PyTorch 差不多。

DeepMind科学家:强化学习足以满足通用AI需求
DeepMind 科学家:强化学习足以满足通用 AI 需求

强化学习这一基于奖励最大化理念的人工智能分支,可以引领通用人工智能的发展。

(深入篇)漫游语音识别技术—带你走进语音识别技术的世界
(深入篇)漫游语音识别技术—带你走进语音识别技术的世界

前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天咱们继续漫游语音识别技术哈,今天内容稍微专业一些,大家可以结合上一篇漫游语音识别技术一起学习。

AI前线(2020年11月)AI前线(2020年11月)
AI 前线(2020 年 11 月)

本期推荐内容:中台的邪,为什么 CXO 们都信了?爱奇艺技术总监朱俊敏:奇观识别方案从云迁移到端的探索和实践;被嫌弃的 35 岁程序员。

360展示广告智能化演进
360 展示广告智能化演进

本文主要介绍了效果优化系统随业务发展的演进过程,聚焦如何使用算法解决客户痛点,实现广告投放智能化。使大家了解到展示广告算法团队如何分析业务,如何选择算法,如何优化系统的过程。

对话任务中的“语言-视觉”信息融合研究
对话任务中的“语言 - 视觉”信息融合研究

目标导向的视觉对话是“视觉 - 语言”交叉领域中一个较新的任务,它要求机器能通过多轮对话完成视觉相关的特定目标。该任务兼具研究意义与应用价值。

英特尔聚焦全栈量子研究:发布多项重磅量子计算研究成果

图注:英特尔公司使用这种同位素纯晶片在其 300 毫米工艺技术上发明了自旋量子位制造流程。(图片来源:英特尔公司)

不透明的人工智能模型可能具有欺骗性
不透明的人工智能模型可能具有欺骗性

如果人工智能模型的运作方式不透明,就很难信任任何模型或任何第三方来源。

Uplift-Model在贝壳业务场景中的实践
Uplift-Model 在贝壳业务场景中的实践

本文主要从基础概念、表示方式、构建方法、评估方式以及应用方案等几方面对增益模型进行介绍,让各位读者对增益模型有了一个更全面的认识。

KDD Cup 2020多模态召回比赛季军方案与广告业务应用
KDD Cup 2020 多模态召回比赛季军方案与广告业务应用

本文将介绍多模态召回赛道季军的技术解决方案,以及在美团搜索广告业务中的应用与实践。希望能给从事相关工作的同学带来一些帮助或者启发。

KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用
KDD Cup 2020 多模态召回比赛亚军方案与搜索业务应用

本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。

深度强化学习在滴滴路径规划中的探索
深度强化学习在滴滴路径规划中的探索

路径规划是网约车服务的重要一环,与用户体验直接相关

跨越计算鸿沟:如何靠软硬件协同突破算力瓶颈?| InfoQ 大咖说
跨越计算鸿沟:如何靠软硬件协同突破算力瓶颈?| InfoQ 大咖说

数据、算法、算力被称作深度学习的三架马车,共同驱动了第三轮人工智能浪潮的兴起。一方面,硬件计算能力的发展确实快速推动深度学习技术在各个领域取得巨大进展,但另一方面,深度学习模型升级的频率显著高于过去,模型的计算力需求呈爆炸式增长,已经将过去多年来累积的计算力成本下降的红利迅速蚕食。

AI前线(2020年9月)AI前线(2020年9月)
AI 前线(2020 年 9 月)

本期主要内容:互联网大厂干了十年,经历了创业、上市、被收购后,我决定加入传统行业;硅谷的“数据中台”实践

深度广度模型在用户购房意愿量化的应用
深度广度模型在用户购房意愿量化的应用

本文主要介绍了深度广度模型在用户价值量化上的应用,包括 wide&deep 的应用与迭代,端到端与预训练的讨论以及时序模型与深度广度模型的结合,在预测结果上也取得了较为明显的正向收益,提高了头部准确率。

开放域对话系统:现状和未来
开放域对话系统:现状和未来

本文系统地介绍开放域对话系统最前沿的技术,包括知识对话生成、基于强化学习的可控对话、大规模预训练对话模型等等,以及展开对开放域对话系统未来发展的讨论。

深度广度模型在用户购房意愿量化的应用
深度广度模型在用户购房意愿量化的应用

在部分场景如点击率预估中,输入的特征一般为大规模稀疏矩阵,如何对输入进行有效表达就成了深度学习在点击率预估中应用的关键所在。

KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践
KDD Cup 2020 Debiasing 比赛冠军技术方案及在美团广告的实践

本文将介绍 Debiasing 赛题的技术方案,以及团队在广告业务中偏差消除的应用与研究。

强化学习在外卖商业中发挥的作用 | ArchSummit
强化学习在外卖商业中发挥的作用 | ArchSummit

经过几年的发展,美团外卖的日订单早已突破千万单。业务成长到一定阶段后,进行商业变现是一个常见的问题。

详解Graph Embedding经典方法:算法原理、代码实现与应用样例
详解 Graph Embedding 经典方法:算法原理、代码实现与应用样例

图神经网络 DeepWalk 算法原理 DeepWalk 算法图网络现在非常的流行,应用场景也十分的广泛,在推荐领域应用也十分广泛。

《AI前线》(2020年8月)《AI前线》(2020年8月)
《AI 前线》(2020 年 8 月)

本期主要内容:百度七剑客王啸对话一流科技袁进辉:新基建开启程序员时代,10 年催生 10 倍以上互联网机会;工资 2 到 2.5 倍,国内两大芯片厂被曝挖走台积电 100 多位工程师。

推荐系统的未来发展
推荐系统的未来发展

本文从政策及技术发展对推荐系统的影响、推荐系统的就业变化、推荐系统的应用场景及交互方式、推荐算法与工程架构、人与推荐系统的有效协同、推荐系统多维度价值体现等 6 个方面来讲解推荐系统的未来发展

架构师特刊:北大AI公开课全回顾架构师特刊:北大AI公开课全回顾
架构师特刊:北大 AI 公开课全回顾

InfoQ 作为独家合作媒体全程跟进北京大学最受欢迎的 AI 公开课“人工智能前沿与产业趋势”,并对北大这 10 场公开课进行了整理。

PyTorch 1.6发布,微软接管Windows版的开发工作
PyTorch 1.6 发布,微软接管 Windows 版的开发工作

Facebook 的深度学习开源框架 PyTorch 发布了 1.6 版本,带来了新的 API 和性能改进。与此同时,微软宣布将接管该框架 Windows 版本的开发和维护工作。

机器学习模型在携程海外酒店推荐场景中的应用
机器学习模型在携程海外酒店推荐场景中的应用

酒店涉及到的推荐场景较多,例如城市热门酒店推荐、附近同类型酒店推荐、机票页酒店交叉推荐、Meta 着陆页相似酒店推荐、信息流推荐等。 大部分场景都实现了个性化的推荐服务,其核心就是一组酒店与一组用户相匹配的挑战。本文介绍机器学习模型在携程海外酒店推荐场景中的应用。

    工程能力漫谈
    工程能力漫谈

    章淼 博士 | 百度智能云 架构师

    立即下载
    Databricks Lakehouse Platform: Simple, Open, Collaborative

    张泊 | Databricks 资深工程师

    立即下载
    Kylin 4:A Major Step Forwards To CLOUD

    陈畅 | Kyligence 资深架构师兼首席性能专家

    立即下载