强化学习

关注
收录了强化学习频道下的 173 篇内容
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。
  • 全部
  • 文章
  • 视频
  • 电子书
司巧蕾:培养数字人才,助力企业数字化业务价值实现
司巧蕾:培养数字人才,助力企业数字化业务价值实现

“提升岗位胜任力、实现业务价值是数字人才培养的出发点和检验标准。” 极客时间企业版全新发布「数字人才一体化解决方案」,精准解决数转企业解决人才数字技能培养需求。

云端机器人的“智慧大脑”是如何获取知识,提升认知,完成“进化”的?| InfoQ《极客有约》
云端机器人的“智慧大脑”是如何获取知识,提升认知,完成“进化”的?| InfoQ《极客有约》

云端智能机器人如何获取知识,完成进化?

AutoML:实践者眼中的理想与现实
AutoML:实践者眼中的理想与现实

与自动化协作远比人类自己单打独斗要好很多。

不要指望下一个像GPT这样的大型语言模型会民主化
不要指望下一个像 GPT 这样的大型语言模型会民主化

在过去几年中,大型语言模型已经成为人工智能研究最热门的领域之一。

Stability AI开源图像生成模型Stable Diffusion
Stability AI 开源图像生成模型 Stable Diffusion

文本至图像的 AI 模型。

黄剑龙:汽车行业趋势下的人才挑战 | DTDS 8 月
黄剑龙:汽车行业趋势下的人才挑战 | DTDS 8 月

DTDS 峰会汇聚了来自政府和产业的权威,以及金融、汽车、制造、ICT、零售、互联网、风控审计企业的数字化先锋人物,旨在建立数字人才培养“朋友圈”,让大家从多维视角了解企业数字化转型,人才发展,和组织变革的先进经验。

邰慧:企业数字化转型与数字化人才培养 | DTDS 8 月
邰慧:企业数字化转型与数字化人才培养 | DTDS 8 月

DTDS 峰会汇聚了来自政府和产业的权威,以及金融、汽车、制造、ICT、零售、互联网、风控审计企业的数字化先锋人物,旨在建立数字人才培养“朋友圈”,让大家从多维视角了解企业数字化转型,人才发展,和组织变革的先进经验。

进入数字经济时代,产品经理需要具备什么思维和技能?
进入数字经济时代,产品经理需要具备什么思维和技能?

对于产品经理来说,抓住数字转型这波浪潮,保持自我学习与成长,会有更广阔的发展空间。

ICT行业讲师评定认证项目发布 助推我国数字人才培养
ICT 行业讲师评定认证项目发布 助推我国数字人才培养

据悉,ICT 行业讲师评定认证系统将于 8 月 15 日正式上线。

英伟达发布基于深度增强学习的电路设计方法PrefixRL
英伟达发布基于深度增强学习的电路设计方法 PrefixRL

英伟达发布 PrefixRL,一种基于强化学习(RL)的方法,用它设计的并行前缀电路比用最先进的电子设计自动化(EDA)工具设计的并行前缀电路更小、更快。

面向开发者的AI:是未来还是现实?
面向开发者的 AI:是未来还是现实?

在这篇文章中,作者 Nikita Povarov 讨论了 AI/ML 在软件开发中扮演的角色,以及如何通过机器学习来实现代码补全、代码搜索和 Bug 检测等功能。

接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论
接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论

今年早些时候某高级研究员曾给另两名初级 AI 研究员“挖坑”——暗示二人研究成果有错,甚至存在伪造行为。

如何解决企业数字化转型中的根本问题?
如何解决企业数字化转型中的根本问题?

如何解决企业数字化转型中的根本问题?

一个茶艺师转型程序员的小故事
一个茶艺师转型程序员的小故事

一个茶艺师转型程序员的小故事

昇腾 AI 开发者创享日:开发者进阶路上的 buff 加成
昇腾 AI 开发者创享日:开发者进阶路上的 buff 加成

窥见 AI 的未来发展趋势,获取前沿 AI 技术,更新自身知识体系,为职场加码。

鲲鹏说-《美的智能家居的数字化历程》
鲲鹏说 -《美的智能家居的数字化历程》

1. 美的集团的数字化转型历程 2. 美的在智能家居领域的创新和探索 3. 数字化转型如何避“坑”

我是怎么走上 Rust 这条“不归路”的?|InfoQ 大会早班车
我是怎么走上 Rust 这条“不归路”的?|InfoQ 大会早班车

4 月 26 日晚 8 点,连线两位 Rust 老兵,一起聊一聊。

突破思维局限,加速能力提升
突破思维局限,加速能力提升

极客邦发布“名企师友计划”

软硬结合——AR技术落地之路
软硬结合——AR 技术落地之路

随着元宇宙等概念的爆发,AR 在今年进入了一个新的发展阶段。在本次分享中,我将介绍 AR 的流程、AR 的硬件和软件的发展现状,之后结合 AR 的几个难点重点讲述软硬结合,最后展望 AR 的发展趋势。

异地多活——携程 MySQL 实时双向(多向)复制
异地多活——携程 MySQL 实时双向(多向)复制

为了服务于公司 G2-GreatQuality(高品质)和 Globalization(全球化)战略,携程从 2019 年下半年开始启动异地多活项目。MySQL 原生一主多从架构下,机房故障时需要数据层的 DR 切换,造成恢复时间长;针对一些海外业务如果需要写数据,通常需要将数据回源上海,业务响应时间变长体验变差。异地多活架构下,机房故障时,只需要在入口将流量切离故障机房业务即可恢复,业务出海上云后实现本地读写。本次演讲,我将向大家介绍异地多活的核心组件 DRC 的详细设计以及背后的思考,在业务落地过程中遇到的问题以及解决方案。

高清虚拟人视频合成技术
高清虚拟人视频合成技术

高清虚拟人视频合成技术

RocketMQ5.0,生于云、长于云的新一代“消息、事件、流”融合处理平台
RocketMQ5.0,生于云、长于云的新一代“消息、事件、流”融合处理平台

RocketMQ 诞生于阿里云,自成为 Apache 顶级项目后在高可靠、高性能、低延迟领域有了长足的发展,俨然成为业内最流行的金融级消息中间件。本次议题从云上大规模生产场景出发,介绍新一代 RocketMQ5.0 在基础架构云原生化演进设计,并在此基础上分享 RocketMQ5.0 对于 Streaming 处理和事件驱动不一样的设计和思考。

字节跳动基于 eBPF 的百万级主机网络可观测性实践与探索
字节跳动基于 eBPF 的百万级主机网络可观测性实践与探索

⽹络连接的可观测性在互联⽹数据中⼼中⾮常重要,包括业务上下游的调⽤关系、实时流量,数据中⼼跨节点的实时流量和拥塞情况,特殊场景下,还需要额外关注如丢包、延迟、流量异常等。在⽹络异常的定位的过程中,我们期望能快速定位到受影响范围和根因,为业务运维提供有效⽀持,降低损失。 Bytemap 是字节跳动内基于主机⽹络监控数据打造的数据中⼼⽹络可观测平台,为各业务侧、及数据中⼼整体的⽹络基础设施提供多维度的⽹络质量监控。在具体实现上,我们通过主机内核的 eBPF 采集机制来获取基于连接层⾯细粒度的内核⽹络监控指标,通过实时数仓储存数据和对接流式分析平台。在产品层,我们通过与应⽤、主机的监控指标串联形成统⼀的监控产品。同时通过 API 和数据消费的形式,为多种运维场景提供⽀持。系统上线两年多时间运⾏稳定,多次为业务排障、业务流量容量规划预估提供了完备的数据⽀持,并且与多个运维场景相结合,解决其他场景中遇到的痛点问题,发挥价值。

与流量赛跑——机票盲盒活动背后的故事
与流量赛跑——机票盲盒活动背后的故事

今年 4 月,同程艺龙上线了机票目的地盲盒活动,一经上线就倍受用户青睐。盲盒活动背后,面临着诸多的挑战,不仅仅有大流量对整个业务系统的考验,还有用户交互体验和口碑也对整个活动的成败有着重要的影响。要保障盲盒活动的顺利进行,不是使用某一个技术,或者依靠某一个系统就能做好的,而是积累的一系列平台和系统的合力使然。本次演讲,我将向大家揭露我们在盲盒活动中各系统的保障技术,有值得肯定的,有值得反思的,还有意料之外的。

阿里小蜜数字人互动决策的探索与落地
阿里小蜜数字人互动决策的探索与落地

阿里小蜜数字人互动决策的探索与落地

阿里可观察性数据引擎的技术实践
阿里可观察性数据引擎的技术实践

随着微服务、云原生、容器编排、DevOps 等新一代技术的出现,传统的监控已经很难适应如今复杂的业务系统,因此可观察性的概念开始被各大公司争相追捧。本次分享主要介绍阿里在可观察性问题上的思考,如何从底层存储引擎做起,全面支撑 PB 级 Logs、Metrics、Traces 各类可观察性数据的统一存储、分析与应用。

    中间件云原生后的思考,我眼中云原生的未来
    中间件云原生后的思考,我眼中云原生的未来

    彭文杰 | 阿里巴巴 云原生应用平台高级技术专家

    立即下载
    ClickHouse 企业级应用和最佳实践

    陈星 | 字节跳动 分析型数据库负责人

    立即下载
    云原生微服务治理架构深度解读和实践

    童子龙 | 腾讯云 中间件高级工程师

    立即下载