强化学习

关注
收录了强化学习频道下的 83 篇内容
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。
  • 全部
  • 文章
  • 视频
  • 迷你书
DeepMind 发布Acme框架,可简化强化学习算法开发
DeepMind 发布 Acme 框架,可简化强化学习算法开发

这是一种分布式强化学习框架,可以用来创建更具并行性的智能体,以简化强化学习算法开发。

数学在机器学习中的角色
数学在机器学习中的角色

数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少。

爱奇艺深度语义表示学习的探索与实践
爱奇艺深度语义表示学习的探索与实践

本文将介绍爱奇艺深度语义表示框架的核心设计思路和实践心得。

未来可期的 TypeScript丨GMTC
未来可期的 TypeScript 丨 GMTC

的组合拳让不少原本持怀疑,甚至抵制态度的前端开发者们不禁喊出“真香!”。迁移提供策略性建议与方案。为前端编程带来了什么?

Flutter:最新进展和未来展望丨GMTC
Flutter:最新进展和未来展望丨 GMTC

和桌面多个平台实现高质量原生应用程序的开源 UI 工具包。Dart 语言新特性、开发工具、以及中国社区的发展状况。

WebAssembly — 技术变革,未来已来丨GMTC
WebAssembly — 技术变革,未来已来丨 GMTC

年出现后便一直受到开发者们的关注。技术则更加开放和统一。等其他静态语言代码快速的“运行”在浏览器中,这一特性为前端密集计算场景提供了无限的可能。

阿里文娱搜索算法实践与思考
阿里文娱搜索算法实践与思考

本文以优酷为例,分享视频搜索的算法实践。

Transformer 在美团搜索排序中的实践
Transformer 在美团搜索排序中的实践

本文介绍 Transformer 在美团搜索排序上的实践经验。

CTR预估在动态样式建模和特征表达学习方面的进展
CTR 预估在动态样式建模和特征表达学习方面的进展

本文介绍一种动态样式组合优选加 DSA 模型,并结合分位置拍卖技术,较完美地解决了组合样式优选的问题。

    百度 AIOps 黄金指标异常检测技术实践

    王博 | 百度 资深运维工程师

    立即下载
    基于Flutter引擎的TypeScript UI框架在树莓派上的应用

    徐远同(二同) | 淘宝 前端渲染技术团队负责人

    立即下载
    华为云DevCloud的网站优化实践

    侯凡 | 华为 前端架构师

    立即下载