迁移学习:迈向真正的人工智能

2020 年 8 月 15 日

迁移学习:迈向真正的人工智能

30 多年前我与杨强教授在人工智能(AI)的国际会议上相遇并相识,而后发现我们对 AI 有着共同的兴趣并从事类似的研究工作。当时正处于第一代 AI 的高潮,符号主义占主导地位。我们利用以知识为基础的符号推理模型研究 AI 中的各种问题,如 规划搜索学习 等。这是当时的主流,以机器学习为例,如从观察中学习、基于案例的推理、类比学习和归纳学习等,它们均从模仿人类的宏观学习机制出发,以知识(或经验)驱动为基础。这种学习方法的优点是, 学习的模型和结果很容易实现跨领域和跨任务的推广

不难看出,这些学习方法正是当今 迁移学习 (Transfer Learning)的探路者。可惜,不久它们就遭遇了 AI 的冬天。由于知识获取与表示的困难,以及当时计算机计算能力的限制,符号主义的主张没有得到应有的发展和大规模的应用,以知识为基础的学习方法也同样受到重创。21 世纪初,机器学习中的一个分支—— 概率统计学习 (特别是 深度学习 )异军突起,获得巨大成功。它不仅建立了较好的理论基础和有效的算法,还成功地得到商业应用,成为推动产业和社会发展的重要力量,使 AI 进入了以数据驱动为主导的第二代 AI 发展时代。凭借大数据、强大的算法和算力,第二代 AI 在模式识别等领域表现出超越人类的性能。可惜,以数据驱动为基础建立的 AI 系统十分脆弱,推广能力也很差,例如:机器学习模型在某些方面可以具有很高的性能, 但当模型应用于有别于训练环境的场景中时,其性能显著下降,甚至完全不能使用,与人类“随机应变”和“举一反三”的真正智能相去甚远。

为了迈向真正的 AI,我们需要第三代 AI,而 迁移学习 正在向这一道路迈进。迁移学习将知识驱动方法和数据驱动方法结合起来,以打破基于大数据的“黑箱”学习带来的不可解释、脆弱与易受攻击等缺陷,建立可解释与鲁棒的 AI 理论和方法,开发安全、可信、可靠和可扩展的 AI 技术。由于能同时利用 知识数据算法算力 这四大要素,AI 一定可以再创辉煌。《迁移学习》展示了在通往真正 AI 的道路上作者在机器学习领域已经取得的成果。

迁移学习如何将基于数据学习得到的模型从一种场景更新或者迁移到另一场景,从而实现跨领域和跨任务的推广?具体的做法如下:首先,从学习训练的环境(包括训练数据与方法)出发,发现哪些(具有某种通用性的)知识可以跨领域或者跨任务进行迁移,哪些只是针对单个领域或单个任务的特定知识,并利用通用的知识帮助提升目标域或目标任务的性能。这些通用知识主要通过以下 4 种渠道迁移到目标域中,即 源域中可利用的样本源域和目标域中可共享的特征源域模型中可利用的部分源域中实体之间的特定规则

《迁移学习》 是杨强教授与其学生在多年研究的基础上撰写的,它包含了迁移学习的基础、方法、技术和应用。

迁移学习

杨强 张宇 戴文渊 潘嘉林 著
2020 年 8 月 出版

本书主要由两部分组成: 第一部分 从代表性方法和理论研究的角度介绍 迁移学习的基础第二部分 讨论迁移学习中的一些 新热点 , 以及展示一些成功应用迁移学习的 场景 。本书包含很多原创性的成果,是一部值得广大读者阅读的专著。本书向我们展示了作者为走向真正 AI 所做出的努力,因此不仅适合关注迁移学习的读者,而且对于所有关心人工智能的读者都是有益处的。

本文转载自公众号华章计算机(ID:hzbook_jsj)。

原文链接

https://mp.weixin.qq.com/s/s5TQTneeGeX7s3-HkTFQZg

2020 年 8 月 15 日 14:05 1281

评论

发布
暂无评论
发现更多内容

Java世界的“烂”包管理

阿喜伯

maven Git Submodule

优化工程师逻辑视角下的微信“拍一拍”功能

Earth_Polarbear

人工智能 微信 系统工程 优化逻辑

区块链系列教程之:比特币的钱包与交易

程序那些事

比特币 区块链 智能合约 钱包 交易

Java操作Excel竟如此简单

生命在于折腾

Java EasyExcel

效率思维模式与Zombie Scrum

Worktile

敏捷开发

[安利] 可能会让你爱上书写的工具组合!

猴哥一一 cium

Typora markdown markdown编辑器 玩转写作平台

在项目中随手把haseMap改成了currenHaseMap差点被公司给开除了

java金融

Java 后端 BigDecimal金额 Arrays.asList

在 React 仓库中的那些 package

teabyii

源码 前端 React

软件设计原则

yupi

架构师训练营 - 第 2 周命题作业

红了哟

从拼多多突破阿里和京东两大巨头绞杀,市值破千亿美金来看职业价值链

非著名程序员

程序员 程序人生 职业规划 程序员成长 职业成长

golang-pprof实战笔记

卓丁

golang pprof 性能分析

[架构师训练营] 2 依赖倒置

悬浮

架构师训练营第三周学习总结

张明森

如何做好职场印象管理?

石云升

职场 印象管理 职场形象

ArrayList哪种循环效率更好你真的清楚吗

java金融

Java 后端 ArrayList 循环效率 方式

一款跨平台免费的开源 SQL 编辑器和数据库管理器!

JackTian

数据库 sql GitHub 开源项目 实用工具

游戏夜读 | RPG的美式和日式

game1night

架构师训练营 - 第2周学习总结

红了哟

策略模式解析

七哥爱编程

设计模式 策略模式

啥是CPU缓存?又如何提高缓存命中率呢?

八两

大话设计模式 | 3. SOLID原则

Puran

设计模式

Git 基础知识学习

LeoBing

SpringIOC 是依赖倒置吗?

yupi

把主机放在家里

centos Homework

Kafka面试题:基础27问,必须都会的呀!

Java小咖秀

大数据 kafka 分布式 队列 延时消息

【Golang runtime学习笔记-启动过程分析】

卓丁

golang 初始化 runtime 汇编 go汇编

终于有人把 java代理 讲清楚了,万字详解!

java金融

Java jdk 后端 动态代理 cglib

实现一个redis命令--nonzerodecr

老胡爱分享

redis 源码分析 源码阅读

由一次管理后台定时推送功能引发的对 RabbitMQ 延迟队列的思考 (二)

LSJ

Java RabbitMQ 延迟队列 优先级队列

2020最新阿里Java高级面试题(首发,50道附答案)

互联网架构师小马

迁移学习:迈向真正的人工智能-InfoQ