写点什么

对话机器学习大神 Michael Jordan:简介

  • 2014-09-21
  • 本文字数:1852 字

    阅读完需:约 6 分钟

Michael I. Jordan 是加州大学伯克利分校电子工程系、计算机科学和统计系的陈丕宏杰出教授。他在亚利桑那州立大学获得了数学硕士学位,并且在 1985 年从加利福尼亚大学圣地亚哥分校获得了认知学博士学位。自 1988 年到 1998 年,乔丹在麻省理工学院任教授,他的研究方向包括了计算学、统计学、认知科学以及生物科学,最近几年集中在贝叶斯非参数分析,概率图模型,谱方法,核方法和在分布式计算系统、自然语言处理、信号处理和统计遗传学等问题的应用上。

乔丹教授是美国国家工程学院院士、科学院院士和美国艺术和科学学院院士。同时,他还是美国科学进步协会的资深会员。他被数理统计研究所任命为奈曼讲师和奖章讲师。在 2015 年,他获得了 David E. Rumelhart 奖;在 2009 年,他获得了 ACM/AAAI 的 Allen Newell 奖。同时,他是 AAAI、ACM、ASA、CSS、IEEE、IMS、ISBA 和 SIAM 的成员。

带着在机器学习方面的诸多的贡献,于 9 月 10 日,Michael I. Jordan 教授在著名社区 Reddit 的机器学习板块参加了“Ask Me AnyThing”活动,乔丹教授回答了机器学习爱好者许多问题。本系列整理了相关的问答,供远在地球另一面的国内人工智能和机器学习爱好者学习讨论,所有问答的先后顺序由 Reddit 用户投票决定。

乔丹教授在机器学习领域里一个重要的贡献就是关于参数化模型和非参数模型的研究,他认为非参数模型还没有开始发展。在问及这个话题时,他指出主要是相关领域学者根本没有尝试过。他以 LDA 模型为例详细讲述了这两种模型。注意到 LDA(隐含狄利克雷分布)是一个带参数的贝叶斯模型,其中包括 K 个假设已知的主题。而非参数版本的 LDA 被称为 HDP(隐含狄利克雷过程)。从实际实现上来看,从 LDA 到 HDP 仅仅是一小步。从 LDA 提出至今,LDA 已经被用于数千种应用了。然而,使用 LDA 模型并不比使用 HDP 模型具有更多的优势,有时候甚至恰恰相反。

乔丹教授认为,贝叶斯非参数模型领域的推广真正需要的是一个简单的介绍——写出它的数学模型,并且展示它的美丽——目前这样的介绍并不存在。所以,他和他的同事 Yee Whye The 正在从事这项工作,并基本上写完了这样的介绍,有很大可能在今年秋天发行出来。

乔丹教授非常看好非参数模型,他说到“贝叶斯非参数模型刚刚在机器学习领域里点亮了未来,将如同经典的非参数模型有着广阔的舞台和发展前景”。这些模型能够在复杂性上持续增长,就像在信息时代数据积累看上去那么自然。如果这些模型能够得到很好的控制,并且聚焦在在带参数的子模型,非参数模型将会越来越流行。

机器学习领域非常博大精深,很多人可能是刚刚入门,好的学习资料对于机器学习初学者来说非常有用。乔丹教授在黑客新闻里,列出了机器学习的一系列阅读书籍,以方便读者开始学习机器学习,详细清单见 https://news.ycombinator.com/item?id=1055042

乔丹教授的这份列表是为了那些进入伯克利分校的博士研究生而写的,这些人都是会将他们生命未来的几十年投身于这个领域,并且想要迅速的得到这个领域的前沿知识。乔丹教授说到,针对那些在工业界中需要足够的基础知识以使能够在几个月内开始工作的人,他准备一分完全不同的列表。

在问及这套书籍是否过时时,乔丹教授表示这套书籍列表来自几年前。他现在倾向于添加一些进一步挖掘基础主题的书。他特别推荐 A. Tsybakov 的书《Introduction to Nonparametric Estimation》作为获得估计下界工具的很可读的书籍,还有 Y. Nesterov 的《Introductory Lectures on Convex Optimization》来理解优化过程中的下界。同时,他推荐 A. van der Vaart 的《Asymptotic Statistics》,这本书是伯克利分校的教材,书中包含了推断过程中的很多寄托于经验过程理论之上想法。比如 M 估计,包含了最大似然法和经验风险最小化等等。还有 B. Efron 的《Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction》,这也是一本很发人深省的书。

在乔丹教授的想法中,他不期望着所有来伯克利的学生都已经把所有这些书读过,但是他希望他们已经做了一些选择,并且花了一些时间至少读过大部分书中的一些章节。而且,他认为这些将要进入机器学习领域的学生不仅需要最终读完这些书籍,更需要将它们都读上至少三遍——第一遍能够勉强明白了,第二遍去尝试做相关实验推导,第三遍看到之后会觉得这些都是显而易见的。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-09-21 08:356907
用户头像

发布了 268 篇内容, 共 138.4 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

书本介绍:技术札纪——有限硬件与无限计算的权衡艺术

poemyang

云计算 分布式 高并发 Java虚拟机

AI Agent 的制胜之道:上下文工程深度解析

十三Tech

基于YOLOv8的桥梁八类缺陷、病害高精度检测项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

yolov8

从频繁告警到平稳发布:服务冷启动 CPU 风暴优化实践

vivo互联网技术

性能优化 后端 服务器 Arthas

首家!AI算力最高评级!

百度Geek说

要不要接着造电车,车企站在十字路口

脑洞汽车

汽车 新能源

录屏神器camtasia主要功能介绍,camtasia2024软件激活码密钥,Camtasia中文版免费下载

阿拉灯神丁

录屏软件 视频编辑工具 Camtasia Studio2024 视频剪辑软件

天翼云多活容灾服务项目入选“2025年度央国企云容灾领航者典型案例”!

天翼云开发者社区

安全 容灾

户外巨型LED屏幕租赁价格预算

Dylan

商业 活动 户外LED显示屏 虚拟演唱会 LED屏幕

AI赋能专卖人员画像与队伍评价,助力烟草行业人才队伍建设

中烟创新

2025可信云大会成功召开,天翼云揽获多项权威认证!

天翼云开发者社区

可信云 天翼云

数字样机:改写卫星物联网的研制范式

DevOps和数字孪生

运维提效指南:如何通过轻帆云 AI 工单系统实现效率+60%跃迁

云智慧AIOps社区

运维 AIOPS ITSM 智能运维

AI背单词APP的功能设计

北京木奇移动技术有限公司

AI教育 软件外包公司 AI背单词

使用 Strands Agents 开发并部署生产级架构通用型个人助手

亚马逊云科技 (Amazon Web Services)

1688商品列表API接口指南

tbapi

1688API接口 1688商品列表接口 1688商品数据采集

见过“秒”级盘点吗?只需3~5秒,RFID盘点通道机让繁琐变得轻松高效!

斯科信息

RFID分拣 斯科信息 RFID技术

突破连接边界:EMQX 实现 MQTT 和 NATS 协议双向互通

EMQ映云科技

emqx nats

2025 AI主战场,连锁门店“变形记”

脑极体

AI

机器人技术:AI之后的新增长极|小奇说

奇点云

自动驾驶 AI 机器人

区块链预付卡APP的开发成本

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

大数据-50 Redis Java Lua实现乐观锁、WATCH机制与SETNX分布式锁

武子康

Java 数据库 redis 大数据 缓存

Post-Training on PAI (5): PAI-EasyDistill, PAI 自研大模型蒸馏框架

阿里云大数据AI技术

人工智能 大数据 开源 大模型 大模型蒸馏

智慧安全,数治风险:灯塔低代码平台赋能烟草行业安全管理体系

中烟创新

从娃哈哈看传统企业转型:宗馥莉 700 亿营收的产品战略有哪些「可复用模型」?

IPD产品研发管理

产品 产品经理 商业

重磅发布《央国企数智化转型发展报告(2025)》

信通院IOMM数字化转型团队

数字化转型 数智化转型 央国企数智化转型 央国企数字化转型

网传“光刻工厂”真相揭晓,让我们用CST电磁仿真软件的方式打开它

思茂信息

cst CST软件 CST Studio Suite

1688商品详情API接口指南

tbapi

1688商品详情接口 1688数据采集 1688商品详情API

AI淘汰歌手又近一步,昆仑万维正式上线Mureka V7

新消费日报

区块链预付卡APP的上线流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

对话机器学习大神Michael Jordan:简介_语言 & 开发_张天雷_InfoQ精选文章