写点什么

如何看待深度学习?

  • 2015-12-17
  • 本文字数:1041 字

    阅读完需:约 3 分钟

近来,深度学习成为一个流行词。有分析师认为,它会削弱现有机器学习方法的地位。实际上,深度学习并不是一个新概念,它是上世纪 90 年代就已经出现的人工神经网络(ANN)算法的一种扩展。由于ANN 需要极大的数据集用于训练,所以被边缘化了。深度学习算法为ANN 带来了新生,它会训练多层ANN,而所需的数据比先前的预期要少。近日,数据科学家Anubhav Srivastava撰文分享了一些有关深度学习的看法。

深度学习可以更好地通过增加数据集的规模来改善学习结果,这是人们需要这种算法的原因。在实际的解决方案中,深度学习更适合于未标记数据,而这超出了自然语言处理的范畴,后者更多限于实体识别。与传统的机器学习工具相比,深度学习挖掘了神经网络的潜力。基于强大的特征提取,它比其他工具更适合模式识别(图像、文本、音频)。

但是,深度学习并不会取代其他所有的机器学习算法。对于许多应用而言,一些简单点的算法(如逻辑回归、支持向量机)就已经足够。支持者之所以为深度学习而兴奋,一个基本的原因是,它是一种不同于线性或内核模型的元算法。这意味着,深度学习没有任何损失函数的特性,而且不受特定的公式限制,可以为科学家提供更大的灵活性。

有分析师认为,深度学习是最像大脑的算法,但Anubhav 认为这种观点有些片面,并以 Numenta 为例进行了进一步的阐述。Numenta“皮质(cortical)”算法基于分级时序记忆(HTM)模型,而后者是在“稀疏分布记忆(sparse distributed memory)”概念的基础上发展而来,那是一种学习人类长期记忆的数学模型。皮质算法既可以从空间维度,也可以从时间维度进行特征提取,使它更像是大脑的仿制品。

有鉴于此,Anubhav 认为,目前围绕深度学习和Numenta 的一些争论不甚合理。有种观点是,Numenta HTM 适合无监督学习,并将此视为其相对于深度学习算法的一个重大优势。还有一种观点是,Numenta 可以视为一种时间- 内存需求更小的在线学习算法。Anubhav 指出,有一个很重要的事实被忽略了,就是深度学习是一个多层模型。在多数情况下,神经网络模型一次只能求解一种问题类型,面对多种问题类型时,就需要使用混合模型。在这方面,深度学习算法的多层模型是一个巨大的优势,即使Numenta 也无法与其相比。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-17 18:005327
用户头像

发布了 1008 篇内容, 共 432.5 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

演讲实录:指标平台+AI 的技术落地和未来展望

Kyligence

Kyligence Copilot

酒有十千,棋有独步——本土大模型百花齐放,文心一言站稳领先者身位RlueEva-System大模型测评来了!你pick哪一家

TE智库

算网深度融合成趋势,天翼云让政企上云更安全、更便捷!

天翼云开发者社区

云计算 云平台

喜报!天翼云电脑获“光华杯”大赛一等奖、最佳创意创新奖!

天翼云开发者社区

云计算 云电脑

Docker学习路线9:运行容器

小万哥

c++ Docker 运维 后端 开发

案例 | 基于机理模型驱动的工业APP集成开发平台及应用实践

工赋开发者社区

C++ 结合 opencv读取图片与视频

芯动大师

AI开发软件环境

timerring

AI

基于 Graviton2处理器构建容器化基因分析工作负载

亚马逊云科技 (Amazon Web Services)

云计算

阿里云瑶池 PolarDB 开源官网焕新升级

阿里云数据库开源

polarDB PolarDB-X PolarDB-PG 阿里云PolarDB

九科信息中标招商局集团流程挖掘项目

九科Ninetech

PPT | 未来工厂与数字孪生

工赋开发者社区

[分词]基于Lucene8版本的混合分词器(分词合并)

alexgaoyh

中文分词 lucene Spring Boot 2 混合模型

使用 Python 处理 CSV 文件,附示例

前端毛小悠

Python

时光“摆渡者”,让回忆“闪现”眼前

白洞计划

AI 存储

ZBC Staking 即将开启,全新利好来袭

股市老人

LLaVA:将视觉微调引入大模型

Zilliz

计算机视觉 LLM 大语言模型 模型微调

MegEngine Python 层模块串讲(上)

MegEngineBot

Python 深度学习 开源 Data

玩一玩编程式 AOP

江南一点雨

Java spring

虚幻引擎教程——生成云平台指定路径下的EXE文件

3DCAT实时渲染

虚幻引擎 ue UE虚幻引擎

文心一言 VS 讯飞星火 VS chatgpt (64)-- 算法导论6.5 3题

福大大架构师每日一题

福大大架构师每日一题

Code片段D

Bert

减少跨国传输大文件所需时间的技巧与工具

镭速

跨国传输大文件

【MySQL技术专题】「问题实战系列」深入探索和分析MySQL数据库的数据备份和恢复实战开发指南(系统底层优化篇)

码界西柚

MySQL 性能调优 技术分析 底层分析

飞桨AI for Science线下交流会:汇聚科学计算人才,携手共建繁荣社区

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

Code片段

Bert

如何看待深度学习?_语言 & 开发_谢丽_InfoQ精选文章