NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

并行计算

收录了 并行计算 频道下的 50 篇内容

使用并行计算大幅提升递归算法效率

无论什么样的并行计算方式,其终极目的都是为了有效利用多机多核的计算能力,并能灵活满足各种需求。相对于传统基于单机编写的运行程序,如果使用该方式改写为多机并行程序,能够充分利用多机多核cpu的资源,使得运行效率得到大幅度提升,那么这是一个好的靠谱的并行计算方式,反之,又难使用又难直接看出并行计算优势,还要耗费大量学习成本,那就不是一个好的方式。数字排列组合是个经典的算法问题,它很通俗易懂,适合不懂业务的人学习,我们通过它来发现和运用并行计算的优势,可以得到一个很直观的体会,并留下深刻的印象。

专访高性能计算领军人物刘文志:并行计算的未来,是让人工智能无处不在

大数据、算法和计算能力决定了人工智能的发展。在计算领域上,主要依靠的硬件就是GPU、CPU,以及最近刚推出的TPU,背后是英伟达、英特尔和谷歌的角力。伴随着这些公司的股价一路上涨的趋势,从此也能看出并行计算的再次崛起。InfoQ一直很关注并行计算领域,联系了业界领军人物刘文志老师,并拜托杨旸进行了一次较深入的访谈,以下是访谈实录。 刘文志(花名风辰),商汤科技高性能计算总监,毕业于中国科学院研究生院,闻名于并行计算江湖,尤善异构并行计算(X86、ARM、GPU、APU及PHI)和大规模集群计算,有7年相关经验,涉及图像处理、计算机视觉、数据挖掘和石油勘探。曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队)。

传奇黑客看衰并行计算:多核处理器纯属浪费
传奇黑客看衰并行计算:多核处理器纯属浪费

对于普通用户来说,处理器的多个核心大部分时间只是在产生废热而已

遇见 C++ AMP:在 GPU 上做并行计算

本文介绍如何使用Visual C++ 2012新增的C++ AMP实现GPU并行计算,并通过代码示例讲解C++ AMP的基本用法和步骤,以及相关的类和函数的工作原理。

微软和 Intel 向并行计算领域投入 2 千万美元

微软和Intel最近宣布在未来5年内联合投资2千万美元到并行计算领域。

Mozilla 正在 SpiderMonkey 中测试 JavaScript 并行计算

Mozilla正致力于实现JavaScript“并行(parallelism)计算”,以便充分利用硬件性能。Dave Herman是Mozilla Research的首席研究员和策略总监。近日,他在一篇博文中提到,他们正在其JavaScript引擎SpiderMonkey中进行相关实验。

C++ AMP 提供大规模并行计算

微软想给C++开发者提供工具,帮助他们写出能在数量巨大的本地GPU/核心上或者在云里运行的并行应用程序。

上交大提出支持并行计算的 SRNN:比 RNN 快 136 倍!(代码已开源)

本文介绍了切片循环神经网络,可以通过将序列分割成多个子序列来实现并行化计算。SRNN具有通过多层网络和极少的额外参数来获得高层次信息的能力。不需要改变循环单元,SRNN的速度便可以达到标准RNN的136倍,而且训练更长的序列时,SRNN的速度能够更快。作者在六个大规模情感分析数据集上进行了实验,实验结果表明SRNN比标准的RNN具有更好的性能。

训练速度提升超3倍!斯坦福推出全新深度学习并行计算框架FlexFlow
训练速度提升超 3 倍!斯坦福推出全新深度学习并行计算框架 FlexFlow

斯坦福Matei团队提出全新深度学习并行计算框架FlexFlow

2012.3.16 微博热报:生物学角度看并行计算与支持向量机

IBM Research的David Ungar在一个演讲中提出应改以生物学视角去审视并行计算问题;如何深度理解支持向量机也引起众人兴趣。微博推荐: @付超群 ,Lamp程序开发、全文检索以及数据挖掘技术专家。

谷歌开源TensorFlow 0.8完全实现并行计算并原生态支持与kubernetes相结合
谷歌开源 TensorFlow 0.8 完全实现并行计算并原生态支持与 kubernetes 相结合

最近谷歌正式宣布TensorFlow 0.8 已经完全实现并行计算并原生态支持与kubernetes相结合

微软研究院加速器项目:面向 GPU 的.NET 数据并行计算库

微软研究院加速器项目公开了一个使用计算机的GPU完成并行数据处理的.NET函数库。

Apache Ignite(六):基于 Ignite 的企业级分布式并行计算

Ignite基于发现技术可以自我感知地建立集群,同时实现了MapReduce范式,这两项技术再加上分布式缓存技术,为传统的企业级批量业务处理提供了新的更优雅、性能更好、综合成本更低的解决方案,本文将对这部分进行简单的整体性介绍,方便读者入门,

麻省理工学院优化 LLVM IR,大大提高并行化的效率

将代码移植到多核多处理器平台,实现并行化的过程中,LLVM这款广受欢迎的编译器有一些不够完善的地方。麻省理工学院开发Cilk的研究小组,对LLVM IR进行了大胆而极具洞察力的扩充,经过区区6千行修改,发布了LLVM/Tapir编译器,“能比其他商用或开源的编译器,更好地对并行代码优化,而且能编译有些编译器无法编译的内容”。

何去何从的并行计算

也许你正试图将你的应用改造成并行模式运行,也许你只是单纯地对并行程序感兴趣。

分布式缘何而起?从单兵,到游击队,到集团军
分布式缘何而起?从单兵,到游击队,到集团军

准备好12周精通分布式了吗?

Python 中的多进程与线程 每个数据科学家都需要知道
Python 中的多进程与线程 每个数据科学家都需要知道

Python 为并行化提供了两个内置库:多进程和线程。本文将探讨数据科学家如何在两者间进行选择,以及选择时应记住哪些因素。

使用 QuTrunk+AWS ParallelCluster3 进行并行计算

QuTrunk 是启科量子自主研发的一款免费、开源、跨平台的量子计算编程框架,包括量子编程API、量子命令转译、量子计算后端接口等。它提供多种量子计算体验,提供本地量子计算Python计算后端,提供OMP多线程、MPI多节点并行、GPU加速等计算模式。本文将介绍如何

量子计算
京东广告算法架构体系 - 高性能计算最佳实践
京东广告算法架构体系 - 高性能计算最佳实践

目前新一代的高性能计算方案已经在广告多个业务线进行了落地实践,推荐首页 CTR 模型、推荐通用信息 CTR 模型、推荐商详 CTR 的规模扩展至千亿,助力推荐、搜索等核心业务取得显著的效果收益。

大规模机器学习的编程技术、计算模型以及 Xgboost 和 MXNet 案例

工业届常有一些大规模机器学习的场景,本文从并行计算编程技术、并行计算模型和并行计算案例给大家分享一些大规模机器学习相关的知识,希望大家能有所收获。

并行计算专题_资料-InfoQ中文网