写点什么

并行计算

收录了 并行计算 频道下的 50 篇内容

使用并行计算大幅提升递归算法效率

无论什么样的并行计算方式,其终极目的都是为了有效利用多机多核的计算能力,并能灵活满足各种需求。相对于传统基于单机编写的运行程序,如果使用该方式改写为多机并行程序,能够充分利用多机多核cpu的资源,使得运行效率得到大幅度提升,那么这是一个好的靠谱的并行计算方式,反之,又难使用又难直接看出并行计算优势,还要耗费大量学习成本,那就不是一个好的方式。数字排列组合是个经典的算法问题,它很通俗易懂,适合不懂业务的人学习,我们通过它来发现和运用并行计算的优势,可以得到一个很直观的体会,并留下深刻的印象。

专访高性能计算领军人物刘文志:并行计算的未来,是让人工智能无处不在

大数据、算法和计算能力决定了人工智能的发展。在计算领域上,主要依靠的硬件就是GPU、CPU,以及最近刚推出的TPU,背后是英伟达、英特尔和谷歌的角力。伴随着这些公司的股价一路上涨的趋势,从此也能看出并行计算的再次崛起。InfoQ一直很关注并行计算领域,联系了业界领军人物刘文志老师,并拜托杨旸进行了一次较深入的访谈,以下是访谈实录。 刘文志(花名风辰),商汤科技高性能计算总监,毕业于中国科学院研究生院,闻名于并行计算江湖,尤善异构并行计算(X86、ARM、GPU、APU及PHI)和大规模集群计算,有7年相关经验,涉及图像处理、计算机视觉、数据挖掘和石油勘探。曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队)。

传奇黑客看衰并行计算:多核处理器纯属浪费
传奇黑客看衰并行计算:多核处理器纯属浪费

对于普通用户来说,处理器的多个核心大部分时间只是在产生废热而已

遇见 C++ AMP:在 GPU 上做并行计算

本文介绍如何使用Visual C++ 2012新增的C++ AMP实现GPU并行计算,并通过代码示例讲解C++ AMP的基本用法和步骤,以及相关的类和函数的工作原理。

微软和 Intel 向并行计算领域投入 2 千万美元

微软和Intel最近宣布在未来5年内联合投资2千万美元到并行计算领域。

Mozilla 正在 SpiderMonkey 中测试 JavaScript 并行计算

Mozilla正致力于实现JavaScript“并行(parallelism)计算”,以便充分利用硬件性能。Dave Herman是Mozilla Research的首席研究员和策略总监。近日,他在一篇博文中提到,他们正在其JavaScript引擎SpiderMonkey中进行相关实验。

C++ AMP 提供大规模并行计算

微软想给C++开发者提供工具,帮助他们写出能在数量巨大的本地GPU/核心上或者在云里运行的并行应用程序。

上交大提出支持并行计算的 SRNN:比 RNN 快 136 倍!(代码已开源)

本文介绍了切片循环神经网络,可以通过将序列分割成多个子序列来实现并行化计算。SRNN具有通过多层网络和极少的额外参数来获得高层次信息的能力。不需要改变循环单元,SRNN的速度便可以达到标准RNN的136倍,而且训练更长的序列时,SRNN的速度能够更快。作者在六个大规模情感分析数据集上进行了实验,实验结果表明SRNN比标准的RNN具有更好的性能。

训练速度提升超3倍!斯坦福推出全新深度学习并行计算框架FlexFlow
训练速度提升超 3 倍!斯坦福推出全新深度学习并行计算框架 FlexFlow

斯坦福Matei团队提出全新深度学习并行计算框架FlexFlow

2012.3.16 微博热报:生物学角度看并行计算与支持向量机

IBM Research的David Ungar在一个演讲中提出应改以生物学视角去审视并行计算问题;如何深度理解支持向量机也引起众人兴趣。微博推荐: @付超群 ,Lamp程序开发、全文检索以及数据挖掘技术专家。

谷歌开源TensorFlow 0.8完全实现并行计算并原生态支持与kubernetes相结合
谷歌开源 TensorFlow 0.8 完全实现并行计算并原生态支持与 kubernetes 相结合

最近谷歌正式宣布TensorFlow 0.8 已经完全实现并行计算并原生态支持与kubernetes相结合

IBM Cloud Code Engine Serverless Fleets配备GPU以实现高性能人工智能和并行计算
IBM Cloud Code Engine Serverless Fleets 配备 GPU 以实现高性能人工智能和并行计算

IBM战略性全托管无服务器平台IBM Cloud Code Engine引入了支持集成GPU的Serverless Fleets。凭借这项新能力,该公司直接解决了在简化版按需付费无服务器模型上运行大规模计算密集型工作负载的挑战,如企业级人工智能、生成式人工智能、机器学习和复杂仿真。

微软研究院加速器项目:面向 GPU 的.NET 数据并行计算库

微软研究院加速器项目公开了一个使用计算机的GPU完成并行数据处理的.NET函数库。

Apache Ignite(六):基于 Ignite 的企业级分布式并行计算

Ignite基于发现技术可以自我感知地建立集群,同时实现了MapReduce范式,这两项技术再加上分布式缓存技术,为传统的企业级批量业务处理提供了新的更优雅、性能更好、综合成本更低的解决方案,本文将对这部分进行简单的整体性介绍,方便读者入门,

麻省理工学院优化 LLVM IR,大大提高并行化的效率

将代码移植到多核多处理器平台,实现并行化的过程中,LLVM这款广受欢迎的编译器有一些不够完善的地方。麻省理工学院开发Cilk的研究小组,对LLVM IR进行了大胆而极具洞察力的扩充,经过区区6千行修改,发布了LLVM/Tapir编译器,“能比其他商用或开源的编译器,更好地对并行代码优化,而且能编译有些编译器无法编译的内容”。

何去何从的并行计算

也许你正试图将你的应用改造成并行模式运行,也许你只是单纯地对并行程序感兴趣。

分布式缘何而起?从单兵,到游击队,到集团军
分布式缘何而起?从单兵,到游击队,到集团军

准备好12周精通分布式了吗?

Python 中的多进程与线程 每个数据科学家都需要知道
Python 中的多进程与线程 每个数据科学家都需要知道

Python 为并行化提供了两个内置库:多进程和线程。本文将探讨数据科学家如何在两者间进行选择,以及选择时应记住哪些因素。

软件开发者是硬件开发者的两倍!CUDA“元老级”架构师亲述:最初12人的团队如何成就了英伟达万亿市值
软件开发者是硬件开发者的两倍!CUDA“元老级”架构师亲述:最初 12 人的团队如何成就了英伟达万亿市值

尽管从CUDA的角度来看,GPU本身就是一台大规模并行机器,但它却并不擅长运行Linux这类串行问题。这类任务还是要交给CPU才行。

使用 QuTrunk+AWS ParallelCluster3 进行并行计算

QuTrunk 是启科量子自主研发的一款免费、开源、跨平台的量子计算编程框架,包括量子编程API、量子命令转译、量子计算后端接口等。它提供多种量子计算体验,提供本地量子计算Python计算后端,提供OMP多线程、MPI多节点并行、GPU加速等计算模式。本文将介绍如何

量子计算
并行计算专题_资料-InfoQ中文网