GPU

关注
收录了GPU频道下的 26 篇内容
GPU是一种专门在计算机上运行绘图运算工作的微处理器。
  • 全部
  • 文章
  • 话题
终下决心!中国龙芯决定放弃所有美国技术,做真正的纯国产指令集
终下决心!中国龙芯决定放弃所有美国技术,做真正的纯国产指令集

曾支撑 2015 年中国发射的北斗卫星,龙芯是近年来国产自主程度相对较高的芯片

突破算力束缚:阿里提出智能算力引擎DCAF, 节省20%GPU算力
突破算力束缚:阿里提出智能算力引擎 DCAF, 节省 20%GPU 算力

未来,计算力可能从过去算法进化的推力,变成阻力。

计算架构“新黄金十年”已来,Intel设立了一个兴趣小组等你!
计算架构“新黄金十年”已来,Intel 设立了一个兴趣小组等你!

年代我们做研究那时一样,新的架构设计将会带来更低的成本,更优的能耗、安全和性能。计算架构的“新黄金十年”已经开启。

失去华为,寒武纪IPO“芯”事重重
失去华为,寒武纪 IPO“芯”事重重

4 岁的寒武纪面临着不少成长中的烦恼,它能赶考科创板成功,成为“AI 芯片第一股”吗?

英特尔承认落后AMD 7nm,直到2021年才能赶上对手
英特尔承认落后 AMD 7nm,直到 2021 年才能赶上对手

对于英特尔来说,2020 年和 2021 年将是竞争压力时刻环绕的漫长两年。

Imagination老矣?最新GPU架构IMG A系列,性能提升2.5倍,有史以来最快
Imagination 老矣?最新 GPU 架构 IMG A 系列,性能提升 2.5 倍,有史以来最快

15 年来,Imagination Technologies 最重要的一次发布。

一台CS-1性能顶1000个GPU?史上最大AI芯片Cerebras WSE正式投入使用
一台 CS-1 性能顶 1000 个 GPU?史上最大 AI 芯片 Cerebras WSE 正式投入使用

Cerebras Systems 的首席执行官 Andrew Feldman 表示,CS-1 是目前“最快的 AI 计算机”。

定义未来应用程序开发的十年?英特尔正式推出统一跨架构编程模型oneAPI
定义未来应用程序开发的十年?英特尔正式推出统一跨架构编程模型 oneAPI

英特尔或许能够凭借 oneAPI,对整个芯片设计行业进行一次“大规模的洗牌”。

英特尔推出首款通用GPU ,英伟达却表示并不担心
英特尔推出首款通用 GPU ,英伟达却表示并不担心

英伟达黄仁勋表示:我们重视竞争对手,但我们有自己的技术。

基于UAI-Train平台的分布式训练
基于 UAI-Train 平台的分布式训练

在大型数据集上进行训练的现代神经网络架构,可以跨广泛的多种领域获取可观的结果,涵盖从图像识别、自然语言处理到欺诈检测和推荐系统等各个方面,但训练这些神经网络模型需要大量浮点计算能力。

英特尔终于实现10nm芯片量产,7nm芯片还要多久?
英特尔终于实现 10nm 芯片量产,7nm 芯片还要多久?

经过数年的拖延,英特尔终于交付了首批 10nm 处理器。

比Horovod/NCCL 快8倍!伯克利与微软联合发布最优GPU通信库Blink
比 Horovod/NCCL 快 8 倍!伯克利与微软联合发布最优 GPU 通信库 Blink

随着 GPU 的算力不断提升,GPU 间的数据聚合(即模型同步)成为了大规模分布式模型训练的瓶颈。

CPU并行编程概述(上)
CPU 并行编程概述(上)

一个自然而然的问题是:为什么要用并行编程?

我们距离纯粹的中国“芯”还有多远?| 话题
我们距离纯粹的中国“芯”还有多远?| 话题

业界人士常谈,随着后摩尔时代的到来,中国的半导体行业会获得更多的机遇,芯片领域也会迎来春天。

阿里云智能总裁行癫:做芯片,我们喜欢走前人没走过的路
阿里云智能总裁行癫:做芯片,我们喜欢走前人没走过的路

阿里巴巴的几位专家重点讨论了阿里在云和 AI 上的思考,以下为 InfoQ 整理的本次对话的关键信息。

苹果最新A13仿生芯片可还行?
苹果最新 A13 仿生芯片可还行?

除了“智能手机有史以来最好的机器学习性能”宣称外,“能效”或许可以被称作苹果 A13 仿生芯片的最大亮点之一。

全球首个软硬件推理平台NVDLA编译器正式开源,可在云端自主设计推理用AI芯片
全球首个软硬件推理平台 NVDLA 编译器正式开源,可在云端自主设计推理用 AI 芯片

近期,英伟达在 GitHub 上开源了 NVDLA 编译器的源代码,这是世界上首个软硬件推理平台的完整开源代码。

极客邦技术大会
极客邦技术大会

影响企业 3000+,服务技术人 30000+,8 年经验参会者超 50%,2019 下半年,听极客邦技术大会就够了!

全球AI芯片测试榜首:紫光展锐发布AI边缘计算平台虎贲T710
全球 AI 芯片测试榜首:紫光展锐发布 AI 边缘计算平台虎贲 T710

紫光展锐宣布推出高性能 AI 边缘计算平台——虎贲 T710。早在今年 7 月份,虎贲 T710 就已经成为了苏黎世联邦理工学院 AI Benchmark 最新全球 AI 芯片的测试榜首。

NVIDIA公开GPU硬件接口文档,Linux开源驱动“有救了”?
NVIDIA 公开 GPU 硬件接口文档,Linux 开源驱动“有救了”?

NVIDIA 公开 GPU 硬件接口文档,助力 Linux 开源驱动 Nouveau 的开发。

比Spark快100倍的GPU加速SQL引擎:BlazingSQL开源了
比 Spark 快 100 倍的 GPU 加速 SQL 引擎:BlazingSQL 开源了

BlazingSQL 可以为各种 ETL 大数据集提供 SQL 接口,并且完全运行在 GPU 之上。

GPU通信技术初探(一)
GPU 通信技术初探(一)

本文主要探索 GPU 单机多卡和多机多卡两种场景下的通信技术,并对部分技术进行实测

基于 Kubernetes 的 GPU 类型调度实现
基于 Kubernetes 的 GPU 类型调度实现

基于 Kubernetes 的云原生技术为人工智能提供了一种新的工作模式。凭借其特性,Kubernetes 可以无缝将模型训练、inference 和部署扩展到多云 GPU 集群,允许数据科学家跨集群节点自动化多个 GPU 加速应用程序容器的部署、维护、调度和操作。

研究人员发现GPU侧道攻击漏洞
研究人员发现 GPU 侧道攻击漏洞

UC Riverside 的研究人员证实,事实上,GPU 侧通道攻击是切实可行的。

    WebRTC 实时视频处理——基础美颜与视频超分实践
    WebRTC 实时视频处理——基础美颜与视频超分实践

    高纯 | 声网Agora 高级架构师

    立即下载
    蚂蚁财富的 Flutter多业务开发实践

    肖凯 | 蚂蚁金服 无线开发专家

    立即下载
    解构面试最难算法:动态规划

    卢誉声 | Autodesk 核心数据平台和计算平台资深工程师 《动态规划面试宝典》专栏作者

    立即下载
  • AWS

    共 1670 篇内容

  • C++

    共 200 篇内容

  • RedHat

    共 80 篇内容