NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

速度训练

收录了 速度训练 频道下的 50 篇内容

AWS Deep Learning AMI 现在能够以更快的速度训练
AWS Deep Learning AMI 现在能够以更快的速度训练

现在,适用于 Ubuntu 和 Amazon Linux 的 AWS Deep Learning AMI 包含最新版本的 TensorFlow (1.5) 和 Microsoft Cognitive Toolkit (2.4)。

多索引下的Lucene性能优化
多索引下的 Lucene 性能优化

本次优化的背景来源于公有云AOM日志服务。

单机训练速度提升640倍!独家解读快手商业广告模型GPU训练平台Persia
单机训练速度提升 640 倍!独家解读快手商业广告模型 GPU 训练平台 Persia

基于CPU的训练系统或许已经不再是最合适的解决方案了。

Microsoft Azure 位居 Nasuni 存储基准测试之首

云NAS与存储公司Nasuni发布了年度云存储基准测试的结果。Microsoft Azure Storage在速度、可用性和扩展性方面胜出。基准测试涵盖的其它服务还包括Amazon S3和Google Cloud Storage。

速度提升18倍!微博海量深度学习模型训练效率跃升的秘密
速度提升 18 倍!微博海量深度学习模型训练效率跃升的秘密

深度学习平台在微博社交业务扮演着重要的角色。计算存储分离架构下,微博深度学习平台在数据访问与调度方面存在性能低效的问题。本文将介绍微博内部设计实现的一套全新的基于Fluid(内含JindoRuntime)的新架构方案,显著提升了海量小文件场景模型训练的性能和稳定性,多机多卡分布式训练场景可将模型训练的速度提升18倍。

Uber的合成训练数据将深度学习的速度提升了9倍
Uber 的合成训练数据将深度学习的速度提升了 9 倍

利用合成数据,Uber将其神经结构搜索(NAS)深度学习优化过程提升了9倍。

Smashtest:专注于速度的 Web 应用测试新 DSL
Smashtest:专注于速度的 Web 应用测试新 DSL

Smashtest非常注重通过语言简洁地表达开发人员执行的重复性测试任务来提高测试人员的工作效率。

终于等到!马斯克的SpaceX Starlink 用户拆箱体验:下载速度120Mbps、上传速度12Mbps,延迟37ms
终于等到!马斯克的 SpaceX Starlink 用户拆箱体验:下载速度 120Mbps、上传速度 12Mbps,延迟 37ms

马斯克的SpaceX Starlink 测试版来了!用户拆箱体验:感觉像是来自未来。

在 Firefox 58 中,WebAssembly 组件性能提升了 10 倍

Mozilla在Firefox 58中为WebAssembly(WASM)组件推出了一套双层编译系统,号称解析和编译WASM代码的速度达到30-60MB/s,足够在有线网络中实现实时编译。基准测试表明,新版的性能比旧版提高了10倍,比Chrome快10倍以上。

PyTorch 2.0编译器提高了模型训练速度
PyTorch 2.0 编译器提高了模型训练速度

该版本的主要API贡献是为深度学习模型提供了一个编译函数,可以加快训练速度。

Pinterest 如何将 JavaScript 测试速度提升了 15 倍

任何时候,Pinterest都运行着数以百计的A/B“试验(experiment)”,其JavaScript测试框架已无法满足他们的试验需求。它需要15分钟才能完成整套“测试(test)”,而且经常会因为试验行为变更以及网络/浏览器问题而中断。因此,他们借机重构了Web测试框架,并在官方博客上介绍了其中几项重点改进。

Amazon Web Services 为 BERT 和 Mask R-CNN 实现了最快的训练速度
Amazon Web Services 为 BERT 和 Mask R-CNN 实现了最快的训练速度

借助这些硬件和软件优化,您现在可以以同样的速度和效率训练您的模型。

谷歌大脑提出“数据回送”算法,神经网络训练速度提升4倍
谷歌大脑提出“数据回送”算法,神经网络训练速度提升 4 倍

“数据回送”复用训练前期阶段的中间输出,以利用闲置的计算空间。

第四范式开源强化学习研究通用框架,支持单智能体、多智能体训练,还可训练自然语言任务!训练速度提升17%
第四范式开源强化学习研究通用框架,支持单智能体、多智能体训练,还可训练自然语言任务!训练速度提升 17%

OpenRL 是由第四范式强化学习团队开发的基于 PyTorch 的强化学习研究框架,支持单智能体、多智能体、自然语言等多种任务的训练。OpenRL 基于 PyTorch 进行开发,目标是为强化学习研究社区提供一个简单易用、灵活高效、可持续扩展的平台。

计算速度提高80倍!谷歌推出分布式强化学习框架SEED RL
计算速度提高 80 倍!谷歌推出分布式强化学习框架 SEED RL

训练AI玩游戏时,SEED RL的处理速度可高达240万帧/秒。

单个GPU可训练数十亿参数模型:异构深度学习训练技术ZeRO-Offload做到了
单个 GPU 可训练数十亿参数模型:异构深度学习训练技术 ZeRO-Offload 做到了

异构深度学习训练技术ZeRO-Offload可让开发者在单个GPU上训练数十亿个参数模型。

为什么改变DNS设置能提高网速?
为什么改变 DNS 设置能提高网速?

网速不行?改变一下DNS设置

随机森林算法4种实现方法对比测试:DolphinDB速度最快,XGBoost表现最差
随机森林算法 4 种实现方法对比测试:DolphinDB 速度最快,XGBoost 表现最差

随机森林算法实现的性能对比测试报告

谷歌提出任务无关的轻量级预训练模型MobileBERT:比BERT小4倍、速度快5倍
谷歌提出任务无关的轻量级预训练模型 MobileBERT:比 BERT 小 4 倍、速度快 5 倍

目前还没有任何工作能构建出一个与任务无关的轻量级预训练模型,谷歌大脑研发人员提出了MobileBERT来填补这一空白。

C# 使用秒表类Stopwatch对程序的运行速度测试
C# 使用秒表类 Stopwatch 对程序的运行速度测试

你知道C#运行一个一百次循环要多久吗,一千次,一万次呢?今天这篇文章我们对这个问题去探索一下,顺便去学习一下Stopwatch秒表类,我们是使用这个类去对一个程序做一个运行速度的测试,在C#中这个类用的比较少,至少我是今天才用,虽然不是用的很灵活,但是

C#
学习
上位机
10月月更
速度训练专题_资料-InfoQ中文网