写点什么

Google 发布 Tensor2Tensor for TensorFlow

  • 2017-08-13
  • 本文字数:634 字

    阅读完需:约 2 分钟

TensorFlow(TF)社区和 Google 的 Brain 团队发布了作为TF API 重要扩展的 Tensor2Tensor

Tensor2Tensor(T2T)解决了在 TF 上训练和执行模型的模块化和可移植性问题。它将常用的深度学习模型管道抽象成一个可扩展的对象模型,并提供了 TF 训练所需要的标准 API。T2T 的目标之一是要降低模型训练管道和执行环境的重复性成本,同时减少基于 TF 现有 API 进行常见操作的工作量,这些操作原本很难在用户之间共享,它们有些只能用于解决特定的问题。

T2T 基于现有的 TF 库执行很多操作,包括模型架构、优化器、学习率衰退、scheme 和超参数。它还提供了一些预训练过的模型和样本数据集、默认的模型规范,以及超参数 modality 的控制方法。这样有助于用户重复实验、比较和交换结果,让他们专注在课题研究上,而不是把大量精力花费在编排 TF 管道环境上。

T2T 的数据集为标准的 TFRecord protobuf 文件,训练数据集可以通过用户自定义的 Problem 子类来生成,或者通过 Python 装饰器和直接函数调用的方式来生成。Problem 对象由训练时间超参数和它们的输入输出形态及数据集组成。Problem 提供了一些方法用于处理编码、文件路径、输入输出目标、超参数和默认属性值。模型的 metrics (如模型准确度)也被封装在 Problem 中。超参数集合通过装饰器注册成 Hparams 对象。

训练可以被配置成同步或异步模式。通过环境变量 TF_CONFIG 可以指定 master 服务器和参数服务器,支持 grpc 和 gpu 群组,以及计算资源的逻辑集群。

查看英文原文: Google Announces Tensor2Tensor for TensorFlow

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2017-08-13 19:002097
用户头像

发布了 322 篇内容, 共 134.1 次阅读, 收获喜欢 144 次。

关注

评论

发布
暂无评论
发现更多内容

【喜报】OpenCloudOS 荣获2022 中国技术力量年度榜单「十大开源新锐项目」

腾源会

开源 opencloudOS

建信信托真的可靠吗?投资者含泪控诉

鳄鱼视界

架构中实时引擎与离线渲染的主要优势

3DCAT实时渲染

Unity 渲染 实时渲染 AEC

即时通讯软件WorkPlus助力政企应用快速移动化

WorkPlus

云渲染和自己的电脑渲染哪个好?

Renderbus瑞云渲染农场

云渲染

读书|我的2022年度阅读推荐

MavenTalker

推荐书单

腾讯云在中国公有云开发和基础设施平台分析师报告中入选领导者阵营

科技热闻

2022“易观之星”奖项公布,聚焦数字经济,助力数智创新

易观分析

金融 易观 颁奖

敏捷技术实践之重构

华为云PaaS服务小智

惊喜来袭!阿里内部Java开发成长手册(2022纯享版)开源

程序知音

Java 阿里 java面试 后端技术 Java面试八股文

前端开发培训机构有什么推荐?

小谷哥

数据报告 | 美国民众健康状况和医疗需求研究报告

前嗅大数据

大数据 数据分析 数据报告

女生通过java编程学习好找工作吗?

小谷哥

华为云CDN加速服务,引领企业数字化发展潮流!

路过的憨憨

阿里云弹性预测 AHPA:助力厨芯科技降本增效

阿里巴巴云原生

阿里云 云原生 弹性预测

对标阿里P7:高并发+Nginx+微服务+消息中间件+Netty+Redis+MySQL

程序知音

Java 数据库 JVM 高并发 后端技术

编程培训后程序员怎么提升自身开发水平?

小谷哥

模块二作业-分析微信朋友圈的高性能复杂度

Geek_e3a35c

华为云CDN,助力安全企业下载服务,更好提升用户体验

路过的憨憨

大数据培训后的就业因素有哪些

小谷哥

【从零开始学爬虫】采集全国历史天气数据

前嗅大数据

数据采集 爬虫软件 爬虫教程 爬虫入门 爬虫入门教程

华为云CDN提升网站响应速度,让下载快人一步

路过的憨憨

什么是3D可视化,为什么要使用3D可视化

3DCAT实时渲染

Unity 3D渲染 3D可视化

什么是云仿真,云仿真平台有哪些好处

3DCAT实时渲染

虚拟仿真 实时云渲染 云仿真 三维仿真

企业内部使用的即时通讯软件有哪些?

WorkPlus

MonographDB获得IT168“2022年度创新产品奖”

Geek_2d6073

一个深度学习框架的年度报告

MegEngineBot

深度学习 年终总结 MegEngine

Databend in 2022

Databend

大数据培训学习有前途吗?

小谷哥

备受企业青睐的华为云CDN优势到底在哪?

路过的憨憨

既要速度与激情,也要稳定和安全,华为云CDN让你速度和安全兼得

路过的憨憨

Google发布Tensor2Tensor for TensorFlow_AI&大模型_Dylan Raithel_InfoQ精选文章