【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

Google 发布 Tensor2Tensor for TensorFlow

  • 2017-08-13
  • 本文字数:634 字

    阅读完需:约 2 分钟

TensorFlow(TF)社区和 Google 的 Brain 团队发布了作为TF API 重要扩展的 Tensor2Tensor

Tensor2Tensor(T2T)解决了在 TF 上训练和执行模型的模块化和可移植性问题。它将常用的深度学习模型管道抽象成一个可扩展的对象模型,并提供了 TF 训练所需要的标准 API。T2T 的目标之一是要降低模型训练管道和执行环境的重复性成本,同时减少基于 TF 现有 API 进行常见操作的工作量,这些操作原本很难在用户之间共享,它们有些只能用于解决特定的问题。

T2T 基于现有的 TF 库执行很多操作,包括模型架构、优化器、学习率衰退、scheme 和超参数。它还提供了一些预训练过的模型和样本数据集、默认的模型规范,以及超参数 modality 的控制方法。这样有助于用户重复实验、比较和交换结果,让他们专注在课题研究上,而不是把大量精力花费在编排 TF 管道环境上。

T2T 的数据集为标准的 TFRecord protobuf 文件,训练数据集可以通过用户自定义的 Problem 子类来生成,或者通过 Python 装饰器和直接函数调用的方式来生成。Problem 对象由训练时间超参数和它们的输入输出形态及数据集组成。Problem 提供了一些方法用于处理编码、文件路径、输入输出目标、超参数和默认属性值。模型的 metrics (如模型准确度)也被封装在 Problem 中。超参数集合通过装饰器注册成 Hparams 对象。

训练可以被配置成同步或异步模式。通过环境变量 TF_CONFIG 可以指定 master 服务器和参数服务器,支持 grpc 和 gpu 群组,以及计算资源的逻辑集群。

查看英文原文: Google Announces Tensor2Tensor for TensorFlow

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-08-13 19:002100
用户头像

发布了 322 篇内容, 共 134.4 次阅读, 收获喜欢 144 次。

关注

评论

发布
暂无评论
发现更多内容

20个不良用户体验

老猿Python

程序员 用户体验 程序开发

消息队列系统架构设计

王硕

架构训练营

Android设备实时音视频传输有效方案

小驰笔记

android 音视频 引航计划

量化网格交易策略系统,马丁倍投策略软件源码

全国大学生物联网设计竞赛(华为杯)巡回技术讲座“八校联动”,HarmonyOS与校园开发者面对面

Geek_283163

鸿蒙

打破思维定式(十)

Changing Lin

Python-XPath

若尘

Python编程 5月日更

聊聊Spring的XML Schema扩展机制的使用方式

Hex

spring

全国大学生物联网设计竞赛(华为杯)巡回技术讲座“八校联动”,HarmonyOS与校园开发者面对面

科技汇

Spark为什么会流行

大数据技术指南

大数据 5月日更

把Redis当作队列来用,真的合适吗?

Kaito

数据库 redis 队列

腾讯iOS开发要达到咋样的水准?

一意孤行的程序员

ios 程序员 腾讯 面试 ios开发

ceph-csi源码分析(8)-cephfs driver分析

良凯尔

Kubernetes 源码分析 Ceph CSI

企业数字化转型分为三个阶段

石云升

数字化 5月日更

Nginx通过split_client实现客户端分流

运维研习社

nginx 灰度发布 5月日更 分流

通过实践带你揭开TCP中CLOSE_WAIT和TIME_WAIT的神秘面纱

linux大本营

c++ Linux TCP 网络协议 epoll

iOS 面试策略之系统框架-UIScrollView及其子类

iOSer

ios 面试 UIScrollView UICollectionView

工业互联网产业数字化,区块链如何协同发力?

CECBC

数据科学指南#基础篇 Bokeh入门

Lev

Python 学习 数据分析 数据科学

深入Linux C/C++ Timer定时器的实现核心原理

Linux服务器开发

Linux 后端 网络编程 定时器 Linux服务器开发

网络攻防学习笔记 Day15

穿过生命散发芬芳

5月日更 网络攻防

ceph-csi源码分析(7)-rbd driver-IdentityServer分析

良凯尔

Kubernetes 源码分析 Ceph CSI

k8s POD hosts 文件怎么与主机保持同步那?

Geek_f24c45

Docker Kubernetes

数据挖掘从入门到放弃(二):决策树

数据社

机器学习 5月日更

服务调用链相关基础知识

luojiahu

调用链

APP透露的焦虑

wgc

杂谈

[Netty]- Reactor实现

topsion

reactor Netty io nio

区块链—重构新商业体系和全新商业生态环境

CECBC

高性能JavaScriptの笔记(二)

空城机

JavaScript 大前端 5月日更

用Python找出100以内的质数 - DAY6

Qien Z.

5月日更 ptyhon 找质数 质数

全文检索的介绍

五分钟学大数据

大数据 5月日更

Google发布Tensor2Tensor for TensorFlow_AI&大模型_Dylan Raithel_InfoQ精选文章