最近keras之父Francois Chollet分享了TensorFlow中tf.keras接口的一些高端的用法，下面就让我们了解一下：

首先，给演讲来个概况：

接下来是介绍tf.keras的架构：

下面首先介绍Layer类，这里可以看到其实在Layer中也可以实现losses和metrics的追踪功能。

那么Layer中没实现的功能包括：不涉及梯度的计算；设备指定；Tensor变量的维度检查（必须输入和输出的Tensor第一维度是batch N）；类型检查

下面讲到了如何自定义自己的Layer类，有两种方式，下面是最简单的一种，这种方式在构建时是会根据传入的参数input_dim推断出input的shape。

而下面这种方式，在构造时时推断不出input的shape，必须等到调用该Layer层时才触发build函数去构建可训练的参数，调用call函数去做inference。

当然，Layer中也可以声明non_trainable的变量：

另外，Layer也是可以嵌套使用的，就是在定义一个新的Layer类时去调用另外一个Layer类：

定义完Layer之后，那么怎么使用它进行inference和训练呢？其实流程都是大致固定的，定义inference结构，loss函数，优化器。然后遍历dataset，求梯度最后更新。

上面这些知识其实都是Layer的基本用法啦，让我们随着大佬的视频走的更远，飞的更高点，哈哈。

首先介绍的是在Layer中实现对losses追踪功能。

那么怎么将这个loss加到loss函数中呢？其实也就是本来model的loss+model.losses（模型可追踪的loss）

下面介绍了怎么让Layer类可序列化：在定义的时候加上get_config函数

另外在定义Layer的时候，call函数有一个特别重要的参数Training，用来指示train模式和非train模式下的区别，这对于Batch_normalization来说就很有用：

讲完了Layer类的定义，下面该轮到Model类的讲解了：

Model类可以处理一些top-level的功能，这是Layer类不具备的，比如training，saving，summary，模型可视化等

那么怎么在训练模型的时候打开eager模型呢（就是不会去构造graph，速度相对会慢点）：

下面介绍了Functional Models的概念，平时用的也最多。Functional Model可以自动生成call、build和get_config方法

大佬总结了Functional Model的特点。其实最核心的点就是Functional Model只是去构造一个layers之间的DAGs，仅仅处于configuration配置的层面，不会涉及到任何数据的流入和流出。个人一些使用keras的心得，一般比较复杂的模型，可以用Functional Model先去构造，然后使用model.summary或者keras.utils.model_plot函数将模型打印出来，然后去check下自己构造的模型有没有什么bug。

下面介绍了在构造Functional Model时，内部的一些工作机制：可以看到有一个内部变量-keras_history来追踪Model的构建。

那么这种Functional Model的构造方式有什么独特的特征呢？

首先介绍的是静态输入兼容性检查：可以看到在调用build的前后对输入x分别作了一次兼容性检查。

下面是Whole-model保存和model plot的功能：

另外，还有自动Masking的功能：

下面，大佬深度总结了在符号输入情况下（一般是使用Input来定义的输入）当你调用一个Layer时所有的内部流程：

最后将的是动态Layer类，该类因为存在动态的行为，不会被加入到graph中去执行。对应上个投影片的step 6，如果是dynamic的layer，则会根据静态的shape inference去调用compute_output_shape函数。

整个视频听下来感觉还是蛮有深度的，大佬就是大佬啊。

视频的链接是：

https://www.youtube.com/watch?

本文转载自Alex-zhai知乎账号。

原文链接：https://zhuanlan.zhihu.com/p/83513829

创作场景

Inside Tensorflow 之：tf.keras part1