AWS与微软合作发布Gluon API 可快速构建机器学习模型_微软_sai



 写点什么

2017 年 10 月 12 日， AWS 与微软合作发布了 Gluon 开源项目，该项目旨在帮助开发者更加简单快速的构建机器学习模型，同时保留了较好的性能。

根据 Gluon 项目官方 Github 页面上的描述，Gluon API 支持任意一种深度学习框架，其相关规范已经在 Apache MXNet 项目中实施，开发者只需安装最新版本的 MXNet（master）即可体验。AWS 用户可以创建一个AWS Deep Learning AMI 进行体验。

该页面提供了一段简易使用说明，摘录如下：

本教程以一个两层神经网络的构建和训练为例，我们将它称呼为多层感知机(multilayer perceptron)。（本示范建议使用Python 3.3 或以上，并且使用 Jupyter notebook 来运行。详细教程可参考这个页面。）

首先，进行如下引用声明：

复制代码

  import mxnet as mx
from mxnet import gluon, autograd, ndarray
import numpy as np

然后，使用gluon.data.DataLoader承载训练数据和测试数据。这个 DataLoader 是一个 iterator 对象类，非常适合处理规模较大的数据集。

复制代码

 train_data = mx.gluon.data.DataLoader(mx.gluon.data.vision.MNIST(train=True, transform=lambda data, label: (data.astype(np.float32)/255, label)),
                                      batch_size=32, shuffle=True)
test_data = mx.gluon.data.DataLoader(mx.gluon.data.vision.MNIST(train=False, transform=lambda data, label: (data.astype(np.float32)/255, label)),
                                     batch_size=32, shuffle=False)

接下来，定义神经网络：

复制代码

 # 先把模型做个初始化
net = gluon.nn.Sequential()
# 然后定义模型架构
with net.name_scope():
    net.add(gluon.nn.Dense(128, activation="relu")) # 第一层设置 128 个节点
    net.add(gluon.nn.Dense(64, activation="relu")) # 第二层设置 64 个节点
    net.add(gluon.nn.Dense(10)) # 输出层

然后把模型的参数设置一下：

复制代码

 # 先随机设置模型参数
# 数值从一个标准差为 0.05 正态分布曲线里面取
net.collect_params().initialize(mx.init.Normal(sigma=0.05))
 
# 使用 softmax cross entropy loss 算法 
# 计算模型的预测能力
softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()
 
# 使用随机梯度下降算法 (sgd) 进行训练
# 并且将学习率的超参数设置为 .1
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': .1})

之后就可以开始跑训练了，一共分四个步骤。一、把数据放进去；二、在神经网络模型算出输出之后，比较其与实际结果的差距；三、用 Gluon 的autograd计算模型各参数对此差距的影响；四、用 Gluon 的trainer方法优化这些参数以降低差距。以下我们先让它跑 10 轮的训练：

复制代码

 epochs = 10
for e in range(epochs):
    for i, (data, label) in enumerate(train_data):
        data = data.as_in_context(mx.cpu()).reshape((-1, 784))
        label = label.as_in_context(mx.cpu())
        with autograd.record(): # Start recording the derivatives
            output = net(data) # the forward iteration
            loss = softmax_cross_entropy(output, label)
            loss.backward()
        trainer.step(data.shape[0])
        # Provide stats on the improvement of the model over each epoch
        curr_loss = ndarray.mean(loss).asscalar()
    print("Epoch {}. Current Loss: {}.".format(e, curr_loss))

若想了解更多 Gluon 说明与用法，可以查看 gluon.mxnet.io 这个网站。

发布

暂无评论

创作场景

AWS 与微软合作发布 Gluon API 可快速构建机器学习模型

评论

中小企业如何有效应对计算资源的弹性变化需求？

现代应用参考架构之 OpenTelemetry 集成进展报告

怎样才能做好企业内部wiki（维基）？

公私域营销新技术：小程序一键转App

Java注解系统学习与实战

SQL 嵌套 N 层太长太难写怎么办？

以软件定义物联网芯片，以技术融合推动LPWAN2.0泛在物联

Baklib|搭建在线帮助中心网页的策略分享

解决java多继承问题

Java基础 | 如何用Javadoc Tool写规范正确的java注释

接口自动化你不懂？听HttpRunner的作者怎么说

【数据库】ClickHouse在亿级广域物联标签云平台ZETag Server的探索与实践

详解：Java 的静态工厂方法

外包程序员的开源 Java 低代码开发平台光 2.3.0 Beta4 版发布，显著提升生成物质量

Java 函数式编程

BAT 名企大厂做接口自动化如何高效使用 Requests ？

MobPush开发过程常见问题

App Deploy as Code! SAE & Terraform 实现 IaC 式部署应用

面试重点：建立Java并发知识体系（含工具全图鉴）

Java 中HashMap 详解

活动回顾 | 基于英特尔技术的端到端音视频优化

java时间日期类

数据持久化技术（Python）的使用

利用AndroidNativeEmu完成多层jni调用的模拟

实战指南 | Serverless 架构下的应用开发

智能遍历测试在回归测试与健壮性测试的应用

为什么越来越多的企业开始建立自己的知识库？

微软出品自动化神器Playwright，不用写一行代码（Playwright+Java）系列（二）之脚本的录制及调试...

详解Java中的异常和处理时间

Java毕设项目——超市POS收银管理系统(java+SSM+Maven+Mysql+Jsp)

最流行的接口测试体系，从入门到项目实战

	import mxnet as mx
	from mxnet import gluon, autograd, ndarray
	import numpy as np

	train_data = mx.gluon.data.DataLoader(mx.gluon.data.vision.MNIST(train=True, transform=lambda data, label: (data.astype(np.float32)/255, label)),
	batch_size=32, shuffle=True)
	test_data = mx.gluon.data.DataLoader(mx.gluon.data.vision.MNIST(train=False, transform=lambda data, label: (data.astype(np.float32)/255, label)),
	batch_size=32, shuffle=False)

	# 先把模型做个初始化
	net = gluon.nn.Sequential()
	# 然后定义模型架构
	with net.name_scope():
	net.add(gluon.nn.Dense(128, activation="relu")) # 第一层设置 128 个节点
	net.add(gluon.nn.Dense(64, activation="relu")) # 第二层设置 64 个节点
	net.add(gluon.nn.Dense(10)) # 输出层

	# 先随机设置模型参数
	# 数值从一个标准差为 0.05 正态分布曲线里面取
	net.collect_params().initialize(mx.init.Normal(sigma=0.05))

	# 使用 softmax cross entropy loss 算法
	# 计算模型的预测能力
	softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()

	# 使用随机梯度下降算法 (sgd) 进行训练
	# 并且将学习率的超参数设置为 .1
	trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': .1})

	epochs = 10
	for e in range(epochs):
	for i, (data, label) in enumerate(train_data):
	data = data.as_in_context(mx.cpu()).reshape((-1, 784))
	label = label.as_in_context(mx.cpu())
	with autograd.record(): # Start recording the derivatives
	output = net(data) # the forward iteration
	loss = softmax_cross_entropy(output, label)
	loss.backward()
	trainer.step(data.shape[0])
	# Provide stats on the improvement of the model over each epoch
	curr_loss = ndarray.mean(loss).asscalar()
	print("Epoch {}. Current Loss: {}.".format(e, curr_loss))

创作场景

AWS 与微软合作发布 Gluon API 可快速构建机器学习模型

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载