写点什么

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

  • 2019-10-30
  • 本文字数:1298 字

    阅读完需:约 4 分钟

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

今天,AWS 发布了 Model Server for Apache MXNet (MMS) 版本 0.2,这是一个打包深度学习模型和为模型提供服务的开源库,适用于进行大规模预测。现在,您可以 Open Neural Network Exchange (ONNX) 的形式为模型提供服务,并直接向 Amazon CloudWatch (可在其中创建控制面板和警报) 发布运维指标。

什么是 MMS?

MMS 是一个开源库,旨在简化深度学习模型的部署以进行大规模推理。MMS 提供以下功能:


  • 提供可以将多个模型构件打包到单个模型存档中的工具。此存档封装了为模型提供服务所需的所有构件。

  • 能够使用模型存档中打包的自定义代码自定义推理执行管道中的每个步骤。

  • 提供预配置的服务堆栈,包括 REST API 终端节点和推理引擎。

  • 在为可扩展模型提供服务方面,提供了 Docker 镜像,包括 MMS、MXNet 和 nginx。

  • 提供实时运维指标,用于监控 MMS 和终端节点。


您可通过 PyPI (Python Package Index) 包预配置的 Docker 镜像安装 MMS,也可直接通过 Model Server GitHub 存储库安装 MMS。

ONNX 模型服务简介

ONNX 实现了深度学习框架之间的互操作性。借助 MMS 版本 0.2,您可使用 MMS 为通过支持 ONNX 的任何框架创建的 ONNX 模型提供服务。其中包括 PyTorch、Caffe2、Microsoft Cognitive Toolkit (CNTK) 和 Chainer。


要开始为 ONNX 模型提供服务,请参阅 MMS ONNX 服务文档

向 CloudWatch 发布模型服务指标

此版本包含与 CloudWatch 的集成,后者是一种适用于云资源和应用程序的监控服务。您可使用 CloudWatch 收集和跟踪指标、设置警报,并自动对变更做出反应。


MMS 现在直接与 CloudWatch API 集成,从而能够轻松向 CloudWatch 发布运维指标。能够近乎实时地监控运维指标对于任何生产服务都至关重要。


MMS 可报告各项模型服务指标,如请求计数、错误、延迟以及 CPU、内存和磁盘的主机资源使用率。借助 CloudWatch 集成,您可利用基于 Web 的控制面板、实时提供的指标,以及触发器和提醒配置功能。


要开始使用 MMS 与 CloudWatch 集成后提供的功能,请参阅 MMS CloudWatch 指标文档

了解更多信息并做出贡献

要了解关于 MMS 的更多信息,请先学习我们的 Single Shot Multi Object Detection (SSD) 教程,本教程将引导您完成导出 SSD 模型和为其提供服务的所有步骤。您可在存储库的模型园文档文件夹中找到更多示例和文档。


我们不会停止开发 MMS 的脚步,欢迎社区以提交问题、请求和贡献的形式积极参与。请访问 awslabs/mxnet-model-server,开始使用!


作者介绍:


Hagay Lupesko 是 AWS 深度学习的工程负责人。他专注于构建让开发人员和科学家能够创造智能应用程序的深度学习系统。在业余时间,他喜欢阅读、徒步旅行以及与家人共享天伦之乐。


**



Jonathan Esterhazy 是 AWS 深度学习的高级软件工程师。**他负责构建工具和系统,为大规模训练和部署深度学习系统提供更多便利。


**



Ruofei Yu 是 AWS 深度学习的软件工程师。**他专注于为软件工程师和科学家构建创新的深度学习工具。在业余时间,他喜欢与朋友和家人共度美好时光。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/model-server-for-apache-mxnet-introduces-onnx-support-and-amazon-cloudwatch-integration/


2019-10-30 08:00676

评论

发布
暂无评论
发现更多内容

Fabric.js 动态设置字号大小 🎄

德育处主任

canvas 前端可视化 FabricJS Fabric.js 6月月更

浅谈居家办公后的感想| 社区征文

雪雷

居家办公 初夏征文

网络流媒体协议的联系与区别(RTP RTCP RTSP RTMP HLS)

赖猫

音视频 流媒体

tornado环境搭建及基本框架搭建——熟悉的hello world

孤寒者

Python tornado 6月月更 hello world

谈谈远程工作 | 社区征文

大菠萝

初夏征文

远程办公经验分享 | 社区征文

Geek_ac6fb9

初夏征文

数据结构进阶(一)稀疏矩阵

No Silver Bullet

稀疏矩阵 6月月更

【sql语句基础】——删(delete) /改(update)

写代码两年半

数据库 sql :MySQL 数据库 6月月更

【LeetCode】 极大极小游戏Java题解

Albert

LeetCode 6月月更

详解Java中的值传递

工程师日月

6月月更

测试基础之:黑盒测试

甜甜的白桃

测试用例 黑盒测试 6月月更

远程办公经验 | 社区征文

弑着去忘记う

初夏征文

【高并发】关于线程池,蚂蚁金服面试官问了我这些内容!!

冰河

并发编程 多线程 高并发 异步编程 6月月更

Django 介绍与安装

海拥(haiyong.site)

django 6月月更

Linux开发_ Linux命令复习与文件目录复习

DS小龙哥

6月月更

safePoint讲解及其安插思路分析

北洋

6月月更

开源项目那么多,这次带你了解个版本的区别,明白alpha版、beta版、rc版是什么意思

迷彩

开源 记录 6月月更

C#入门系列(十一) -- 多维数组

陈言必行

C# 6月月更

浅析分布式系统之体系结构-事务与隔离级别(多对象、多操作)下篇

snlfsnef

InfoQ 极客传媒 15 周年庆征文|Dubbo入门实战:Spring + Zookeeper + Dubbo

No Silver Bullet

zookeeper 架构 dubbo 6月月更 InfoQ极客传媒15周年庆

你还不懂线程池的设计及原理吗?掰开揉碎了教你设计线程池

C++后台开发

线程 线程池 后端开发 Linux服务器开发 C++后台开发

Es6新特性——箭头函数

大熊G

JavaScript 前端 6月月更

spring的BeanFactory和ApplicationContext

程序员欣宸

Java spring 6月月更

InfoQ 极客传媒 15 周年庆征文|Webpack 性能优化措施汇总

No Silver Bullet

性能优化 前端 webpack 6月月更 InfoQ极客传媒15周年庆

这篇SpringCloud GateWay 详解,你用的到

牧小农

SpringCloud Gateway

利用 VSCode 的代码模板提高 MobX 的编码效率

岛上码农

flutter ios 前端 安卓开发 6月月更

SDN系统方法 | 5. 交换机操作系统

俞凡

架构 网络 sdn SDN系统方法

Vue-6-计算属性

Python研究所

6月月更

InfoQ 极客传媒 15 周年庆征文|容器运行时技术深度剖析

liuzhen007

容器 运维 热门活动 InfoQ极客传媒15周年庆

有哪些ABAP关键字和语法,到了ABAP云环境上就没办法用了?

汪子熙

云原生 SAP abap Netweaver 6月月更

485天,远程办公的 21 条心得分享|社区征文

悟空聊架构

远程办公 悟空聊架构 热门活动 初夏征文 社区征文

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章