写点什么

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

  • 2019-10-30
  • 本文字数:1298 字

    阅读完需:约 4 分钟

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

今天,AWS 发布了 Model Server for Apache MXNet (MMS) 版本 0.2,这是一个打包深度学习模型和为模型提供服务的开源库,适用于进行大规模预测。现在,您可以 Open Neural Network Exchange (ONNX) 的形式为模型提供服务,并直接向 Amazon CloudWatch (可在其中创建控制面板和警报) 发布运维指标。

什么是 MMS?

MMS 是一个开源库,旨在简化深度学习模型的部署以进行大规模推理。MMS 提供以下功能:


  • 提供可以将多个模型构件打包到单个模型存档中的工具。此存档封装了为模型提供服务所需的所有构件。

  • 能够使用模型存档中打包的自定义代码自定义推理执行管道中的每个步骤。

  • 提供预配置的服务堆栈,包括 REST API 终端节点和推理引擎。

  • 在为可扩展模型提供服务方面,提供了 Docker 镜像,包括 MMS、MXNet 和 nginx。

  • 提供实时运维指标,用于监控 MMS 和终端节点。


您可通过 PyPI (Python Package Index) 包预配置的 Docker 镜像安装 MMS,也可直接通过 Model Server GitHub 存储库安装 MMS。

ONNX 模型服务简介

ONNX 实现了深度学习框架之间的互操作性。借助 MMS 版本 0.2,您可使用 MMS 为通过支持 ONNX 的任何框架创建的 ONNX 模型提供服务。其中包括 PyTorch、Caffe2、Microsoft Cognitive Toolkit (CNTK) 和 Chainer。


要开始为 ONNX 模型提供服务,请参阅 MMS ONNX 服务文档

向 CloudWatch 发布模型服务指标

此版本包含与 CloudWatch 的集成,后者是一种适用于云资源和应用程序的监控服务。您可使用 CloudWatch 收集和跟踪指标、设置警报,并自动对变更做出反应。


MMS 现在直接与 CloudWatch API 集成,从而能够轻松向 CloudWatch 发布运维指标。能够近乎实时地监控运维指标对于任何生产服务都至关重要。


MMS 可报告各项模型服务指标,如请求计数、错误、延迟以及 CPU、内存和磁盘的主机资源使用率。借助 CloudWatch 集成,您可利用基于 Web 的控制面板、实时提供的指标,以及触发器和提醒配置功能。


要开始使用 MMS 与 CloudWatch 集成后提供的功能,请参阅 MMS CloudWatch 指标文档

了解更多信息并做出贡献

要了解关于 MMS 的更多信息,请先学习我们的 Single Shot Multi Object Detection (SSD) 教程,本教程将引导您完成导出 SSD 模型和为其提供服务的所有步骤。您可在存储库的模型园文档文件夹中找到更多示例和文档。


我们不会停止开发 MMS 的脚步,欢迎社区以提交问题、请求和贡献的形式积极参与。请访问 awslabs/mxnet-model-server,开始使用!


作者介绍:


Hagay Lupesko 是 AWS 深度学习的工程负责人。他专注于构建让开发人员和科学家能够创造智能应用程序的深度学习系统。在业余时间,他喜欢阅读、徒步旅行以及与家人共享天伦之乐。


**



Jonathan Esterhazy 是 AWS 深度学习的高级软件工程师。**他负责构建工具和系统,为大规模训练和部署深度学习系统提供更多便利。


**



Ruofei Yu 是 AWS 深度学习的软件工程师。**他专注于为软件工程师和科学家构建创新的深度学习工具。在业余时间,他喜欢与朋友和家人共度美好时光。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/model-server-for-apache-mxnet-introduces-onnx-support-and-amazon-cloudwatch-integration/


2019-10-30 08:00719

评论

发布
暂无评论
发现更多内容

​探讨AI+新模式,百度大脑提供纺织企业数字化转型新路径

百度大脑

AI 纺织企业

我对技术潮流的一点看法

Phoenix

Dubbo SPI

青年IT男

dubbo

关于第四次财富狂潮的思考,区块链如猛虎出笼?

CECBC

Hello Python! 第一天学 Pyhton 语言

在即

6月日更

架构实战营模块5作业

eoeoeo

架构实战营

面试系列-2 redis列表场景分析实践

李阿柯

php 面试 redis cluster

分治(详解残缺棋盘 —— Java代码实现)

若尘

算法 分治 java代码 6月日更

ARTS- 日常打卡5

pjw

《堂食点餐》APP前后端全部免费开源啦!

YonBuilder低代码开发平台

源码 大前端 APP开发 APICloud 外卖app

Qcon大会百度智能云出招,AI-Native云计算架服务企业融合创新

百度大脑

人工智能 云计算 Qcon

BZZ节点挖矿系统搭建,BZZ矿机分币系统

手把手教你在IDEA中配置Maven

打工人!

Java maven 6月日更

“扯皮”终结者,区块链帮农民工计薪水

CECBC

渣本毕业两年经验,精心整理

欢喜学安卓

android 程序员 面试 移动开发

【Apache BookKeeper】 概念与架构

awen

Apache 分布式存储 bookKeeper

基于 BDD 理论的 Nebula 集成测试框架重构(上篇)

NebulaGraph

k8s 插件管理工具之krew使用

雪雷

6月日更

源码解读-别再说你不知道HashMap原理!面试真题解析

欢喜学安卓

android 程序员 面试 移动开发

🏆大势所趋,迈向认识WebRTC的第一步,加油!

码界西柚

WebRTC RTC RTC征文大赛 6月日更

【Vue2.x 源码学习】第二篇 - Vue的初始化流程

Brave

源码 vue2 6月日更

持续测试 | 让测试更自由:在 CODING 中实践自动化执行用例

CODING DevOps

DevOps 自动化测试 持续测试

你真的了解 “开源” 么?请查收【保姆级】开源百科

程序员鱼皮

Java c++ Python GitHub 开源

HarmonyOS 2正式发布 硬件生态品牌HarmonyOS Connect一同亮相

科技汇

OpenKruise v0.9.0 版本发布:新增 Pod 重启、删除防护等重磅功能

阿里巴巴云原生

容器 运维 云原生 k8s

5分钟速读之Rust权威指南(十五)

wzx

rust

情指勤一体化指挥调度平台搭建,情报研判分析系统搭建

你们公司的数据库出过问题么?

escray

学习 极客时间 朱赟的技术管理课 6月日更

Spring Boot FatJar类加载机制简要分析

luojiahu

Spring Boot 类加载 ClassLoader FatJar

深圳首辆数字人民币主题观光巴士亮相

CECBC

致恰达耶夫,致鸿蒙

脑极体

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章