【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

AI Platform Prediction(平台预测服务)全面开通,具备更出色的可靠性和 ML 工作流集成

Robbie Haertel & Bhupesh Chandra

  • 2020-12-10
  • 本文字数:1343 字

    阅读完需:约 4 分钟

AI Platform Prediction(平台预测服务)全面开通,具备更出色的可靠性和 ML 工作流集成

机器学习 (ML) 正在转变企业业务运营以及人们的生活方式。无论是查找共乘同伴、推荐产品或者播放列表、识别图像中的对象,还是优化市场营销活动,ML 和预测是这些体验的核心所在。AIPlatform 旨在提供一个世界级的企业就绪平台以托管您的所有变革性的 ML 模型,从而为像您这样致力于利用 ML 改造世界的企业提供支持。


作为我们持续承诺的一部分,我们高兴的宣布全面开通基于 Google Kubernetes Engine (GKE) 后端的 AI Platform Prediction。新的后端架构旨在通过新的硬件选项(Compute Engine 机器类型NVIDIA 加速器)提高可靠性和灵活性、减少开销延迟,改进长尾延迟。除了产品 Beta 测试期间就可用的标准功能(例如,自动伸缩、访问日志以及请求/响应日志)之外,我们还提供几项有助于提升健壮性、灵活性和可用性的更新:


  • 高内存/高 CPU 机器类型中的 XGBoost/ scikit learn 模型:许多数据科学家喜欢 XGBoost 和 scikit learn 模型对于生产预测所具有的简便性和强大性。借助 AIPlatform,只需几下点击即可便捷地部署使用这些框架训练的模型—— 我们将在您选择的硬件上处理服务基础架构的复杂性。

  • 资源指标:维护生产环境中的模型的一个重要部分是了解其性能特点,例如,GPU、CPU、RAM 和网络利用率。这些指标能够帮助制定有关使用什么硬件的决策,来最大限度减少延迟和优化性能。例如,您可以查看一段时间的模型副本总数,以帮助您了解您的自动伸缩模型如何响应流量变化以及如何更改最小副本(minReplicas)以优化成本和/或延迟。对于在 GCE 机器类型中部署的模型,现在可从 Cloud Console 和 Stackdriver Metrics 查看资源指标。

  • 区域端点:我们在三个区域(us-central1、europe-west4 和 asia-east1)引入了新的端点,并通过更好的区域隔离来提高可靠性。在区域端点部署的模型位于指定区域内。

  • VPC 服务控件 (Beta):用户可以定义一个安全范围并且部署仅限访问该范围内或者另一个桥接范围内的资源和服务的在线预测模型。可从该范围内调用 CAIP 在线预测 API。只允许受限网络或者安全范围内的 VM 和服务的内网 IP 地址访问 CMLE 的 API,而不必经过公共互联网。


但预测并非仅止于使用训练好的模型。典型的 ML 工作流涉及分析和了解模型和预测。我们的平台集成了其他重要的 AI 技术以简化您的 ML 工作流并让您更加高效:


  • Explainable AI(可解释的 AI)。要更好地了解您的业务,您需要更好地了解您的模型。Explainable AI 提供有关每个请求的预测的信息,并且仅在 AI Platform 提供。

  • What-if Tool。可视化您的数据集,并更好地理解在平台部署的您的模型的输出。

  • 持续评估。基于对发送至您的模型的请求的正确标注,获得有关您的模型的性能指标。制定决策以基于一段时间的性能状况重新训练或者改进模型。


Waze 数据科学家技术主管 PhilippeAdjiman 指出:“通过为我们提供一个适用于我们的模型的即时、托管和健壮的服务层,[AI Platform Prediction] 显著提高了我们的速度,并使我们能够专注于改进特征和建模。”


所有这些功能均在一个具有企业支持的完全托管的无集群环境中提供 —— 无需支持或者管理您自己的高度可用的 GKE 集群。我们还负责配额管理并负责保护您的模型免受来自客户端发送过多流量导致的过载的影响。我们托管平台的这些功能使您的数据科学家和工程师能够专注于业务问题而不是管理基础设施。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-12-10 00:35832

评论

发布
暂无评论
发现更多内容

new() 和 make的区别

陈思敏捷

源码 源码分析 Go 语言

k8s上运行我们的springboot服务之——cloud gateway

柠檬

k8s Spring Cloud

你是个伪工作者么?

池建强

个人成长 伪工作者

工作=投资=创业?

二鱼先生

个人成长 工作思路 工作方式 创业心态 创业者

云直播平台的选型与使用

音视频专家-李超

我的编程之路 -5(停滞)

顿晓

网络编程 操作系统 编程之路 停滞 三年

Tekton 的工作原理

张晓辉

Kubernetes cicd 云原生

python实现·十大排序算法之插入排序(Insertion Sort)

南风以南

Python 排序算法 插入排序

我是如何拿下PMP认证和系统架构设计师考试的?

Nick

RocketMQ - 什么是RocketMQ

Java收录阁

RocketMQ

Go: g0, 特殊的goroutine

陈思敏捷

原理 Go 语言

Flask-SQLAlchemy 多表对单模型

Leetao

Python flask 编程语言 flask-sqlalchemy

圆圈正义 - 读后感

石云升

读书笔记 法律 公平 现实

Java环境搭建

编号94530

Java java8 Java环境 环境安装 jdk安装

除了直接看余额,谁更有钱还能怎么比(一)

石君

零知识证明 多方计算 同态加密

谈谈控制感(8):元控制感

史方远

职场 心理 成长

JUC整理笔记一之细说Unsafe

JFound

Java

python实现·十大排序算法之快速排序(Quick Sort)

南风以南

Python 排序算法 快速排序

《零基础学 Java》 FAQ 之 10-Scanner里nextInt的小坑

臧萌

Java

区块链2.0--以太坊概述

皮卡丘的猫

《零基础学 Java》 FAQ 之 11-为什么构造方法中调用重载的构造方法必须得是在第一行

臧萌

《零基础学 Java》 FAQ 之 12-理解引用

臧萌

Java

游戏夜读 | 怎么让游戏跑起来?

game1night

Go: 应该使用指针还是结构体副本?

陈思敏捷

struct 原理 pointer Go 语言

2020 年 5 月 23 日 Java 集合专题

瑞克与莫迪

Java

其实你就是我羡慕的别人

小天同学

个人成长 感悟 日常思考

看完这篇 Session、Cookie、Token,和面试官扯皮就没问题了

cxuan

https

Mysql增量更新-ON DUPLICATE KEY UPDATE

BerryMew

MySQL 增量更新 ON DUPLICATE KEY UPDATE

prometheus中honor_labels配置项的源码分析

陈思敏捷

Prometheus Go 语言

Go: Trace包探秘

陈思敏捷

原理 Go 语言

利与弊-传统框架要不要部署在Serverless架构上

刘宇

Serverless Web

AI Platform Prediction(平台预测服务)全面开通,具备更出色的可靠性和 ML 工作流集成_架构_InfoQ精选文章