谷歌云 AI 平台整合 what-if 工具_AI_Steef-Jan Wiggers_InfoQ精选文章

InfoQ Geekathon 大模型技术应用创新大赛了解详情 



 写点什么

登录/注册

谷歌云 AI 平台整合 what-if 工具

近日，谷歌宣布其云 AI 平台整合What-If工具。这是一个基于代码的数据科学开发环境，允许数据科学家在他们的人工智能平台上分析模型。现在，客户可以把 What-If 工具用于部署在 AI 平台上的 XGBoost 和 Scikit Learn 模型。

去年，谷歌的 TensorFlow 团队推出了 What-If 工具，这是一个交互式的可视化接口，旨在帮助数据科学家可视化他们的数据集，更好地理解 TensorFlow 模型的输出。现在，这个工具已不再局限于 TensorFlow，它开始支持 XGBoost 和 Scikit Learn 模型。数据科学家可以通过 AI 平台笔记本、Colab 笔记本或本地的 Jupyter 笔记本来使用这个新集成的工具。

通过这个工具，数据科学家无需编写任何代码就可以调整各种数据点，并分析模型的执行过程。同时，他们还可以在同一数据集上同时测试两个不同的人工智能模型的性能，他们也可以检查单个数据点或整个数据集切片，从而进行更深程度地对比和比较。此外，他们还可以：

使用 Facets Dive 函数来对比同一数据集上不同人工智能模型的性能表现，并创建自定义的可视化
通过将推理结果组织成混淆矩阵、散点图或柱状图来检查单个模型的性能
通过添加或删除特征来编辑数据点，以运行对 AI 模型性能的健壮测试

谷歌决策智能实验室的负责人Cassie Kozyrkov在她的博客（towardsdatascience）中写道：

尽管 What-If 工具不是为初学者设计的（你需要了解一些基本的知识，而且最好不要把它当作 Python 或笔记本的入门练习），但对于实践分析师和机器学习工程师来说，它是一个了不起的加速器。

为了使用这种新的集成，数据科学家首先需要通过 gcloud CLI 进行训练，然后将模型部署到谷歌云 AI 平台上。接下来，数据科学家可以通过设置一个 WitConfigBuilder 对象在 What-If 工具中查看它在一个数据集上的性能。

config_builder=（WitConfigBuilder（test_examples） .set_ai_platform_model（'your-gcp-project','gcp-model-name','model-version'） .set_target_feature（'thing-to-predict'）WitWidget（config_builder）

复制代码

所有测试样本都是模型所期望的格式，无论是 JSON 字典列表、JSON 列表还是包括真值（ground truth）标签的 tf.Emample protos 。这些样本可以让我们探索不同特征对模型预测的影响。

数据科学家看到的第一个视图是数据点编辑器（Datapoint Editor），它显示所提供数据集的所有样本以及通过模型进行预测的结果。此外，通过主面板中的这个编辑器，数据科学家可以更改关于数据点的任何内容，并通过模型重新运行它，来查看这些更改是如何影响预测结果的。

而通过下一个选项卡 Performance + Fairness，数据科学家可以查看整个数据集的聚合模型结果。此外，谷歌云平台的开发者Sara Robinson在博客中写道：

你可以通过特征对数据集进行切片，并在这些数据切片之间进行性能比较，确定模型表现最好或最差的数据子集，这对机器学习的公平性调查非常有帮助。

最后，更多关于 What-If 工具功能的内容可参考入门指南和技术文档。

原文链接：

Google Adds New Integrations for the What-If Tool on Their Cloud AI Platform

活动推荐：

2023年9月3-5日，「QCon全球软件开发大会·北京站」将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题，策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229（微信同手机号）。

评论

发布

暂无评论

pip安装更换镜像

PyTorch中 torch.nn与torch.nn.functional的区别

上海前端培训课程哪家的好

TiDB 底层存储结构 LSM 树原理介绍

C++后台开发

数据结构后端开发 LSM树 TiDB

这可能是Feign调用可重试的最佳方案了

高性能网络SIG月度动态：virtio新设备进入virtio规范、smc新特性IPC性能比tcp提升88% | 龙蜥SIG

OpenAnolis小助手

操作系统高性能网络龙蜥社区 sig virtio

无需服务器开发，实现设备状态缓存方案——实践类

sql 缓存运维物联网存储

房价危机：疫情后时代席卷全球的新变局|数据报告

前嗅大数据

数据分析数据采集爬虫案例爬虫工具房价

I see you！「2022 龙蜥社区优秀贡献者」正式启动

OpenAnolis小助手

开源龙蜥社区 2022 奖项优秀贡献者

Python中LSTM回归神经网络的时间序列预测

软件测试/测试开发丨从 0 开始学 Python 自动化测试开发（二）：环境搭建

Python 软件测试自动化测试测试开发

深圳大数据程序员培训多长时间可以找工作

创建Root权限虚拟环境

带你来吃瓜！Andy Pavlo教授带您一文回顾数据库的2022年

MySQL 数据库 HTAP StoneDB 企业号 1 月 PK 榜

平安健康 Dubbo 3 升级、迁移和验证之路

阿里巴巴中间件

阿里云云原生 dubbo

软件测试/测试开发丨如何从 0 开始学 Python 自动化测试开发（一）

Python 软件测试自动化测试测试开发

尚硅谷Filebeat视频教程发布

RPN：Region Proposal Networks (区域候选网络)

啥玩意儿？一个计时模块要做2天？

为自己带盐

Python对txt进行读写操作

如何通过Java应用程序添加或删除 PDF 中的附件

在下毛毛雨

PDF Java’ 添加注释

Python将图片输出为二维数组并保存到txt中

极光笔记 | 如何为 iOS 16 创建一个实时活动

ios 开发者运营 API

小令观点 | 个人信息泄露——当代数字身份之殇

令牌云数字身份

数字身份信息泄露身份

软件开发入门教程网之Git 基本操作

git clone git push

未来软件开发主流模式——低代码开发

力软低代码开发平台

PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法

稳扎稳打，坚定前行 | 一文带你回顾 StoneDB 的 2022 年

MySQL 数据库 HTAP StoneDB 企业号 1 月 PK 榜

为什么 APISIX Ingress 是比 Ingress NGINX 更好的选择？

API7.ai 技术团队

APISIX Ingress Controller Kubernetes Serverless NGINX Ingress Controller

Python将二维数组输出为图片

PyTorch的简单实现

扫码添加小助手
领取最新资料包