大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002289
用户头像

发布了 152 篇内容, 共 76.8 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

中文技术文档的写作规范参考

面向工资Coding

JavaScript刷LeetCode心得

js2030code

JavaScript LeetCode

建议收藏,轻松搞懂区块链!

蔡农曰

比特币 区块链 后端 比特币区块链

美团前端一面手写面试题

helloworld1024fd

JavaScript

React源码解读之React Fiber

flyzz177

拆分电商系统为微服务

Geek_7d539e

架构实战营10期-作业7

炮仗

用javascript分类刷leetcode17.栈(图文视频讲解)

js2030code

JavaScript LeetCode

架构误区系列13:令人迷惑的继承

agnostic

继承

React源码分析(二)渲染机制

goClient1992

React

ReactDOM.render在react源码中执行之后发生了什么?

flyzz177

React

会声会影2023官方正式版本功能介绍

茶色酒

会声会影2023

React源码分析(三):useState,useReducer

goClient1992

React

LeetCode:240. 搜索二维矩阵 II,直接查找,详细注释

Lee Chen

JavaScript 算法 LeetCode

「 Java基础-链式调用 」Java开发中如何让你的代码看起来更优雅?试试链式调用?

小刘学编程

Java 设计模式 建造者模式

信源分类及数学模型

timerring

信息 信息论 信息论与编码

在线头脑风暴软件Mural及其竞品分析

hongfei

思维导图 工具软件 头脑风暴

React Context源码是怎么实现的呢

flyzz177

React

Portraiture2023最新版本下载安装图文教程

茶色酒

Portraiture Portraiture4

2023-02-19:请用go语言调用ffmepg,输出视频文件信息。

福大大架构师每日一题

golang ffmpeg 福大大

统一观测丨使用 Prometheus 监控云原生网关,我们该关注哪些指标?

阿里巴巴云原生

阿里云 云原生 Prometheus 云原生网关

React源码分析1-jsx转换及React.createElement

goClient1992

React

前端工程师leetcode算法面试必备-简单的二叉树

js2030code

JavaScript LeetCode

CnosDB成为首个产品支持SQLancer的云原生时序数据库

CnosDB

时序数据库 开源社区 CnosDB 工程师有话说

产品团队业务思维的重要性

Bruce Talk

敏捷 Agile

快速制作一个chrome插件

JYeontu

chrome Vue chrome扩展 Chrome插件

FL Studio最新发布21中文正式版本下载

茶色酒

FL Studio 21

手撕常见JS面试题

helloworld1024fd

JavaScript

云计算未来 5 年发展方向大盘点

亚马逊云科技 (Amazon Web Services)

人工智能

应对ChatGPT,中国AI需要这三种能力

脑极体

百度 飞桨 文心

对比开源丨Prometheus 服务多场景存储压测全解析

阿里巴巴云原生

阿里云 开源 云原生 Prometheus

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章