写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002469
用户头像

发布了 152 篇内容, 共 80.3 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

如何把域名解析到自己的网站?一文读懂域名解析那些事

防火墙后吃泡面

携手豆包大模型,领克汽车在智能销售领域迈出坚实一步

新消费日报

当心!不要在SpringBoot中再犯这样严重的错误

秃头小帅oi

通义灵码入选 2024 世界人工智能大会最高荣誉「镇馆之宝」

阿里云云效

阿里云 云原生 通义灵码

中软国际加入龙蜥社区,促进“技术+生态”双向赋能

OpenAnolis小助手

龙蜥社区 龙蜥生态 中软国际

重新定义 AI 部署效率与性能!ZOLOZ 如何借助 AC2 实现低成本高性能的提优?| AI 案例推荐

OpenAnolis小助手

AI 操作系统 容器镜像 龙蜥社区 ZOLOZ

商汤推出「可控」人物视频生成大模型;大阪将在多座车站部署实时语音识别系统丨 RTE 开发者日报

RTE开发者社区

通义灵码入选 2024 世界人工智能大会最高荣誉「镇馆之宝」

阿里巴巴云原生

阿里云 云原生 通义灵码

线上观看人次3万+!「系统安全技术沙龙-龙蜥社区走进浪潮信息专场」圆满结束

OpenAnolis小助手

操作系统 系统安全 国产操作系统 龙蜥meetup

龙蜥技术认证携手成都东软学院,证书与学分互认互通

OpenAnolis小助手

开源 操作系统 龙蜥技术认证

阿里面试:说说@Async实现原理?

王磊

Java 面试题

SD-WAN组网:跨国企业网络互联解决方案

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

如何确保海外社媒账号的安全稳定——海外云手机

Ogcloud

云手机 海外云手机 云手机海外版 海外云手机推荐 海外社媒运营

低代码开发平台助力中小企业服务数字化转型

不在线第一只蜗牛

低代码 数字化 企业转型

碳课堂|搞清楚碳足迹,只看这篇文章就够了

AMT企源

碳中和 双碳 碳管理 碳核算

MinIO:开源对象存储解决方案的领先者

数新网络官方账号

开源 前端 Minio

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章