写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002410
用户头像

发布了 152 篇内容, 共 79.2 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

博睿数据携数据链DNA理念亮相山东 助力金融行业数字化转型

博睿数据

Java版人脸检测详解下篇:开发java应用并做成docker镜像同步

编程菌

Java 编程 程序员 技术 技术栈

JAVA的多线程与高并发

愚者

Java 多线程

声网 X Yalla:面对面不如线上见,中东年轻人最偏爱的语聊房是怎样“炼”成的?

声网

人工智能 产品方案

网络攻防学习笔记 Day87

穿过生命散发芬芳

网络攻防 7月日更

首张区块链《代理出口货物证明》 区块链技术首次应用于出口退税

CECBC

最详细的多线程讲解!

愚者

Java 多线程

明道云与阿里1688对接案例

明道云

零代码平台在大型企业的进化之路

明道云

抖音快手获客系统开发公司

ONES Performance 研发效能管理解决方案

万事ONES

研发效能 解决方案 ONES

Vue深入学习1—mustache模板引擎原理

魁首

Vue 3

体验设计也可以很简单。只要释放出一些善意就可以了。

石云升

用户体验 7月日更 体验设计

三分钟评估 你的CMDB是“磐石”还是“豆腐渣”

鹿小U

DevOps 运维自动化 CMDB IT运维

百度智能云在视频云解决方案市场位居前三!

百度大脑

云计算 云服务 IDC

原来ReadWriteLock也能开发高性能缓存,看完我也能和面试官好好聊聊了!

冰河

Java 并发编程 多线程 高并发 异步编程

浅析“关于区块链解决资本主义问题还是社会主义问题”的对与错

CECBC

模块三作业:外包学生管理系统架构文档

babos

#架构实战营

模块3.架构设计

Geek_ywh40v

模块三外包学生管理系统架构文档

kitten

架构师训练 模块三

【架构设计模块三】:学生信息管理系统的架构文档

Ryoma

毕业设计:设计电商秒杀系统

张大彪

为什么在线自习室这么受年轻人的追捧?

anyRTC开发者

音视频 WebRTC 在线教育 在线自习室 实时直播

真的太刺激了,蚂蚁金服难忘的四面经历:Linxu+数据库+数据结构+算法+计算机网络

Java 程序员 架构 面试 计算机

洗清杂念 辟除妄见 归于自然|靠谱点评

无量靠谱

博睿作为AIOps代表厂商入选《2021年中国ICT技术成熟度曲线报告》

博睿数据

有了 NGINX 和 Kong,为什么还需要 Apache APISIX?

API7.ai 技术团队

网关 kong ngnix APISIX

生态和场景一站式集成?来看看小程序的“共享主义”

蚂蚁集团移动开发平台 mPaaS

小程序 支付宝 移动开发 生态 mPaaS

博睿数据把脉“体验经济”,以“上帝”视角解决业务运营挑战

博睿数据

数据链DNA:可观测助力云原生时代服务可达

博睿数据

“区块链+物联网”的发展现状和应用案例

CECBC

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章