NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Databricks 统一分析平台提供 AutoML Toolkit

  • 2019-10-26
  • 本文字数:783 字

    阅读完需:约 3 分钟

Databricks统一分析平台提供AutoML Toolkit

DatabricksApache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。


通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强 ML 体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML 工具包的执行会被自动跟踪。


Databricks 实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。


统一分析平台主要包括以下三个组件:


  • Databricks 工作区:以统一数据科学和工程为目标,工作区利用共享交互式笔记本、工具和 API 处理所有分析过程(从 ETL 到模型训练和部署)。

  • Databricks 运行时:运行时组件帮助进行数据准备,并持续训练和部署 AI/ML 应用程序的模型。它支持Hyperopt、MLlib和MLflow之间的集成,从而支持分布式有条件的超参数调优、自动跟踪和增强的可视化。开始时,用户可以使用预配置的集群,包括一些流行的 ML 框架,如HadoopKafka、Spark、ParquetTensorFlowKerasScikit Learn

  • Databricks 云服务:云服务通过在云上提供完全托管的服务来帮助管理基础设施的复杂性。云服务包括微软Azure集成和 Amazon Web Services(AWS)。


Databricks 还提供与第三方机器学习工具的集成,如H2OSparkling WaterDataRobotXGBoost


要了解有关新的分析平台和 AutoML toolkit 的更多信息,请查看以下资源:



原文链接


Databricks’ Unified Analytics Platform Supports AutoML Toolkit


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-10-26 08:002257

评论

发布
暂无评论
发现更多内容

企业数字化转型难?华为云大数据BI帮你一站式上云

科技之光

2022,我们追逐群星,也在追逐AIGC的无尽可能

脑极体

这88道阿里高级岗面试题,刷掉了80%以上的Java程序员

钟奕礼

编程 程序员 Java 面试 Java、

备受企业青睐的华为云CDN优势到底在哪?

路过的憨憨

Flink Shuffle 3.0: Vision, Roadmap and Progress

Apache Flink

大数据 flink 实时计算

【12.23-12.30】写作社区优秀技术博文回顾

InfoQ写作社区官方

热门活动

「复享光学」用深度光谱技术推动光与电的变革

硬科技星球

云原生、20.3k Star......时序数据库 TDengine 的 2022 年精彩纷呈

TDengine

数据库 tdengine 开源 时序数据库

华为云大数据-助力数据价值化,释放企业发展潜能

科技之光

Dubbo 3 之 Triple 流控反压原理解析

Apache Dubbo

Java 开源 微服务 gRPC dubbo

接口自动化测试不想写代码?这款工具强烈推荐

叶小柒

测试 Postman

华为云CDN,助力安全企业下载服务,更好提升用户体验

路过的憨憨

我坦白→低代码功能我有,SQL练习题、数据可视化、数据填充助你高效

非喵鱼

sql 低代码 可视化 eCharts 数据库·

2022年最全大厂面试真题解析:java集合+spring+并发编程+MyBatis

钟奕礼

程序员 Java 面试 Java、 java 编程

建木v2.6.2发布

Jianmu

开源 DevOps 持续集成 低代码 CI/CD

刷完200+大厂Java真题手册,成功拿到阿里,京东,美团的offer

钟奕礼

程序员 Java 面试 Java、 java 编程

开源全球公司贡献 49 名,涛思数据荣登 2022 中国开发者影响力年度榜单

TDengine

tdengine 时序数据库

如何快速建立商业智能系统?华为云告诉您!

科技之光

Pg数据库日常维护操作指南

i查拉图斯特拉如是说

数据库 postgresql PgSQL

既要速度与激情,也要稳定和安全,华为云CDN让你速度和安全兼得

路过的憨憨

10 万字节Spring Boot +redis详细面试笔记(带完整目录)免费分享

钟奕礼

程序员 Java 面试 Java、 java 编程

蚂蚁金服Java研发岗二面:说说HashMap 中的容量与扩容实现

钟奕礼

程序员 Java 面试 Java、 java 编程

华为云CDN加速服务,引领企业数字化发展潮流!

路过的憨憨

打造全链数据营销服务,华为云助力车企业务增值

科技之光

数字化转型如何更方便?华为云大数据BI解决方案来了!

科技之光

墨菲安全软件供应链安全产品v3.0正式公测之产品特性简介及用户升级说明

墨菲安全

软件成分分析 开源安全 墨菲安全 软件供应链安全

启科量子部署工具 Runtime 正式开源

启科量子开发者官方号

部署 量子

AI for Science的上半场:人工智能如何重新定义科学研究新范式?

脑极体

公司刚来的阿里p8,看完我构建的springboot框架,甩给我一份文档

钟奕礼

程序员 Java 面试 Java、 java 编程

华为云CDN提升网站响应速度,让下载快人一步

路过的憨憨

暴雪、迪士尼大佬用什么画画?RayLink远控软件助力解锁远程创作

RayLink远程工具

远程控制软件 远程办公软件 远控软件 RayLink

Databricks统一分析平台提供AutoML Toolkit_大数据_Srini Penchikala_InfoQ精选文章