写点什么

Databricks 统一分析平台提供 AutoML Toolkit

  • 2019-10-26
  • 本文字数:783 字

    阅读完需:约 3 分钟

Databricks统一分析平台提供AutoML Toolkit

DatabricksApache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。


通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强 ML 体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML 工具包的执行会被自动跟踪。


Databricks 实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。


统一分析平台主要包括以下三个组件:


  • Databricks 工作区:以统一数据科学和工程为目标,工作区利用共享交互式笔记本、工具和 API 处理所有分析过程(从 ETL 到模型训练和部署)。

  • Databricks 运行时:运行时组件帮助进行数据准备,并持续训练和部署 AI/ML 应用程序的模型。它支持Hyperopt、MLlib和MLflow之间的集成,从而支持分布式有条件的超参数调优、自动跟踪和增强的可视化。开始时,用户可以使用预配置的集群,包括一些流行的 ML 框架,如HadoopKafka、Spark、ParquetTensorFlowKerasScikit Learn

  • Databricks 云服务:云服务通过在云上提供完全托管的服务来帮助管理基础设施的复杂性。云服务包括微软Azure集成和 Amazon Web Services(AWS)。


Databricks 还提供与第三方机器学习工具的集成,如H2OSparkling WaterDataRobotXGBoost


要了解有关新的分析平台和 AutoML toolkit 的更多信息,请查看以下资源:



原文链接


Databricks’ Unified Analytics Platform Supports AutoML Toolkit


2019-10-26 08:002417

评论

发布
暂无评论
发现更多内容

重温算法之颜色分类

自由

算法刷题 7月月更

zookeeper-认识zookeeper

zarmnosaj

7月月更

飙车资深老教练-手撸一个EventBus

芝麻粒儿

android EventBus 7月月更

Qt中 connect的多种方式

小肉球

qt 7月月更

【萌新解题】两数之和

面试官问

LeetCode 哈希表 两数之和

到底应不应该使用 lombok

HoneyMoose

《高绩效教练》:如何用提问激发潜能?

郭明

读书笔记

基于Qt设计的课堂考勤系统(采用RDS for MySQL云数据库 )

DS小龙哥

7月月更

密码密钥硬编码检查

Tom(⊙o⊙)

密码 软件安全 信息泄露 静态代码检查 密钥管理

自定义spring boot starter三部曲之一:准备工作

程序员欣宸

spring springboot 7月月更

查找——顺序表的查找和有序表的查找

乔乔

7月月更

语音直播app源码

开源直播系统源码

直播系统源码 开源源码 语音直播系统源码

斐波拉契数最小步数与合法括号序列判断

未见花闻

7月月更

shell脚本定时备份mysql数据库

乌龟哥哥

7月月更

Ark UI 中的问题汇总【系列 2】

坚果

HarmonyOS OpenHarmony Open Harmony 7月月更

jQuery

Jason199

jquery js 7月月更

Ceph分布式存储初步认识(一)

Lansonli

私有云 Ceph 云存储 7月月更

接口测试进阶接口脚本使用—apipost(预/后执行脚本)

Xd

接口测试

企业级容器安全风险与最佳实践

明亮安全观

网络安全 安全架构 容器安全

iOS 中的 Protocol

NewBoy

ios 前端 移动端 iOS 知识体系 7月月更

MySQL进阶(一)主外键讲解

No Silver Bullet

MySQL 数据库 7月月更 主外键

不习惯的 Vue3 起步五 のapiHooks封装

空城机

Vue3 7月月更

微软 Edge 浏览器 Tracking Prevention 的强制措施的一个例子

汪子熙

JavaScript microsoft 浏览器 前端开发 7月月更

读书笔记之数据密集型应用的可靠性

宇宙之一粟

读书笔记 7月月更

3000字11张图硬核科普:什么是边缘计算?与云计算有什么联系和区别?

wljslmz

云计算 边缘计算 7月月更

记一次uniapp的经历

是乃德也是Ned

uni-app 7月月更

OAI L3与L2接口分析

柒号华仔

5G 7月月更

Qt | 读取文件内容并删除文件 QFile

YOLO.

File 文件操作 qt 7月月更

LeetCode第二题,裂开了..

为自己带盐

LeetCode 7月月更

面试突击65:为什么要用HTTPS?它有什么优点?

王磊

Java 面试题

数据仓库分层——DWD DWS ADS傻傻分不清楚

怀瑾握瑜的嘉与嘉

数据仓库 7月月更

Databricks统一分析平台提供AutoML Toolkit_大数据_Srini Penchikala_InfoQ精选文章