写点什么

Domino:数据科学即服务

2014 年 4 月 16 日

Domino 是一个用于数据科学的 PaaS(平台即服务)云计算平台,人们可以使用 Python 或 R 语言在这个云平台上做数据分析工作。

据 Nick Elprin(Domino 的创始人之一)所说,Domino 让数据科学家只需专注于自己的分析工作,而不用关注软硬件基础设施:

“我们认为,随着数据量的增加和分析技术的越来越成熟,现代数据分析工具在易用性方面已经滞后,并且访问科学领域数据上还有一些不必要的限制。”

Domino 平台上的三大支柱功能:

  1. 直接到云部署和执行:Domino 允许在 EC2 上运行现有的代码(Python、R、Matlab、Julia、shell scripts 等等),以承载长时间运行或资源密集型任务。该系统还关注云端底层管件功能,比如: AMI 管理,启动和停止机器,将数据安全传输到另一机器上,再将结果安全返回。
  2. 数据科学的版本控制:Domino 团队计算过,类似于 Git 之类的分布式版本控制系统并不足以应付分析工作流,因为它们没能力处理大数据集,并且不能在输入和结果(例如图表、数字)间建立联系。Domino 会自动保持整个项目的快照,目前最高至 40GB,这样就很容易追溯整个工作的历史,包括代码、数据和结果。
  3. 协作:类似 Github,Domino 也可以用于合作开发项目。合作者可以查看、编辑并运行这个项目。Domino 会检测冲突,运行结束后将更新的结果发送通知,并且它还有个内部笔记 ,方便讨论团队工作进展。

随收随付的方式,Domino 的定价范围从免费入门到每月付费订阅。正如InfoQ 从 Nick Elprin 那里了解到的,尽管这个平台还处于发展早期,但是它已经被各个科学领域的从业者所使用: 从学者(如为研究分析了数千张图片的生态学家)到数据科学顾问(把它用于 Kaggle 比赛),以及市场营销公司(帮助客户更好定向投递)。

参考英文原文: Domino: Datascience-as-a-Service


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014 年 4 月 16 日 00:471225

评论

发布
暂无评论
发现更多内容

iOS 动画 - 窗景篇(一)

柯烂

ios objective-c swift 移动应用 动画

CI/CD - Python Django 项目在 Jenkins 上的实践

meta-algorithmX

Python django TDD CI/CD

面试题:教你如何吃透RocketMQ

奈学教育

架构 RocketMQ 架构设计

深入理解JVM内存管理 - 方法区

NORTH

深入理解JVM 方法区 老年代

ARTS-week one

Jokky💫

ARTS 打卡计划

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十五)编写测试-断言\假设\使测试失效

编程道与术

Java 编程 TDD 单元测试 JUnit

搞定 HTTP 协议(一):HTTP 与网络基础

零和幺

技术 前端 HTTP

啪啪,打脸了!领导说:try-catch必须放在循环体外!

王磊

Java 性能优化 性能 java编程

深入理解ClassLoader

NORTH

类加载 深入理解JVM ClassLoader

学习没进步?也许反馈有问题

KAMI

学习 认知提升

GcExcel:比 Apache POI 速度更快、性能更高

Geek_Willie

Apache POI GCExcel

霸榜18年,作者连续20年获得微软MVP,这本SQL书凭什么成为畅销经典

图灵社区

数据库 SQL语法 sql查询

除了直接看余额,谁更有钱还能怎么比(三)

石君

零知识证明 多方计算 同态加密

【大厂面试01期】高并发场景下,如何保证缓存与数据库一致性?

NotFound9

Java MySQL 数据库 redis 后端

深入理解JVM类加载机制

NORTH

类加载 深入理解JVM

游戏夜读 | 什么是黑色一分钟?

game1night

CPU的性能,编译器是这样压榨的!

GPU

算法 cpu 编译器 程序语言

产品周刊 | 第 17 期(20200531)

Herbert

产品 设计 产品经理 产品设计 产品推荐

Vue生成AST算法的解析

djknight

Java Vue AST

收藏!如何有效实施devops?

陈琦

DevOps 运维 持续集成 开发 自动化测试

不想被下载限速,教你自建属于自己的云盘!

小傅哥

小傅哥 云服务 云盘 在线网盘

万字长文,助你吃透Eureka服务发现机制!

攀岩飞鱼

分布式 微服务 微服务发现 Eureka

深入理解ContextClassLoader

NORTH

深入理解JVM ContextClassLoader

是公司养活了你,还是你养活了公司?

四猿外

生涯规划 程序员 个人成长

Java是不是慢半拍?

范学雷

Java 架构 编程语言

『PyTorch』使用指定GPU的方法

kraken0

人工智能 学习 图像识别

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十四)编写测试-显示名

编程道与术

Java 编程 TDD 单元测试 JUnit

万恶的NPE如何避免,几种你必须知道的方案!!!

不才陈某

后端

CEO或业务负责人应该具备的数据分析能力

花生

工具 数据 CEO

撸一串趣图,给晚上加班打个鸡血

码农神说

程序员 加班 段子

运维日志里隐藏的安全危机,你知道怎么挖吗?听听专家怎么说

secisland

态势感知 关联分析 SOC

微服务架构下如何保证事务的一致性

微服务架构下如何保证事务的一致性

Domino:数据科学即服务-InfoQ