阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

Heroku Dataclips 2.0——数据 Gist

  • 2013-02-04
  • 本文字数:2194 字

    阅读完需:约 7 分钟

Heroku Postgres

释放数据的价值

借助于最近上线的 Dataclips 2.0 的新特性,Heroku 在其路上又迈出了重要的一步:

“释放数据的价值”。就像 GitHub Gists 支持相关代码片段的共享与协作一样,Dataclips 也可以对你的数据做同样的事情。

时至今日,人们已经达成共识:单个应用的价值有限,而不断消费与使用的数据才真正具有价值。开放这些数据不是一件易事,要考虑到开放性以及对不断增长的服务的支持,这些服务会混搭现有的数据源来创建出更大的内容,结果就是 1+1>2。

Heroku Postgres 团队花了近一年的时间来整理 Dataclips 的架构与实现。InfoQ 有幸采访到了 Heroku Craig Kerstiens 持久化小组的产品经理。本文概要介绍了 Dataclips 的诸多方面与特性,他们不仅对于开发者很有价值,对于业务与决策者来说也是非常重要的。

Craig 说到:

组织的数据几乎是最有价值的资产。但遗憾的是,这些数据通常会被放到一个数据库中,只能由少数有权限的人通过很少的几种方式来访问。很多时候,报告都是手工生成的,并被粘贴到邮件中;他们构建的仪表盘很快就会过时,根本就没法回答人们的问题。

这个想法让 Heroku 重新开始构建 Dataclips,提供易于安装和使用的产品,并且着眼于未来的众多应用。

示例——卫生检查分数SFO

为了让大家对Dataclips 有个感性的了解,我们展示一个由Code for America 开发的应用,这个示例表示旧金山餐厅与食品公司的卫生检查分数。Code for America 搜集并聚合了一些公开数据,Dataclips 是分享这些数据的一种手段。

比如说,“最近的业务分数”:

你可以通过 dataclips.heroku.com 的帐号或是 Postgres 管理页面(提供恰当的 SQL 语句)来直接创建 Dataclips。唯一的限制在于一个 Dataclips 只能返回 30,000 行,超出的数据会被截断。

Dataclips 可以用在嵌入的 iframe 中,就像上面这个示例一样,也可以用作独立的 HTML 页面。我们可以通过上面这个示例看到 SQL、版本以及 Dataclips 的修订历史,可以通过邮件、Twitter 或是 Google docs 进行分享。通过向 URL 追加文件扩展 CSV、XLS(Excel)或是 JSON,你可以使用这些格式来下载 Dataclips。

JSON

复制代码
https://dataclips.heroku.com/aniexnddtuqpmtjhmuvdgrqprjns.json
{"fields":["name","address","city","score"],
"values":[
["MINI BAR SF, LLC","837 DIVISADERO ST ","San Francisco","100"],
["AT&T - MAIN KITCHEN/SUITE LEVEL [145084]","24 WILLIE MAYS PLAZA 4.10.03 ","San Francisco","100"],
["CYBELLE'S PIZZA","719 14TH ST ","San Francisco","100"],
...
]}

CSV——Comma Separated Values

复制代码
https://dataclips.heroku.com/aniexnddtuqpmtjhmuvdgrqprjns.csv
name,address,city,score
"MINI BAR SF, LLC",837 DIVISADERO ST ,San Francisco,100
AT&T - MAIN KITCHEN/SUITE LEVEL [145084],24 WILLIE MAYS PLAZA 4.10.03 ,San Francisco,100
CYBELLE'S PIZZA,719 14TH ST ,San Francisco,100
PACIFIC UNION CLUB,1000 CALIFORNIA ST ,San Francisco,100
...

其他格式也会在未来得到支持,比如说 XML 与 YAML。但诸如 google-data-table 格式是非常适合于与各种 Google 图表进行整合的。目前,我们可以通过 ImportData(URL)函数将 CSV 格式导入到 Google Calc 电子表格中,每小时刷新一次。

修订与版本

类似于 Gists,Dataclips 也支持版本和修订。每次查询发生变化时,新的 Dataclips 修订就会创建出来(也会列在 dataclip-page 上),对于每个变化的结果(由于数据发生了变化),新的版本也会产生。可以通过向 URL 追加?revision=1&version=5 查询参数来访问不同的修订与版本。类似于 Gists,Dataclips 也可以创建分支,然后独立使用。

实现

Dataclips 的实现是相当直接的。Dataclips 是通过运行在 heroku 基础设施之上的 Ruby 应用来提供服务的,它会定期(目前大约是一分钟一次)在只读事务中运行配置好的查询并获取结果。脚本会监控运行时与查询,并动态调整频率。查询的结果会存储在版本化的表中以供快速访问,它独立于原来的数据库。其他格式在 S3 中创建并缓存下来。HTML 视图并不会缓存,而是即时渲染。

使用与反馈

Craig 就如何使用 Dataclips 给出了很多用例。Dataclips 是自更新的,存储的版本化信息可由决策者使用。对于开发者来说,共享数据变得易如反掌。Dataclips 可用作稳定的 API 来编写原型,甚至是完整的应用。一般来说,他们提供了向混搭与其他使用场景公开数据的能力。另一个有趣的用例是人们可以通过 Dataclips 学习 SQL,只需做个分支,然后编辑 SQL 即可返回结果。

Dataclips 的路线图有很多维度。比如说支持更多的格式或是为 HTML 视图提供样式等显而易见的计划。开启其他的关系数据库很简单,将 Dataclips 集成到 NoSQL 插件提供者中将会非常有趣,当然肯定也会很复杂。另一个有趣的方向是向 Dataclips 添加社交特性,如评论、评级等,这最终会创造出一个 Dataclips 市场(有免费与付费版本)。自定义 URI 尚未有规划。更加频繁地使用 Dataclips 也意味着需要有相应的 API 以编程的方式来创建他们。

到目前为止,来自用户的反馈还是非常积极的,Dataclips 的一些有趣的用例有欺骗检测可视化、用户注册,以及作为仪表盘的数据源等。

对于商业化,Heroku Postgres 还计划了额外一些特性,比如说只能由Heroku 用户才能访问Dataclips。免费版本的安全性通过不可猜测的URI 来保证。

查看英文原文: Heroku Dataclips 2.0 - The Gist of Data

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2013-02-04 00:111239
用户头像

发布了 88 篇内容, 共 258.4 次阅读, 收获喜欢 8 次。

关注

评论

发布
暂无评论
发现更多内容

客服都要下岗了? 当ChatGPT遇见私有数据,秒变AI智能客服!

WorkPlus

解锁软件工程新角色——平台工程师

SEAL安全

DevOps 平台工程 平台工程师

Java 高效处理千万级数据:技巧与最佳实践

xfgg

Java 大数据

led显示屏保养技巧

Dylan

故障 LED显示屏 设备日常保养

对应用数据开发还有疑惑?看这篇就够了!数据存储、管理,通通掌握!

HarmonyOS开发者

HarmonyOS

一文回顾 Boundless Hackathon at Stanford 首期 Workshop

西柚子

技术的交流 思想的碰撞|2023开放原子全球开源峰会TOC面对面分论坛即将启幕

开放原子开源基金会

开源 社区 TOC

秒验 iOS端集成指南

MobTech袤博科技

开源创新 协同融合|2023开放原子全球开源峰会开源协作平台分论坛即将启幕

开放原子开源基金会

开源 开源协作

植物大战僵尸mac版下载

Rose

植物大战僵尸 mac 植物大战僵尸中文版 植物大战僵尸下载 mac塔防游戏

abaqus有限元仿真常见问题(一):数值仿真在产品研发中的作用

思茂信息

CAE abaqus abaqus软件 abaqus有限元仿真

华为教育中心:奇趣“童”行庆六一 多彩儿童应用助成长

科技热闻

如何在大学校园内合作运营共享电单车

共享电单车厂家

校内共享电单车 共享电动车投放 共享电单车合作 共享电单车厂家

智能出行 驱动未来|2023开放原子全球开源峰会CARSMOS开源智能出行生态年会即将启幕

开放原子开源基金会

开源 智能出行 CARSMOS

Mac电脑ps ai beta安装教程及ai绘图如何使用

魔仙苹果mac堡

ps AI绘图 ps ai beta Firefly AI使用教程

一文回顾 Boundless Hackathon at Stanford 首期 Workshop

鳄鱼视界

支持M1的苹果电脑视频下载器-Downie 4 Mac中文版

Rose

Mac 视频下载工具 Downie 4许可证 Downie 4中文版 Downie mac破解版

挖掘算力产业的创新力量和新型机遇|2023开放原子全球开源峰会先进计算分论坛即将启幕

开放原子开源基金会

开源 算力 先进计算

乘云而上,山西软件行业CXO思享会在晋起航

说山水

提升您的 MQTT 云服务:深入探索 BYOC

EMQ映云科技

物联网 云服务 mqtt

软件测试/测试开发丨接口测试学习笔记

测试人

程序员 软件测试 自动化测试 测试开发

在软件定义汽车的时代,低代码究竟给车企数字化转型带来了什么?

优秀

低代码 车企 车企数字化

AI2023下载 Illustrator mac版 2023 年 4 月版(版本 27.5)的新增功能

魔仙苹果mac堡

AI2023下载 Adobe Illustrator2023 AI2023完美解锁版

Scrum敏捷项目管理真实案例

顿顿顿

Scrum 敏捷开发 敏捷开发管理 敏捷项目管理 scrum工具

百度倾力出品|《神经网络机器翻译技术及产业应用》正式上线

飞桨PaddlePaddle

人工智能 深度学习 百度飞桨

世界500强开滦集团的财务共享建设路径

用友BIP

财务共享

重新思考流处理与流数据库

吴英骏

开源 云原生 流处理 ​Rust 实时数据库

FC红白机游戏600合集 for mac(小霸王游戏) 单机离线版

Rose

Mac游戏下载 FC 红白机游戏 任天堂游戏下载 小霸王游戏

mac电脑如何远程控制win?微软远程桌面连接工具来帮你!

Rose

Mac远程控制软件 mac电脑如何远程控制win microsoft remote desktop 微软远程桌面连接工具

WaveMetrics Igor Pro 9 for Mac(科学计算和数据分析软件)

魔仙苹果mac堡

苹果软件资源站 mac科学计算软件 WaveMetrics Igor Pro 9 Igor Pro 9破解

CodeWhisperer 初体验

天黑黑

AI 亚马逊云 CodeWhisperer

Heroku Dataclips 2.0——数据Gist_DevOps & 平台工程_Michael Hunger_InfoQ精选文章