Base 北京的同学看过来!3 月 24 日 阿里云瑶池数据库峰会将在北京落地。报名请戳👉 了解详情
写点什么

再见 Excel!我开源了一款与 Python 深度集成的神器级 IDE

  • 2019-07-31
  • 本文字数:2364 字

    阅读完需:约 8 分钟

再见Excel!我开源了一款与Python深度集成的神器级IDE

这是一款与 Python 深度集成、基于 Web 开发、无需在各个工具之间切换、适用大部分职业工作场景的开源电子表格应用程序。对它的评价只有 Wow awesome,amazing!


一位名叫 Rick Lamers 的外国小哥开源了一款与 Python 深度集成、基于 Web 的电子表格应用程序。



这个开源项目有多牛呢?如果你经常与 Excel、R Studio 和 Python 打交道,反复在各个应用间切换,它可以完美解决你的所有问题。这是一款程序员能用、运营能用、产品能用、财务能用的神器级 IDE。

为什么要开发 Grid Studio?

Grid Studio 主要要解决的问题是如何在开发数据科学项目时不需要在各种工具(比如 R Sudio、Excel)之间切来切去,因为那种体验实在太糟糕了。


在导出 CSV 文件时,因为行数太多或者尝试读取 JSON 文件会导致应用程序窗口没有响应。现有的工具无法提供高效的开发环境和工作流。


于是,Rick 决定开发一个工具,把他的工作流集成在一起,可以方便地应对各种项目。

Grid Studio 的工作原理

Grid Studio 是一款基于 Web 的应用程序,看起来和 Google Sheets 或 Excel 很像。不过,它的杀手锏特性是与 Python 的深度集成。


你可以直接用它查看和编辑表格结构的数据,也可以直接在上面编写和执行 Python 代码。



在 Grid Studio 中可以直接通过 Python 读写电子表格。


要向表格中写入数据,可以这样:


sheet("A1:A3", [1, 2, 3])
复制代码


要从表格中读取数据,可以这样:


my_matrix = sheet("A1:A3")
复制代码


这些简单的函数可以实现数据的自动录入、抽取、可视化,等等。

编写自定义函数

虽然上述的读写函数已经可以满足很多需求,但有时候也需要编写自定义函数,然后在表格中调用这些函数。


Grid Studio 默认支持常用的表格函数,比如 AVERAGE、SUM、IF,等等。但如果你想要使用其他函数,那该怎么办?


自己动手写!


def UPPERCASE(a):        return str(a).uppercase()
复制代码


然后就可以在表格中调用这个函数,就像调用常规的函数一样。

利用 Python 生态系统

Python 生态系统提供了很多非常棒的数据科学开发工具:



借助这些工具可以很容易地使用强大的模型,比如线性回归和 SVM。

Docker 运行时

Grid Studio 运行在 Docker 容器中,可以很方便地访问 UNIX 环境(甚至是 Windows!)中的东西:Python、scikit-learn、numpa、pandas、terminal、wget、zip,等等。


Grid Studio 提供了预先构建好的 Docker 镜像,可以通过简单的命令行来启动。

数据可视化

数据可视化是数据科学的一项常见任务。Grid Studio 与 Plotly.js 和 Matplotlib 深度集成,为高级数据可视化提供了内置支持。



为了演示 Grid Studio 的功能,接下来将提供一些具体的例子。

示例:爬取网络内容

之前爬取网络内容可能需要在各种工具之间切换,现在只需要一个脚本就够了。



在上面的示例中,一个简短的脚本直接将 Hacker News 网站的文章加载到表格中。


脚本地址:


https://github.com/ricklamers/gridstudio/blob/master/examples/scrape.py

示例:估计正态分布

这个例子演示了使用 Plotly.js 进行高保真正态分布估计,交互式绘图让你对正在发生的事情一目了然。



脚本地址:


https://github.com/ricklamers/gridstudio/blob/master/examples/estimate_normal.py

开源动机

虽然最初 Rick 想将这个工具打造成一个商业项目,但最后还是决定将其开源,让每个人都能使用它,并有可能由来自社区的一小批数据爱好者负责开发。


在开发这个工具的初期,他发现有很多项目都提供了类似的功能。


首先,有一个叫作 xlwings 的插件将 Python 直接集成到 Excel 中。尽管它并不是真的将电子表格和 Python 集成到单个产品中,但确实为用户提供了一个完整的 Excel 开发环境。


其次,Python 已经从 IPython 转向了 Jupyter Notebooks,为数据科学家提供了一个很好的开发环境。虽然它仍然缺乏电子表格功能,但对于初级数据科学家来说仍然很有吸引力。


总的来说,如果把 Grid Studio 做成商业项目,它就要与这些开源产品展开竞争,这样在价格上就不会有任何优势。Rick 坚信 Grid Studio 提供了一些独特的功能,在某些场景下会成为不二之选。


Grid Studio 的项目地址:


https://github.com/ricklamers/gridstudio。

开发者评价

东西好不好,开发者最知道。


Bruh, this is amazing. You should sell this shit are you kidding me?!

兄弟,这也太牛了,你应该把这玩意儿卖钱啊,(开源)是在逗我?


As a heavy excel user who despises vba, this looks amazing

作为一个鄙视 VBA 的 Excel 重度用户,这也太牛了吧


I showed this to my brother, who’s not a programmer, and he said “holy shit!”. Well, it’s impressive. Good job!

我把这个给我不是程序员的哥哥看,他说:我去,太牛了,干得漂亮!


除了整齐划一的 wow awesome、amazing 的赞叹,开发者们同样提出了很多改进意见,并且表示可以加入社区一起优化这个工具。版本和开发计划 Grid Studio 现在就可以从 GitHub 上下载了。


  • 增加更多原生函数(比如 AVERAGE、SUM、IF 之外),甚至是来自 Libre Office Calc 或 Excel 的函数。

  • 在表格中输入公式时提供语法高亮和函数提示。

  • 高级排序和过滤功能。

  • 扩展控件,使用 Plotly.js 进行交互式可视化。

  • 更容易地分享工作空间或代码(比如导出工作空间)。

  • 实时协作(这个可能会很困难)。

  • 提供插件 API 或接口。

  • 将公式解析器升级成真正的基于语法的解析器。

  • Python 语法自动完成。

  • 性能优化。

  • 与 Python 更健壮地集成(不会出现字符、语句断开)。

如何使用 Grid Studio?

在本地安装 Grid Studio(确保已经安装了 Docker):


  1. 克隆代码库:git clone

  2. https://github.com/ricklamers/gridstudio

  3. 运行 bash 脚本(在 Windows 上使用 Git Bash):

  4. cd gridstudio && ./run.sh

  5. 在浏览器中打开

  6. http://127.0.0.1:8080


你感兴趣吗?

原文链接:

https://hackernoon.com/introducing-grid-studio-a-spreadsheet-app-with-python-to-make-data-science-easier-tdup38f7


2019-07-31 17:4927883
用户头像

发布了 731 篇内容, 共 413.4 次阅读, 收获喜欢 1976 次。

关注

评论 1 条评论

发布
用户头像
好东西
2019-08-01 09:26
回复
没有更多了
发现更多内容

Java面试经,nginx解决跨域原理

Java 程序员 后端

模块二作业

小鹿

Java高级特性之 IO流,java面试题高级

Java 程序员 后端

Jedis入门教程,java入门课程百度网盘

Java 程序员 后端

Java系列高频面试题:序列化+注解,java基础入门第二版电子书

Java 程序员 后端

模块二作业

小朱

架构实战营

Java面试题超详细整理《Spring篇》,Tencent后台开发Java岗二面

Java 程序员 后端

架构实战营第 1 期 - 毕业总结

Anyou Liu

「架构实战营」

Java静态代理和动态代理的使用及原理解析,java项目面试难点

Java 程序员 后端

模块二作业

迪马

Java面试之多线程:Java创建多线程为什么只有一种方式?

Java 程序员 后端

Java面试被MySQL问哭了,面试官一个连环炮提问,我一个都讲不清

Java 程序员 后端

JDK的前世今生:细数 Java5 - 15 的那些经典特性

Java 程序员 后端

Java高手是怎样炼成的?阿里P8技术大牛这份手写笔记告诉你答案!

Java 程序员 后端

Java高级特性之 IO流(1),三面蚂蚁金服(交叉面)定级阿里P6

Java 程序员 后端

Java虚拟机(JVM)面试题(2020最新版),linux视频教程下载

Java 程序员 后端

Java面试屡碰壁,一气之下狂刷高分宝典,一月之后拿到字节offer

Java 程序员 后端

架构设计流程

天天向上

架构实战营

架构 3 期模块二作业:下微信朋友圈的高性能复杂度

渐行渐远

架构实战营

java面试题,mybatis原理和实现机制

Java 程序员 后端

腾讯数字生态大会|大数据与你相约武汉

腾讯云大数据

大数据

Java集合之ArrayList详解,大厂越来越注重基础了,建议收藏

Java 程序员 后端

【架构训练营】毕业设计

zclau

java继承和多态,Java开发岗笔试题

Java 程序员 后端

Java进阶之梯,成长路线与学习资料,助力突破中间件领域

Java 程序员 后端

Java进阶之深入理解Java的接口和抽象类,剑指java面试百度云

Java 程序员 后端

架构实战营模块2课后作业

天天向上

架构实战营

模块二:如何抓住架构设计关键点? -- 学习总结

小鹿

040022-week2-design

InfoQ_70156470130f

Java面试题超详细整理《多线程篇》,mongodb教程导入外部数据

Java 程序员 后端

【架构训练营】毕业总结

zclau

再见Excel!我开源了一款与Python深度集成的神器级IDE_编程语言_Rick Lamers_InfoQ精选文章