写点什么

七年没能将 Python 集成到 Excel,Python 之父加入微软三年后成了!

  • 2023-08-25
    北京
  • 本文字数:3834 字

    阅读完需:约 13 分钟

七年没能将Python 集成到 Excel,Python 之父加入微软三年后成了!

近日,微软宣布将流行的编程语言 Python 引入到了 Excel。该功能的公共预览版现已推出,允许 Excel 用户操作和分析来自 Python 的数据。

 

微软表示,Python in Excel 能够在同一工作簿中将 Python 与 Excel 分析原生组合起来,无需任何额外设置。使用 Python in Excel,用户可以直接在单元格内键入 Python,相关计算将在微软云端运行,并将绘图和可视化等结果返回至工作表内。

 

“听起来像愚人节玩笑,但这是真的!”“太棒了!它肯定可以加快我的工作速度。”网友们听到这个消息后纷纷发出了感叹。为什么大家都对此感到兴奋呢?我们先看下 Python 的强大功能和 Excel 的灵活性结合后,都发生了哪些“化学反应”?

 

Python in Excel 有何独特之处?

 

Python in Excel 即将通过 Excel for Windows 的 Beta Channel,向 Microsoft 365 Insiders 项目的会员们发布公共预览版。不过微软也表示在预览结束后,“如果没有付费许可证,某些功能将受到限制”。

 

首先,Python in Excel 专为分析师而构建。微软表示,每一天,全球各地都有数百万用户依靠熟悉的 Excel 工具(例如公式、图表和数据透视表)分析并理解自己的数据。Python in Excel 将以原生方式被直接整合至 Excel 网格当中。

 

用户只需使用新的 PY 函数即可将 Python 代码直接输入至 Excel 单元格中。Excel 用户可通过 Python 访问强大的分析功能,从而实现可视化、数据清洗、机器学习和预测分析等目标。用户现在可以创建起无缝对接的 Excel 加 Python 端到端解决方案,且全程无需脱离于 Excel 之外。使用 Excel 的内置连接器加 Power Query,用户还能轻松将外部数据引入 Python in Excel 的工作流程。Python in Excel 还跟用户所熟悉并喜爱的各种工具相兼容,例如公式、数据透视表和 Excel 图表等。下面来看 Python in Excel 所能实现的几种分析示例:

 

  • 高级可视化

 

充分利用 Matplotlib 和 seaborn 等著名 Python 图表库的功能构建各类图表,包括传统的条形图、线形图,乃至热力图、小提琴图和群图等专用可视化效果。

 


 使用 Seaborn 生成的各种图

 

  • 机器学习、预测分析和预期计算

 

利用 scikit-learn 与 statsmodels 等 Python 库,可以实现目前人气极高的机器学习、预测分析与预期计算,包括回归分析、时间序列建模等等。

 


使用 Python 和 Excel LAMBDA 构建的天气预测机器学习模型

 

  • 数据清洗

 

可有效利用先进的数据清洗技术,例如查找缺失值、标准化格式、删除重复项,并可采用正则表达式等技术进行基于模式的转换。

 


 使用正则表达式提取日期

 

其次,Python in Excel 通过 Anaconda 实现顶级 Python 分析功能。

 

Anaconda 是全球数千万数据从业者日常使用的领先 Python 项目。Python in Excel 可使用运行在 Azure 当中的 Anaconda Distribution for Python,其中包含最流行的各 Python 库(例如 pandas、Matplotlib、scikit-learn 等),并由 Anaconda 安全完成构建、测试和支持。Anaconda 提供的 Python 功能,支持在 Python in Excel 中执行广泛的分析操作。

 

再者,Python in Excel 运行于微软云端,无需任何额外设置。

 

Excel 使用的 Python 代码运行在微软云端,并提供 Microsoft 365 兼容的连接体验。Python 代码使用 Azure 容器实例在自己的虚拟机管理程序内隔离运行,并通过安全的软件供应链从 Anaconda 处获取源构建包。微软表示,Python in Excel 可以防止运行的 Python 代码知晓用户身份,通过互联网打开的工作簿也在独立的容器内受进一步隔离,这就妥善保护了用户的数据隐私。工作簿中的数据只能通过内置 xl() Python 函数发送,且 Python 代码的输出只能作为=PY() Excel 函数的结果返回。

 

另外,Python in Excel 专为团队协作而打造。

 

用户可以在 Excel 工作簿内共享 Python。各团队成员还可以在基于 Excel 的分析中无缝进行 Python 交互并刷新,不必分神安装其他工具、Python 运行时,或者管理库和依赖项。用户可以随意选择自己喜爱的协作工作(例如 Microsoft Teams 和 Microsoft Outlook)来共享工作簿,并通过评论、@提及还有与同事共同开发以进行无缝协作,整个体验过程与本地 Excel 无异。包含 Python 的工作簿还配合有敏感度标签,能够确保其符合组织内的信息保护策略。

 

Excel 团队曾尝试过,但失败了

 

该消息发布后,自称曾在 Excel 工作过的开发者“vba”爆料,Excel 早就试着将 Python 引入 Excel,但最终失败了。

 

作为一个曾试图将 Python 引入 Excel 的前 Excel 开发人员,今天看到这个消息真的很惊喜。7 年多前,我选择离开 Excel 团队。当时老板的老板知道我对将 Python 引入 Excel 很感兴趣,如果我选择留下的话,就给我一个机会来解决这个问题。后来,原本 6 个月的项目变成了大约 3 年的项目,Python 的部分消失了,我们最终在 Excel 中启用了 JavaScript 自定义函数。

 

对于 Python,我们当时也是设计为在“云端”(AzureML v1)运行,尽管就是否应该在本地运行上前前后后做了很多讨论。我认为让 Python 部分消失的是我们的合作伙伴 AzureML 团队的重新重组、重新发布和重新雇佣,我们失去了一个 PM。与此同时,我们的工作引起了另一个合作伙伴团队的注意,他们意识到他们可以使用我们的代码来执行进程外的 JavaScript。所以我花了很多时间来确保功能成功发布,我想这对 Python 是不利的。

 

我得到了一些优秀工程师的帮助,也学到了很多东西。这项工作的核心是修改 Excel 的计算引擎,使其允许函数异步计算,允许用户在远程终端(JavaScript、Python 或其他工具)计算的同时继续处理电子表格的其他部分。以前,电子表格会在计算运行时被锁住,这对于长时间运行的无限计算来说不太友好。不知道我们当时构建的任何功能是否都被纳入了这项新功能。

 

现在,非常高兴看到这个功能,并期待去尝试。

 

微软表示,Python in Excel 的诞生,源自微软内部多个团队之间的密切合作,包括微软 Excel、微软开发者部门、微软安全部门、微软 Azure 以及微软研究院等。其中,Python 创建者、BDFL 荣誉退休人员、现任 Microsoft 杰出工程师 Guido van Rossum 也参与了这项工作,并帮助定义了 Excel 中的 Python 架构。

 

“我很高兴 Python 和 Excel 的这种出色的、紧密的集成现在已经面世。我希望两个社区都能在这次合作中找到有趣的新用途,从而增强每个合作伙伴的能力。三年前我加入 Microsoft 时,我做梦也没想到这会成为可能。Excel 团队非常出色!”Rossum 表示。

 

Rossum 如今已经 67 岁。2020 年 11 月,耐不住无聊退休生活的 Rossum 决定加入微软的开发者部门。当时,微软组建了一个团队来提高 Python 解释器的速度,他一方面参与 Python 自身的优化工作,还帮助微软的其他团队集成面向公众或面向开发人员的 Python 微软产品。

 

当然,除了官方团队,还有个人开发者也尝试过将 python 引入 Excel。开发者“bubblebobble”表示自己几年前构建了一个可用的“Excel 中的 Python”,还远程执行 sql 和 matlab&r。“当我要求进行 beta 测试的一些人说‘他们的公司不会为此付费’、让我觉得我在浪费时间时,我放弃了......”有网友安慰他:“你只是超前于你的时代!”

 

网友:我想让它还支持本地运行

 

对于这项新功能,McKinney 公司数据与分析执行总监 Greg Barnes 称,“对 Python 的全面支持,是我在整个职业生涯中经历过的最令人兴奋的 Excel 更新!”他表示,在 Excel 中运行 Python 的功能,让 McKinney 成功简化了原有报告工作流程。“我们曾经在 Jupyter Notebook 中操作数据结构、过滤和聚合数据,并在 Excel 中构建视觉效果。但现在,我们可以在 Excel 中管理整个工作流,这使得 Excel 变得更加强大,也让 Python 在整个组织中更易于使用。”

 

而网友们也表示开心,但同时也有更多期待。“我希望它不仅仅由 Microsoft Cloud 提供支持,并且可以支持本地运行的 Python,但无论如何,我仍认为这会是巨大的项目,并且会在很大程度上使 Excel 现代化,仅此一点就可以消除只需要这种数据的网站的需求。我想到我以前做的一个项目,就是建立一个分析网站,内部只有少数几个人使用,如果当时有这样的东西,就能很好地满足他们的需求。”开发者“cableshaft”表示。

 

对此,网友“rawgabbit”称,“公平地说,Tableau Desktop、Tableau Prep 和 Tableau Cloud 虽然价格昂贵,但仍然是很棒的产品。借助 Tableau Prep,您可以获得可视化 ETL 工具。从技术角度来说,我更喜欢 SQL,但对于业务人员来说,Tableau Prep 更像是一个 REPL,因此他们可以看到自己的操作将要做什么。他们可以在 Tableau Cloud 中安排这些 Prep 流程,该流程将进行 ETL 并生成每日数据集,然后用户可以通过 Tableau Cloud 上的仪表板进行交互。在我看来,Excel 走在正确的道路上,它具有与 Salesforce、Azure 数据库等开箱即用的连接器。它真正需要的是带有 REPL 输出的完整 SQL,以便用户可以看到其 SQL 的效果。(Tableau Prep 的做法是默认对行进行采样以输出即时结果)。”

 

有开发者指出,云以及尽可能多的云集成是微软的核心战略。这是关于定期付款、锁定以及最终在他们自己计算机上真正拥有世界经济的知识和业务流程。这可能说明了为什么目前只支持云上运行。

 

还有网友指出,“Python 进入 Excel,成为压死 VBA 的最后一根稻草。”VBA 一直是 Excel 脚本编程的主要工具。VBA 简单易学、功能强大,在长达几十年的时间里为提高 Excel 工作效率作出了贡献。但随着 Python 的流行,越来越多的人用 Python 进行 Excel 脚本编程来提高工作效率,VBA 逐渐式微。

 

你对 Python in Excel 有什么看法?欢迎评论区分享哦~

 

参考链接:

https://techcommunity.microsoft.com/t5/excel-blog/announcing-python-in-excel-combining-the-power-of-python-and-the/ba-p/3893439

https://news.ycombinator.com/item?id=37222191

2023-08-25 13:488900

评论

发布
暂无评论
发现更多内容

Go 语言入门很简单:从 goroutine 出发到并发

宇宙之一粟

Go 语言 goroutine 2月月更

互联网人的命运,就是活到30岁都难?

码农参上

人生 互联网人 打工人

2022年中国智慧医疗行业洞察

易观分析

智慧医疗

架构实战模块八作业

Anlumina

「架构实战营」

模块八作业

hunk

云原生训练营

消息队列基于Mysql存储表设计

tony

「架构实战营」

日志管理系统,多种方式总结

架构 日志 slf4j logback

喜报!龙蜥操作系统&龙蜥社区双双荣登2021“科创中国”开源创新榜!

OpenAnolis小助手

开源 操作系统 创新

80 行代码实现简易 RxJS

CRMEB

基于 Kafka 的实时数仓在搜索的实践应用

vivo互联网技术

kafka 服务器 搜索 数据舱

模块八作业

李晓笛

「架构实战营」

分享两个常见的搜索算法:BFS和DFS

华为云开发者联盟

算法 DFS 深度优先搜索 BFS 搜索算法

【架构实战营】模块八:命题作业

wgl

「架构实战营」

模块八 - 消息队列存储数据表结构设计

圈圈gor

架构实战营 「架构实战营」

基于STM32+ESP8266+华为云IoT设计的智能门锁

DS小龙哥

2月月更

如何写好一个Java类?

蜜糖的代码注释

Java 整洁代码 2月月更

理论+实践,带你掌握动态规划法

华为云开发者联盟

AI 算法 动态规划法 子问题

模块八作业-设计消息队列存储消息的MySQL表

CH

架构实战营 #架构实战营 「架构实战营」

编写 Kubernetes 部署脚本将 httpserver 部署到 Kubernetes 集群

tom

第八周作业

cqyanbo

7大迹象,表明你的DevOps 做对了!

飞算JavaAI开发助手

java培训:Java类加载机制的理解

@零度

JAVA开发 类加载机制

大数据培训:Flink的提交模式

@零度

大数据 flink

郑州轻工业大学——HarmonyOS宠物健康系统的开发分享

HarmonyOS开发者

HarmonyOS 健康检查

混合编程:如何用pybind11调用C++

华为云开发者联盟

c++ Python API 混合编程 pybind11

架构训练营模块八作业

沈益飞

架构训练营 架构师训练营 4 期

不能Hook的人生不值得 jsHook和模拟执行

奋飞安全

安全 js hook jshook

史上最强代码自测方法,没有之一!

万俊峰Kevin

微服务 单元测试 go-zero 测试工具 Go 语言

2022重磅:增长法则-巧用数字营销 突破企业困局

博文视点Broadview

模块八作业

黄秀明

「架构实战营」

鉴机识变,面向未来|RocketMQ Summit 2022 即将来袭

阿里巴巴云原生

阿里云 开源 RocketMQ 云原生 开源消息队列

七年没能将Python 集成到 Excel,Python 之父加入微软三年后成了!_编程语言_褚杏娟_InfoQ精选文章