【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

阿里达摩院:GPT-4 的成本只有高级数据分析员的 0.45%

  • 2023-05-28
    北京
  • 本文字数:618 字

    阅读完需:约 2 分钟

阿里达摩院:GPT-4 的成本只有高级数据分析员的0.45%

5 月 24 日,阿里达摩院发布了一个关于用 GPT-4 取代数据分析师的成本核算的研究论文。

 

该论文指出:“除了所有数据分析师和 GPT-4 之间的可比绩效外,我们可以注意到 GPT-4 所花费的时间要比人类数据分析师短得多。我们假设每个月有大约 21 个工作日,每天工作 8 小时左右,并根据每个级别的数据分析师所花费的平均时间计算出每个实例在美元方面的成本。GPT4 的成本约为初级数据分析员成本的 0.71%和高级数据分析员成本的 0.45%。”

 


这篇来自阿里达摩院与新加坡南洋理工大学的新论文,主要探讨了 GPT-4 能否做好数据分析师的工作,论文标题为“Is GPT-4 a Good Data Analyst?”

 

该论文重点考察了 GPT-4 作为数据分析师的以下几种能力:

 

  • 生成 SQL 和 Python 代码;

  • 执行代码获得数据和图表;

  • 从数据和外部知识源中分析数据,得出结论。

 

在 5.3 节“主要结果”中,该论文指出,GPT-4 的表现,在大多数指标上能与一位金融行业工作 6 年的人类相当,正确性低于人类,但复杂性和一致性指标高于人类。在与另一位 5 年工作经验的分析师对比中,GPT-4 在信息的正确性、图表的美观性、洞察的复杂性等方面输给人类。如果与 2 年工作经验的初级分析师对比,GPT-4 在正确性上表现更好,而且能完成更多的工作。

 

虽然在高级数据分析任务中,GPT-4 目前的准确性低于人类,但是胜在成本便宜。

 


也就是说,根据实验结果和分析,GPT-4 在数据分析上有与人类相当的性能,但是否可以取代数据分析师需要近一步研究才能得出结论。

 

论文地址:

https://arxiv.org/abs/2305.15038

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-05-28 22:434726

评论 1 条评论

发布
用户头像
2023-05-30 11:13 · 北京
回复
没有更多了
发现更多内容

聊聊Go里面的闭包

秦怀杂货店

Go 函数式编程 闭包

三次握手与四次挥的问题,怎么回答?

loveX001

JavaScript

2022我的前端面试总结

loveX001

JavaScript

2022-11-20:小团生日收到妈妈送的两个一模一样的数列作为礼物! 他很开心的把玩,不过不小心没拿稳将数列摔坏了! 现在他手上的两个数列分别为A和B,长度分别为n和m。 小团很想再次让这两个数列变

福大大架构师每日一题

算法 rust 福大大

CleanMyMac2023注册机mac系统清理工具

茶色酒

CleanMyMacX CleanMyMac X

vivo霍金实验平台设计与实践-平台产品系列02

vivo互联网技术

A/B 测试 平台化 AB实验

RESTful API类渗透测试的特点

阿泽🧸

RESTful API 11月月更

【web 开发基础】PHP 的函数工作原理 (28)

迷彩

函数 web开发基础 11月月更 结构化编程 函数的工作原理

6个tips缓解第三方访问风险

SEAL安全

安全 访问权限 第三方访问

kitti数据集在3D目标检测中的入门

Studying_swz

3D点云 11月月更

一键开启云原生网络安全新视界

京东科技开发者

云原生 网络安全 软件架构 应用结构

聊聊hashmap

急需上岸的小谢

11月月更

iMazing2022免费试用版ios设备管理器

茶色酒

imazing imazing2023

AST 初探深浅,代码还能这样玩?!

蔡农曰

前端 后端 代码

【愚公系列】2022年11月 微信小程序-场景值

愚公搬代码

11月月更

阿里云无影研发负责人任晋奎:端云技术创新,打造全新用户体验

云布道师

云栖大会 无影云电脑

聊聊ThreadLocal

急需上岸的小谢

11月月更

部署代码质量检测服务 sonarqube,基于命令、shell 脚本和 pipline 实现代码质量检测

忙着长大#

jenkins

极客时间运维进阶训练营第四周作业

chenmin

其实你的下班时间,被 Excel 预定了

叶小鍵

主成分分析PCA与奇异值分解SVD-PCA对手写数据集的降维 & 用PCA做噪音过滤

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

支持向量机-支持向量机分类器原理

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

Dockerfile 常用命令

蜗牛也是牛

极客时间运维进阶训练营第四周作业

老曹

从URL输入到页面展现到底发生什么?

loveX001

JavaScript

100万行Spring源代码,鬼知道面试都会问啥

博文视点Broadview

Docker部署flink备忘

程序员欣宸

Docker flink 11月月更

计算机网络:PPP协议与HDLC协议

timerring

计算机网络 11月月更

一年前端面试打怪升级之路

loveX001

JavaScript

[力扣] 剑指 Offer 第四天 - 0~n-1中缺失的数字

陈明勇

Go 数据结构与算法 力扣 11月月更

SpringCloud相关组件

急需上岸的小谢

11月月更

阿里达摩院:GPT-4 的成本只有高级数据分析员的0.45%_语言 & 开发_Tina_InfoQ精选文章