NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

云时代,编程语言选 R 还是 Python?

  • 2021-06-07
  • 本文字数:2080 字

    阅读完需:约 7 分钟

云时代,编程语言选R还是Python?

本文最初发布于 analyticsvidhya.com 网站,经原作者授权由 InfoQ 中文站翻译并分享。


人类都需要氧气才能生存。但请想一想,我们有几个人为了保护这种生命之源而采取措施来守护自然呢?如今,大自然用一种看不见的病毒 Covid-19 让全世界都意识到了氧气的重要性,因为这种病毒大幅增加了全球医疗领域对氧气的需求。因此,保护​​自然的行为(例如种植树苗等)是我们的宝贵责任,这不仅是为了社会,也是为了我们自己。



就像拯救生命的氧气一样,在技术领域中拯救行业的资产是数据。全球范围内生成的数据量每天都高速增长。科技行业对从数据中获取和挖掘有价值的,有助于业务增长的见解表现出了极大的兴趣。众所周知,数据集中的数据量往往很大。因此,我们不可能像以前那么快地手动处理如此大量的数据,迅速从中获取有价值的见解。因此,行业专家需要新的技术工具来处理这些数据。在数百种技术工具中,R 和 Python 这两项技术一直在云世界中针锋相对。


在本文中,我们将从数据科学的角度讨论这两种编程语言在处理数据方面的利弊。

R vs Python:为什么会引起争议?


总体而言,从初学者到专业级别,Python 和 R 都是数据科学学习者最喜欢的编程语言。两种编程语言有诸多相似之处,都有着很好的表现。


  • 两者都是在 1990 年代初期创建的

  • 由于它们是开源编程语言,因此任何人都可以轻松免费下载和访问它们

  • 它们具有大量的库和专用算法函数,可以处理和解决数据科学和数据分析问题

  • 与 SAS、SPSS、MATLAB 等其他数据分析工具一样,它们在成本和解决复杂问题方面都不会给用户施加限制

  • 两者都提供了对用户友好的工作体验,即使非程序员也很容易理解和掌握

  • 在处理数据科学、机器学习、深度学习、人工智能等领域的问题时,两种工具都时常引入很多新的发明和改进


也就是说,看起来这两种工具不分伯仲,这就是 R 与 Python 引起争议的原因所在。我们再来简单了解一番,更好地理解这一点。

Python 和 R 简介

Python

Python 于 1991 年首次发布,最初由 Guido van Rossum 设计。由于它是一种面向对象的编程语言,因此也称为通用编程语言。它秉承一种强调代码可读性和效率的理念。



如果程序员和技术领域的人们希望将数学和统计知识很好地应用在数据科学领域,那么 python 会是他们的最佳合作伙伴。因此,对于大多数数据科学学习者而言,这是最可取和最受欢迎的编程语言选项。


它有很多专用于机器学习和深度学习的库,这些库都包含在它的库包索引 PyPI 中。这些库的文档也可以在其官方站点上以 Python 文档格式获取。

R

Ross Ihaka 和 Robert Gentleman 是 R 的最初创建者。R 最初于 1993 年发布,是 S 编程语言的一种实现。这种编程语言设计宗旨是在数据分析、统计方法和可视化领域输出有效的结果。



对于数据分析技术来说,R 有着非常富饶的生态。与 python 类似,它在 Composite R Archive Network(CRAN)中有大约 13000 个专门用于深度分析的库包。


它在学者和研究人员中最受欢迎。使用 R 语言中开发的大多数知名项目数都是研究类型的。人们通常使用 R 自己的,称为 R Studio 的集成开发环境(IDE)中使用 R,以获得更好的用户友好体验。

哪款工具更好呢?

人们选择某种编程语言的原因对于 Python 和 R 来说也都是适用的。因此在这两者之间做出选择时需要更为谨慎。在 R 和 Python 中挑选适合自己的选项时,请考虑你所在领域的性质和自己偏好的风格。



如果你的工作性质涉及更多的一般用途代码且研究范围较小,则应该首选 Python;如果你的工作目的涉及研究和概念过程,则应选择 R。Python 是适合程序员的语言,而 R 是适合学者和研究人员的语言。


一切都取决于你的兴趣和背后的热情。一方面来说,python 代码易于理解,并且通常能够执行更多的数据科学任务;另一方面,R 代码使用基本的学术语言,易于学习,并且是可视化数据分析工具的最佳选项。

关键区别




该用哪个?

具体用哪个取决于用户的需求。就 python 而言,它是满足机器学习、深度学习、数据科学和部署需求的最佳工具。它也有用于数学、统计、时间序列等用途的库,但是在商业分析、经济指标、研究类需求方面往往表现不佳。它是生产就绪的语言,因为它可以把我们所有的工作流集成为一个单独的工具。



至于 R,它是满足统计分析和研究需求的最佳工具,具有更高的准确度。这种编程语言中的大多数软件包都是由学者和研究人员创建的,这是额外的优势。因此,它更适合满足统计学家的需求,而非来自计算机背景的用户的需求。不过它也拥有用于数据科学和机器学习的一些很出色的库。毫无疑问,它在探索性数据分析和可视化方面比 python 高出一等。

结论


总体而言,两种编程语言都有类似的优缺点。综合看来,在 Python 和 R 之间做出选择主要基于以下几点:


  • 你的工作主题是什么?

  • 你同事的编程知识如何?

  • 你的工期有多长?

  • 最后是你对哪个领域感兴趣?

作者的话:


Shankar DK(数据科学专业学生):


尊敬的读者,从本文中,我希望你至少应该了解一些如何根据需要在 Python 和 R 之间做出选择的知识。有关进一步的说明和建议,请在 LinkedIn(https://www.linkedin.com/in/shankar-d-k-03470b1a2)上联系我。我请你分享对本文的宝贵意见,这会对我今后的工作有所助益。


原文链接:


https://www.analyticsvidhya.com/blog/2021/05/r-or-python-reasons-behind-this-cloud-war/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-06-07 11:155167
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.1 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

TCP 三次握手,给我长脸了噢

程序员小富

TCP

李彦宏文心一言发布会 highlight

B Impact

如何让人形机器人“行稳致远”?这篇顶级期刊的论文提出了新方法

优必选科技

机器人

复旦邱锡鹏:深度剖析 ChatGPT 类大语言模型的关键技术

NLP资深玩家

人工智能 ChatGPT

《2022年IT行业项目管理调查报告》重磅发布!

禅道项目管理

易观:正视GPT-4功能缺陷与能力局限可更好探索大模型应用

易观分析

科技

无需二次开发,SOAP-to-REST 简化企业用户的业务迁移和整合

API7.ai 技术团队

干货 | BitSail Connector开发详解系列一:Source

字节跳动数据平台

开源 数据集成 数据引擎 企业号 3 月 PK 榜

全球运营商的新共识:2025走向自智网络L4

脑极体

自智网络

为什么 APISIX Ingress 是比 Emissary-ingress 更好的选择?

API7.ai 技术团队

【Docker】MacOs安装

Aldeo

Docker 云原生

百度版ChatGPT:文心一言发布会盛大召开!

雪奈椰子

让 API 管理效率更进一步的 API7 DevPortal

API7.ai 技术团队

api 网关 API7

专业HTML文本编辑器:BBEdit 激活版

真大的脸盆

Mac Mac 软件 文本编辑器 文本编辑

屡试不爽!一份阿里Java程序性能实战笔记,啃完让你程序快上200%

Java你猿哥

Java ssm 面经

软件测试/测试开发丨Docker 镜像构建可以分享的快乐

测试人

Docker 软件测试 测试开发

GPT-4炸圈--多模态大模型

江湖修行

人工智能 大模型 GPT ChatGPT GPT-4

阿里P8架构师都在卷的《23种设计模式加强版》宝典

程序知音

Java 架构 编程语言 设计模式 后端技术

字节跳动DataLeap数据血缘实践

Openlab_cosmoplat

数据 开源社区 数据血缘

两会代表热议采用ChatGPT指导论文写作:防范抄袭的探索与思考

蓝海大脑GPU

人工智能 深度学习 ChatGPT

Capital

Echo_Wish

学习 进步 笔记 资源 本质

Apache Flink X Apache Doris 构建极速易用的实时数仓架构

Apache Flink

大数据 flink 实时计算

openGemini正式加入openEuler DB SIG,携手开展全方面技术创新

华为云开源

时序数据库

最强阿里及大厂350道面试大全:框架+数据库+并发+开源+微服务

Java你猿哥

Java 数据库 架构 微服务 面经

关于文件传输协议,你不知道的事

镭速

DevData Talks 直播预告 | 微众银行的研发效能实践有哪些经验?

思码逸研发效能

研发效能 DevData Talks

你关切的Code Review三大问题,我以业务实践作答

极狐GitLab

DevOps Code Review 代码质量 代码规范 代码评审

微帧自研|客观评价模型与主观DMOS分数拟合的分享与实用性探讨

微帧Visionular

计算机视觉 视频编解码

最佳实践|焱融全闪存储实现与美的集团破千万 IOPS 性能

焱融科技

文件存储 分布式文件存储 高性能存储 全闪存储 美的

软件测试/测试开发丨学习Docker就应该掌握的dockerfile语法与指令

测试人

Docker 软件测试 测试开发

2 万字长文:声明式配置技术概述

Peefy

DevOps 编程语言 开发者工具 #Kubernetes# #开源

云时代,编程语言选R还是Python?_AI&大模型_SHANKAR DK_InfoQ精选文章