QCon上海站购票倒计时最后3天!查看精彩日程 了解详情
写点什么

云时代,编程语言选 R 还是 Python?

2021 年 6 月 07 日

云时代,编程语言选R还是Python?

本文最初发布于 analyticsvidhya.com 网站,经原作者授权由 InfoQ 中文站翻译并分享。


人类都需要氧气才能生存。但请想一想,我们有几个人为了保护这种生命之源而采取措施来守护自然呢?如今,大自然用一种看不见的病毒 Covid-19 让全世界都意识到了氧气的重要性,因为这种病毒大幅增加了全球医疗领域对氧气的需求。因此,保护​​自然的行为(例如种植树苗等)是我们的宝贵责任,这不仅是为了社会,也是为了我们自己。



就像拯救生命的氧气一样,在技术领域中拯救行业的资产是数据。全球范围内生成的数据量每天都高速增长。科技行业对从数据中获取和挖掘有价值的,有助于业务增长的见解表现出了极大的兴趣。众所周知,数据集中的数据量往往很大。因此,我们不可能像以前那么快地手动处理如此大量的数据,迅速从中获取有价值的见解。因此,行业专家需要新的技术工具来处理这些数据。在数百种技术工具中,R 和 Python 这两项技术一直在云世界中针锋相对。


在本文中,我们将从数据科学的角度讨论这两种编程语言在处理数据方面的利弊。

R vs Python:为什么会引起争议?


总体而言,从初学者到专业级别,Python 和 R 都是数据科学学习者最喜欢的编程语言。两种编程语言有诸多相似之处,都有着很好的表现。


  • 两者都是在 1990 年代初期创建的

  • 由于它们是开源编程语言,因此任何人都可以轻松免费下载和访问它们

  • 它们具有大量的库和专用算法函数,可以处理和解决数据科学和数据分析问题

  • 与 SAS、SPSS、MATLAB 等其他数据分析工具一样,它们在成本和解决复杂问题方面都不会给用户施加限制

  • 两者都提供了对用户友好的工作体验,即使非程序员也很容易理解和掌握

  • 在处理数据科学、机器学习、深度学习、人工智能等领域的问题时,两种工具都时常引入很多新的发明和改进


也就是说,看起来这两种工具不分伯仲,这就是 R 与 Python 引起争议的原因所在。我们再来简单了解一番,更好地理解这一点。

Python 和 R 简介

Python

Python 于 1991 年首次发布,最初由 Guido van Rossum 设计。由于它是一种面向对象的编程语言,因此也称为通用编程语言。它秉承一种强调代码可读性和效率的理念。



如果程序员和技术领域的人们希望将数学和统计知识很好地应用在数据科学领域,那么 python 会是他们的最佳合作伙伴。因此,对于大多数数据科学学习者而言,这是最可取和最受欢迎的编程语言选项。


它有很多专用于机器学习和深度学习的库,这些库都包含在它的库包索引 PyPI 中。这些库的文档也可以在其官方站点上以 Python 文档格式获取。

R

Ross Ihaka 和 Robert Gentleman 是 R 的最初创建者。R 最初于 1993 年发布,是 S 编程语言的一种实现。这种编程语言设计宗旨是在数据分析、统计方法和可视化领域输出有效的结果。



对于数据分析技术来说,R 有着非常富饶的生态。与 python 类似,它在 Composite R Archive Network(CRAN)中有大约 13000 个专门用于深度分析的库包。


它在学者和研究人员中最受欢迎。使用 R 语言中开发的大多数知名项目数都是研究类型的。人们通常使用 R 自己的,称为 R Studio 的集成开发环境(IDE)中使用 R,以获得更好的用户友好体验。

哪款工具更好呢?

人们选择某种编程语言的原因对于 Python 和 R 来说也都是适用的。因此在这两者之间做出选择时需要更为谨慎。在 R 和 Python 中挑选适合自己的选项时,请考虑你所在领域的性质和自己偏好的风格。



如果你的工作性质涉及更多的一般用途代码且研究范围较小,则应该首选 Python;如果你的工作目的涉及研究和概念过程,则应选择 R。Python 是适合程序员的语言,而 R 是适合学者和研究人员的语言。


一切都取决于你的兴趣和背后的热情。一方面来说,python 代码易于理解,并且通常能够执行更多的数据科学任务;另一方面,R 代码使用基本的学术语言,易于学习,并且是可视化数据分析工具的最佳选项。

关键区别




该用哪个?

具体用哪个取决于用户的需求。就 python 而言,它是满足机器学习、深度学习、数据科学和部署需求的最佳工具。它也有用于数学、统计、时间序列等用途的库,但是在商业分析、经济指标、研究类需求方面往往表现不佳。它是生产就绪的语言,因为它可以把我们所有的工作流集成为一个单独的工具。



至于 R,它是满足统计分析和研究需求的最佳工具,具有更高的准确度。这种编程语言中的大多数软件包都是由学者和研究人员创建的,这是额外的优势。因此,它更适合满足统计学家的需求,而非来自计算机背景的用户的需求。不过它也拥有用于数据科学和机器学习的一些很出色的库。毫无疑问,它在探索性数据分析和可视化方面比 python 高出一等。

结论


总体而言,两种编程语言都有类似的优缺点。综合看来,在 Python 和 R 之间做出选择主要基于以下几点:


  • 你的工作主题是什么?

  • 你同事的编程知识如何?

  • 你的工期有多长?

  • 最后是你对哪个领域感兴趣?

作者的话:


Shankar DK(数据科学专业学生):


尊敬的读者,从本文中,我希望你至少应该了解一些如何根据需要在 Python 和 R 之间做出选择的知识。有关进一步的说明和建议,请在 LinkedIn(https://www.linkedin.com/in/shankar-d-k-03470b1a2)上联系我。我请你分享对本文的宝贵意见,这会对我今后的工作有所助益。


原文链接:


https://www.analyticsvidhya.com/blog/2021/05/r-or-python-reasons-behind-this-cloud-war/

2021 年 6 月 07 日 11:153437
用户头像
刘燕 InfoQ记者

发布了 693 篇内容, 共 222.7 次阅读, 收获喜欢 1335 次。

关注

评论

发布
暂无评论
发现更多内容

观《掌控习惯》笔记

尧二水丶

习惯养成 书籍推荐 书单 书籍 4月日更

并发的HashMap为什么会引起死循环?

Java小咖秀

hashmap 并发 并发容器

文字识别:关键信息提取的3种探索方法

华为云开发者社区

深度学习 文字识别 图结构 关键信息提取 栅格

关于Go语言,你不得不知的并发模式!

博文视点Broadview

区块链BaaS服务平台开发,助推中小企业快速落地

13828808769

区块链+ #区块链#

“区块链新基建”可否发展可信平台?

电微13828808271

区块链+ 区块链新基建

什么是你上大学才知道的事情?

🌍

4月日更

Angular,AngularJS 和 react

HoneyMoose

面试官问:能聊聊你对充血模型和贫血模型的理解吗?

面试官问

领域驱动设计 DDD 充血模型 贫血模型

构建基于Spring Cloud向Service Mesh框架迁移的解决方案及思路

xcbeyond

架构 云原生 Service Mesh 解决方案 引航计划

释放千行百业数据价值,华为云DAYU有一套

华为云开发者社区

大数据 数据湖 华为云 数据价值 dayu

Linux scp 命令

一个大红包

4月日更

趁早

小天同学

个人感悟 成功 4月日更 恋爱 趁早

“区块链+”司法合约,电子认证不造假

电微13828808271

区块链+

构建从目标到研发过程的全生命周期管理体验

PingCode

敏捷开发 研发管理 Jira Atlassian 敏捷开发管理 研发工具

函数

奈奈奈奈

我用Rocket-API实现了开放平台

棒锤🐮

maven中心仓库OSSRH使用简介

程序那些事

Java maven 程序那些事

世界五百强第一的沃尔玛在用区块链做什么

CECBC区块链专委会

区块链

7.1 Go语言从入门到精通:Cobra介绍

xcbeyond

Go cobra 4月日更

强化区块链应用 破解知识产权运营难题

CECBC区块链专委会

区块链

区块链给普通人带来的机会!

CECBC区块链专委会

区块链

传统金融体系vs新金融体系,区块链改变了什么?

CECBC区块链专委会

金融

如何只用一个小时定制一个行业AI 模型?

华为云开发者社区

自然语言处理 华为云 hdc ModelArts Pro AI 模型

「开源免费」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之序列号自定义组件(四)

crudapi

Vue crud crudapi 序列号 quasar

如何在 GitHub 上选择合适的开源工具和项目

耳东@Erdong

GitHub 4月日更

从金融到物联网 区块链的落地应用将如何改变世界?

CECBC区块链专委会

区块链

SumSwap与金色财经共为 首席创新合作大会在上海拉开帷幕

币圈资讯

「编程概念」融合理解函数式和面向对象

顿晓

面向对象 4月日更 函数式 融合

基于树莓派和OpenVINO的边缘计算

IT蜗壳-Tango

IT蜗壳教学 4月日更

Rust从0到1-结构体-方法

rust 方法 struct 结构体 method

云时代,编程语言选R还是Python?-InfoQ