R 语言实战 (2nd ed)(13):R 语言介绍 1.9&2

阅读数:19 2019 年 11 月 13 日 15:30

R语言实战(2nd ed)(13):R语言介绍 1.9&2

内容简介
本书注重实用性,是一本全面而细致的 R 指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近 200 页内容,介绍数据挖掘、预测性分析和编程。
本书适合数据分析人员及 R 用户学习参考。

(小结)

本章中,我们了解了 R 的一些优点,正是这些优点吸引了学生、研究者、统计学家以及数据分析师等希望理解数据所具有意义的人。我们从程序的安装出发,讨论了如何通过下载附加包来增强 R 的功能。探索了 R 的基本界面,以交互和批处理两种方式运行了 R 程序,并绘制了一些示例图形。还学习了如何将工作保存到文本和图形文件中。由于 R 的复杂性,我们花了一些时间来了解如何访问大量现成可用的帮助文档。希望你对这个免费软件的强大之处有了一个总体的感觉。

既然已经能够正常运行 R,那么是时候把玩你自己的数据了。在下一章中,我们将着眼于 R 能够处理的各种数据类型,以及如何从文本文件、其他程序和数据库管理系统中导入数据。

本章内容

  • 探索 R 中的数据结构
  • 输入数据
  • 导入数据
  • 标注数据

按照个人要求的格式来创建含有研究信息的数据集,这是任何数据分析的第一步。在 R 中,这个任务包括以下两步:

  • 选择一种数据结构来存储数据;
  • 将数据输入或导入到这个数据结构中。

本章的第一部分(2.1~2.2 节)叙述了 R 中用于存储数据的多种结构。其中,2.2 节描述了向量、因子、矩阵、数据框以及列表的用法。熟悉这些数据结构(以及访问其中元素的表述方法)将十分有助于了解 R 的工作方式,因此你可能需要耐心消化这一节的内容。

本章的第二部分(2.3 节)涵盖了多种向 R 中导入数据的可行方法。可以手工输入数据,亦可从外部源导入数据。数据源可为文本文件、电子表格、统计软件和各类数据库管理系统。举例来说,我在工作中使用的数据往往来自于 SQL 数据库。偶尔,我也会接受从 DOS 时代遗留下的数据,或是从现有的 SAS 和 SPSS 中导出的数据。通常,你仅仅需要本节中描述的一两种方法,因此根据需求有选择地阅读即可。

创建数据集后,往往需要对它进行标注,也就是为变量和变量代码添加描述性的标签。本章的第三部分(2.4 节)将讨论数据集的标注问题,并介绍一些处理数据集的实用函数(2.5 节)。下面我们从基本知识讲起。

评论

发布