R 语言实战 (2nd ed)(31):创建数据集 2.3.12&2.4

阅读数:10 2019 年 11 月 16 日 20:39

R语言实战(2nd ed)(31):创建数据集 2.3.12&2.4

内容简介
本书注重实用性,是一本全面而细致的 R 指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近 200 页内容,介绍数据挖掘、预测性分析和编程。
本书适合数据分析人员及 R 用户学习参考。

(通过 Stat/Transfer 导入数据)

在我们结束数据导入的讨论之前,值得提到一款能让上述任务的难度显著降低的商业软件。Stat/Transfer( www.stattransfer.com )是一款可在 34 种数据格式之间作转换的独立应用程序,其中包括 R 中的数据格式(见图 2-4)。

R语言实战(2nd ed)(31):创建数据集 2.3.12&2.4

图 2-4 Windows 上 Stat/Transfer 的主对话框

此软件拥有 Windows、Mac 和 Unix 版本,并且支持我们目前讨论过的各种统计软件的最新版本,也可通过 ODBC 访问如 Oracle、Sybase、Informix 和 DB/2 一类的数据库管理系统。

(数据集的标注)

为了使结果更易解读,数据分析人员通常会对数据集进行标注。这种标注包括为变量名添加描述性的标签,以及为类别型变量中的编码添加值标签。例如,对于变量age,你可能想附加一个描述更详细的标签“Age at hospitalization (in years)”(入院年龄)。对于编码为 1 或 2 的性别变量gender,你可能想将其关联到标签“male”和“female”上。

评论

发布