R 语言实战 (2nd ed)(11):R 语言介绍 1.6

阅读数:18 2019 年 11 月 13 日 15:30

R语言实战(2nd ed)(11):R语言介绍 1.6

内容简介
本书注重实用性,是一本全面而细致的 R 指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近 200 页内容,介绍数据挖掘、预测性分析和编程。
本书适合数据分析人员及 R 用户学习参考。

(将输出用为输入:结果的重用)

R 的一个非常实用的特点是,分析的输出结果可轻松保存,并作为进一步分析的输入使用。让我们通过一个 R 中已经预先安装好的数据集作为示例阐明这一点。如果你无法理解这里涉及的统计知识,也别担心,我们在这里关注的只是一般原理。

首先,利用汽车数据mtcars执行一次简单线性回归,通过车身重量(wt)预测每加仑行驶的英里数(mpg)。可以通过以下语句实现:

复制代码
lm(mpg~wt, data=mtcars)

结果将显示在屏幕上,不会保存任何信息。

下一步,执行回归,区别是在一个对象中保存结果:

复制代码
lmfit <- lm(mpg~wt, data=mtcars)

以上赋值语句创建了一个名为lmfit的列表对象,其中包含了分析的大量信息(包括预测值、残差、回归系数等)。虽然屏幕上没有显示任何输出,但分析结果可在稍后被显示和继续使用。

键入summary(lmfit)将显示分析结果的统计概要,plot(lmfit)将生成回归诊断图形,而语句cook<-cooks.distance(lmfit)将计算和保存影响度量统计量1plot(cook)对其绘图。要在新的车身重量数据上对每加仑行驶的英里数进行预测,不妨使用predict(lmfit, mynewdata)

1 这里使用了 Cook 距离作为度量影响的统计量,详见第 8 章。——译者注

要了解某个函数的返回值,查阅这个函数在线帮助文档中的“Value”部分即可。本例中应当查阅help(lm)?lm中的对应部分。这样就可以知道将某个函数的结果赋值到一个对象时,保存下来的结果具体是什么。

评论

发布