服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - R语言 - R语言刷题检验数据缺失类型过程详解

R语言刷题检验数据缺失类型过程详解

2022-01-20 15:55Kanny广小隶 R语言

这篇文章主要为大家介绍了R语言刷题中检验数据缺失类型的过程示例分析详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步

题目

R语言刷题检验数据缺失类型过程详解

R语言刷题检验数据缺失类型过程详解

 

解答

由于题目要求需要重复三次类似的操作,故首先载入所需要的包,构造生成数据的函数以及绘图的函数:

library(tidyr)    # 绘图所需
library(ggplot2)  # 绘图所需
# 生成数据
GenerateData <- function(a = 0, b = 0, seed = 2018) {
set.seed(seed)
z1 <- rnorm(100)
z2 <- rnorm(100)
z3 <- rnorm(100)
y1 <- 1 + z1
y2 <- 5 + 2 * z1 + z2
u <- a * (y1 - 1) + b * (y2 - 5) + z3
m2 <- 1 * (u < 0)
y2_na <- y2
y2_na[u < 0] <- NA
# y2_na[as.logical(m2)] <- NA
dat_comp <- data.frame(y1 = y1, y2 = y2)
dat_incomp <- data.frame(y1 = y1, y2 = y2_na)
dat_incomp <- na.omit(dat_incomp)
return(list(dat_comp = dat_comp, dat_incomp = dat_incomp))
}
# 展现缺失出具与未缺失数据的分布情况
PlotTwoDistribution <- function(dat) {
p1 <- dat_comp %>%
  gather(y1, y2, key = "var", value = "value") %>%
  ggplot(aes(x = value)) +
  geom_histogram(aes(fill = factor(var), y = ..density..),
                 alpha = 0.3, colour = 'black') +
  stat_density(geom = 'line', position = 'identity', size = 1.5,
               aes(colour = factor(var))) +
  facet_wrap(~ var, ncol = 2) +
  labs(y = '直方图与密度曲线', x = '值',
  theme(plot.title = element_text(hjust = 0.5)) +
  guides(color = FALSE)
p2 <- dat_incomp %>%
  gather(y1, y2, key = "var", value = "value") %>%
  ggplot(aes(x = value)) +
  geom_histogram(aes(fill = factor(var), y = ..density..),
                 alpha = 0.3, colour = 'black') +
  stat_density(geom = 'line', position = 'identity', size = 1.5,
               aes(colour = factor(var))) +
  facet_wrap(~ var, ncol = 2) +
  labs(y = '直方图与密度曲线', x = '值',
  theme(plot.title = element_text(hjust = 0.5)) +
  guides(color = FALSE)
return(list(p_comp = p1, p_incomp = p2))
}

下面考虑三种情况:

1. a = 0, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 0, b = 0)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)
# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

R语言刷题检验数据缺失类型过程详解

R语言刷题检验数据缺失类型过程详解

缺失数据与未缺失数据的分布如上图所示。可以发现,对于完整数据与缺失数据之间的 Y1​的分布与 Y2​的分布与期望相差不大。并且在采用 a=0,b=0这种构造时,从构造的公式可以看出, Y2​中样本的缺失情况与 Y1​,Y2​两者都无关(因为 Z 3 与 Y 1 , Y 2 均独立),所以这种缺失机制是:MCAR

b) 进行t检验

题设条件中说的是Y1​的均值,所以考虑完整数据与缺失数据(这里的缺失指的是若 Y2​有缺失,Y1​也会进行相应地缺失处理)

t.test(dat_comp$y1, dat_incomp$y1)

这里进行t检验(其实不是非常严谨,因为不一定满足正态假设),比较缺失与否 Y1​的均值,这里p-value = 0.8334。在显著性水平为0.05的前提下,并不能断言有缺失与无缺失两个Y1​之间的均值有差异,也就是说其实MCAR, MAR, NMAR三种情况都有可能,并不能断言哪种不可能发生。

2. a = 2, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 2, b = 0)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)
# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

R语言刷题检验数据缺失类型过程详解

R语言刷题检验数据缺失类型过程详解

缺失数据与未缺失数据的分布如上图所示。可以发现,两个数据的期望以及分布(无论 Y1​还是 Y2​),整体都有一定差异。在采用 a = 2 , b = 0 这种构造时,从构造的公式可以看出, Y2​中样本的缺失情况与 Y1​有关,所以这种缺失机制是:MAR

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

R语言刷题检验数据缺失类型过程详解

3. a = 0, b = 2

a) 生成数据并绘图展示

# 生成数据并查看数据样式
dat <- GenerateData(a = 0, b = 2)
dat_comp <- dat$dat_comp
dat_incomp <- dat$dat_incomp

head(dat_comp)
head(dat_incomp)
# 绘图展示
p <- PlotTwoDistribution(dat)
p$p_comp
p$p_incomp

R语言刷题检验数据缺失类型过程详解

R语言刷题检验数据缺失类型过程详解

缺失数据与未缺失数据的分布如上图所示。可以发现与上一种情况一样,两个数据的期望以及分布(无论 Y1​还是 Y2​),整体都有一定差异。在采用 a = 0 , b = 2 这种构造时,从构造的公式可以看出,Y2​中样本的缺失情况与 Y2​本身有关,所以这种缺失机制是:NMAR

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

R语言刷题检验数据缺失类型过程详解

以上就是R语言刷题检验数据缺失类型过程详解的详细内容,更多关于R语言检验数据缺失类型的资料请关注服务器之家其它相关文章!

原文链接:https://kanny.blog.csdn.net/article/details/82814292

延伸 · 阅读

精彩推荐
  • R语言R studio 批量注释的快捷方式

    R studio 批量注释的快捷方式

    这篇文章主要介绍了R studio 批量注释的快捷方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    JasonKQLin13342022-01-04
  • R语言R语言可视化存储矢量图实现方式

    R语言可视化存储矢量图实现方式

    这篇文章主要为大家介绍了R语言存储矢量图的实现方式过程,有需要的朋友可以借鉴参考下,希望能够有所你帮助,祝大家多多进步,早日升职加薪...

    Kanny广小隶9392022-01-20
  • R语言R语言创建矩阵的实现方法

    R语言创建矩阵的实现方法

    这篇文章主要介绍了R语言创建矩阵的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随...

    hjk_caesar9462021-12-27
  • R语言R语言-使用ifelse进行数据分组

    R语言-使用ifelse进行数据分组

    这篇文章主要介绍了R语言-使用ifelse进行数据分组,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    小力丸12042022-01-10
  • R语言聊聊R语言中Legend 函数的参数用法

    聊聊R语言中Legend 函数的参数用法

    这篇文章主要介绍了聊聊R语言中Legend 函数的参数用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    Gavin姓陈6352021-12-28
  • R语言R语言绘制散点图实例分析

    R语言绘制散点图实例分析

    在本篇文章里小编给大家整理的是一篇关于R语言绘制散点图实例分析内容,有需要的朋友们可以学习下。...

    w3cschool6942022-01-06
  • R语言R语言编程学习绘制动态图实现示例

    R语言编程学习绘制动态图实现示例

    这篇文章主要介绍了R语言编程学习绘制动态图实现示例,有需要的的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪...

    微小冷7652022-01-18
  • R语言R语言中c()函数与paste()函数的区别说明

    R语言中c()函数与paste()函数的区别说明

    这篇文章主要介绍了R语言中c()函数与paste()函数的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    yiyu_j11152022-01-12