服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - R语言 - R语言:数据筛选match的使用详解

R语言:数据筛选match的使用详解

2022-01-12 14:39刘永鑫Adam R语言

这篇文章主要介绍了R语言:数据筛选match的使用详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

数据筛选是在分析中最常用的步骤,如微生物组分析中,你的OTU表、实验设计、物种注释之间都要不断筛选,来进行数据对齐,或局部分析。

今天来详解一下此函数的用法。

match

match:匹配两个向量,返回x中存在的返回索引或TRUE、FALSE

match函数使用格式有如下两种:

第一种方便设置参数,返回x中元素在table中的位置

?
1
match(x, table, nomatch = NA_integer_, incomparables = NULL)

第二种简洁,返回x中每个元素在table中是否存在

?
1
x %in% table

参数详解

x: 向量, 要匹配的值;

table: 向量, 被匹配的值;

nomatch: 没匹配上的返回值, 必须是整数;

incomparables: 指定不能用来匹配的值.

match函数是一个完全匹配函数, 当两个元素类型不一样时, 如果进行类型转换后匹配得上的话, 则仍可匹配, 可看下例.

匹配上且返回位置

?
1
match(c(1, "TRUE"), c(T, 0, "1"))

返回3 1,即1位于表中的3号位,TRUE位于1号位,且T和TRUE可匹配成功

?
1
c(1, "TRUE", F) %in% c(T, 0, "1")

返回TRUE TRUE FALSE,表示每个元素在table中是否存在

pmatch

pmatch函数是一个部分匹配函数, 依次从x里面挑出元素, 对照table进行匹配, 若匹配上则剔除匹配上的值, 不再参与下次匹配, duplicate.ok可设置是否剔除; 对于某一个元素,

匹配一共分成三步:

1、如果可以完全匹配, 则认为匹配上了, 返回table中的位置;

2、不满足上述条件, 如果是唯一部分匹配, 则返回table中的位置;

3、不满足上述条件, 则认为没有值与其匹配上.

pmatch函数的格式

?
1
pmatch(x, table, nomatch = NA_integer_, duplicates.ok = FALSE)

x: 向量, 要匹配的值;

table: 向量, 被匹配的值;

nomatch: 没匹配上的返回值, 必须是整数;

duplicates.ok: table里面的元素是否可以适用多次.

默认不允许重复使用table中元素,返回位置1 2 3

?
1
pmatch(rep(1, 3), rep(1, 5))

允许重复,返回位置1 1 1

?
1
pmatch(rep(1, 3), rep(1, 5), duplicates.ok = TRUE)

补充:R语言实例-数据过滤

1、问题

一组数据,变量有40个,就是40列。

我要做数据筛选。

1.第一列中包含语段"a11","a12","b23"。请注意是包含,实际不存在“a11”,往往是“a1120”之类的信息

2.第二列中不包含“美国”、“日本”等信息。请注意,也是不包含,而不是不等于。

请问具体的R语言语句应该怎么写?

2、解决

假设楼主的数据为一数据框,名字为“testdat”,第一列名"a",第二列名"b",则过滤语句为:

?
1
result<-subset(testdat,grepl("a11|a12|b23",testdat$a) & !grepl("美国|日本",testdat$b))

3、注意

grep()函数返回的是匹配元素的索引,grepl()返回的是匹配或不匹配的逻辑值:

?
1
2
grep(value = FALSE) returns a vector of the indices of the elements of x that yielded a match (or not, for invert = TRUE. This will be an integer vector unless the input is a long vector
grepl returns a logical vector (match or not for each element of x).

以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。

原文链接:https://metagenome.blog.csdn.net/article/details/84927296

延伸 · 阅读

精彩推荐
  • R语言R语言-使用ifelse进行数据分组

    R语言-使用ifelse进行数据分组

    这篇文章主要介绍了R语言-使用ifelse进行数据分组,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    小力丸12042022-01-10
  • R语言R语言编程学习绘制动态图实现示例

    R语言编程学习绘制动态图实现示例

    这篇文章主要介绍了R语言编程学习绘制动态图实现示例,有需要的的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪...

    微小冷7652022-01-18
  • R语言R语言创建矩阵的实现方法

    R语言创建矩阵的实现方法

    这篇文章主要介绍了R语言创建矩阵的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随...

    hjk_caesar9462021-12-27
  • R语言R语言中c()函数与paste()函数的区别说明

    R语言中c()函数与paste()函数的区别说明

    这篇文章主要介绍了R语言中c()函数与paste()函数的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    yiyu_j11152022-01-12
  • R语言R语言可视化存储矢量图实现方式

    R语言可视化存储矢量图实现方式

    这篇文章主要为大家介绍了R语言存储矢量图的实现方式过程,有需要的朋友可以借鉴参考下,希望能够有所你帮助,祝大家多多进步,早日升职加薪...

    Kanny广小隶9392022-01-20
  • R语言R语言绘制散点图实例分析

    R语言绘制散点图实例分析

    在本篇文章里小编给大家整理的是一篇关于R语言绘制散点图实例分析内容,有需要的朋友们可以学习下。...

    w3cschool6942022-01-06
  • R语言R studio 批量注释的快捷方式

    R studio 批量注释的快捷方式

    这篇文章主要介绍了R studio 批量注释的快捷方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    JasonKQLin13342022-01-04
  • R语言聊聊R语言中Legend 函数的参数用法

    聊聊R语言中Legend 函数的参数用法

    这篇文章主要介绍了聊聊R语言中Legend 函数的参数用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    Gavin姓陈6352021-12-28