R中去除为NA的行--转载】的更多相关文章

下面用实例来说明这两个函数的作用: 这是一个数据框final: gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5 ENSG00000207431 0 NA NA NA NA 6 ENSG00000221312 0 1 2 3 2 如果要去除有…
R中使用complete.cases 和 na.omit来去掉包含NA的行 现在有个一data.frame  datafile如下所示 Date        sulfate nitrate ID 1 2015-1-1 NA NA  1 2 2015-1-2  2 6  1 3 2015-1-3  NA 3  1 4 2015-1-4  4 NA  1 5 2015-1-5  NA NA  NA 6 2015-1-6  5 7  1 去掉所有包含NA的行, datafile[complete.c…
目录 1. 去掉指定列中包含NA/Inf/NaN的行 2. 去掉指定列中包含其他乱七八糟字符串的行 3. 去掉整个数据框中包含非数值的行 只包含NA.NaN和Inf的情况 针对其他字符情况 4. 总结下推荐用法 这个需求还是很常见的,因为我们在处理数据的时候无法全面考虑到数据框中含有哪些类型的数据,比如含有NA.NaN或Inf,甚至是一些乱七八糟的字符串.这时不论做统计分析还是作图,都会带来意想不到的错误.为防止这种现象发生,有必要在分析数据前将这些含有特殊字符的行去掉. 1. 去掉指定列中包含…
转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 data.frame:数据框 c:连接为向量或列表 √length:求长度subset:求子集  √seq,from:to,sequence:等差序列   √rep:重复  NA:缺失值 NULL:空对象 sort,order,unique,rev:排序  unlist:展平列表  attr,att…
https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Hadley的每个包都很好用,尤其是CRAN - Package plyr(他写的包中,这个接触得比较晚,所以感觉更加相见恨晚).其他作者的包有: CRAN - Package xkcd 把你的图绘制成xkcd http://xkcd.com风格 CRAN - Package magrittr 向前管道操…
下面列出了可用于数据挖掘的R包和函数的集合.其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来. 1.聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclust, agnes, diana 基于模型的方法: mclust 基于密度的方法: dbscan 基于画图的方法: plotcluster, plot.hclust 基于验证的…
只要数据框中含有NA的行都去掉 final[complete.cases(final),] na.omit(final) 过滤某几列 final[complete.cases(final[,5:6]),]…
用ggplot2的geom_density_2d时,总是不能填充图案,并报错: Warning message: In validDetails.polygon(x) : 强制改变过程中产生了NA 解决方案: 运行脚本:options(stringsAsFactors = TRUE) 药到病除!…
简介 Stringr中包含3个主要的函数族 字符操作 空格处理 模式匹配 常用函数 在平常的数据分析工作中,经常要用到如下的函数 函数 操作 str_length() 获取字符串长度 str_sub() 截取字符串 str_dup() 复制字符串 str_pad() 空格填充 str_trunc() 截取字符串 str_trim() 去除空格 str_split(str, "[:,]") 拆分 str_c() str_c() 拼接 str_detect() 检测模式是否存在 str_s…
统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数.比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm.下面我们列出各分布后缀,前面加前缀d.p.q或r就构成函数名:norm:正态,t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均匀,exp:指数,wei…