R语言学习——数据合并及绘制密度分布曲线图
setwd("E:/08_cooperation/07_X-lab/06-Crosstalk/Aadapter_primer")
# 读取lane01.txt,并对其按列进行相加处理,然后对列进行进行命名
d1=read.table("lane01.txt",header = FALSE,sep = ",")
cyc001=d1$V3+d1$V4+d1$V5+d1$V6
d1=cbind(d1,cyc001)
names(d1)=c("cyc001x","cyc001y","cyc001A","cyc001T","cyc001C","cyc001G","cyc001")
# 读取lane06.txt,并对其按列进行相加处理,然后对列进行进行命名
d2=read.table("lane06.txt",header = FALSE,sep = ",")
cyc001=d2$V3+d2$V4+d2$V5+d2$V6
d2=cbind(d2,cyc001)
names(d2)=c("cyc001x","cyc001y","cyc001A","cyc001T","cyc001C","cyc001G","cyc001")
head(d1)
cyc001x cyc001y cyc001A cyc001C cyc001G cyc001T cyc001
1 29.20 2.94 798 697 831 1322 3648
2 83.36 3.51 1379 575 455 3185 5594
3 121.10 2.82 1049 377 371 4249 6046
4 150.12 2.42 1093 1317 1275 1157 4842
5 159.20 3.58 1124 993 428 5124 7669
6 194.29 2.63 1178 1007 372 1328 3885
head(d2)
cyc001x cyc001y cyc001A cyc001C cyc001G cyc001T cyc001
1 37.57 3.14 2374 6680 1337 1501 11892
2 108.90 3.11 3469 3720 528 5688 13405
3 270.51 4.34 6710 1868 1039 4087 13704
4 136.98 4.11 1753 11892 873 1656 16174
5 142.14 3.93 1677 2732 1366 3399 9174
6 234.00 4.00 1657 7318 727 1524 11226
#载入plyr包
library(plyr)
listA<-list()
listA[[1]] <- data.frame(t(d1$cyc001A))
listA[[2]] <- data.frame(t(d2$cyc001A))
A<-t(rbind.fill(listA))
colnames(A)<-c("lane01_A","lane06_A")
write.table(A,file="intsfile_A.txt")
listT<-list()
listT[[1]]<-data.frame(t(d1$cyc001T))
listT[[2]]<-data.frame(t(d2$cyc001T))
T<-t(rbind.fill(listT))
colnames(T)<-c("lane01_T","lane06_T")
write.table(T,file="intsfile_T.txt")
listC <- list()
listC[[1]] <- data.frame(t(d1$cyc001C))
listC[[2]] <- data.frame(t(d2$cyc001C))
C<- t(rbind.fill(listC))
colnames(C) <-c("lane01_C","lane06_C")
write.table(C,file="intsfile_C.txt")
listG <- list()
listG[[1]] <- data.frame(t(d1$cyc001G))
listG[[2]] <- data.frame(t(d2$cyc001G))
G<- t(rbind.fill(listG))
colnames(G) <-c("lane01_G","lane06_G")
write.table(G,file="intsfile_G.txt")
listCyc <- list()
listCyc[[1]] <- data.frame(t(d1$cyc001))
listCyc[[2]] <- data.frame(t(d2$cyc001))
ATCG<- t(rbind.fill(listCyc))
colnames(ATCG) <-c("lane01","lane06")
write.table(ATCG,file="intsfile_ATCG.txt")
list.files()
[1] "201811271857_lane06_8mix_10A_100B2" "201904171659_B028___Lane01_03_05"
[3] "intsfile_A.txt" "intsfile_ATCG.txt"
[5] "intsfile_C.txt" "intsfile_G.txt"
[7] "intsfile_T.txt" "lane01.txt"
[9] "lane06.txt"
library(wordcloud2)
library(gcookbook)
library(ggplot2)
library(reshape2)
data=read.table("intsfile_ATCG.txt",header = T)
data1=melt(data,variable.name="lane",value.name="ints")
ggplot(data1,aes(x=ints,colour=lane))+geom_density(adjust=1)+ggtitle("A Adapter VS A Primer(Base_A)")+theme(plot.title=element_text(size=rel(1.2),hjust = 0.5,family="Times"))+scale_x_continuous(limits = c(0,60000),breaks = c(0,5000,10000,15000,20000,30000,40000,50000,60000))+scale_y_continuous("desity(%)",limits = c(0,0.0003),breaks = c(0.00000,0.00005,0.00010,0.00015,0.00020,0.00030),labels = c(0.00000,0.00005,0.00010,0.00015,0.00020,0.00030)*100)
R语言学习——数据合并及绘制密度分布曲线图的更多相关文章
- R语言学习——数据框
> #数据框可以包含不同模式(数值型.字符型.逻辑型等)的数据,是R中最常处理的数据结构.数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,c ...
- R语言学习 第四篇:函数和流程控制
变量用于临时存储数据,而函数用于操作数据,实现代码的重复使用.在R中,函数只是另一种数据类型的变量,可以被分配,操作,甚至把函数作为参数传递给其他函数.分支控制和循环控制,和通用编程语言的风格很相似, ...
- R语言进行数据预处理wranging
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with R packages:tidyr dplyr Ground rules ...
- R语言学习笔记(一)
1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的 ...
- R语言学习——根据信息熵建决策树KD3
R语言代码 决策树的构建 rm(list=ls()) setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验3-决策树分类") #s ...
- R语言进行数据预处理
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with Rpackages:tidyr dplyr Ground rules l ...
- R语言学习笔记1——R语言中的基本对象
R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心 ...
- R语言 我要如何开始R语言_数据分析师
R语言 我要如何开始R语言_数据分析师 我要如何开始R语言? 很多时候,我们的老板跟我们说,这个东西你用R语言去算吧,Oh,My god!什么是R语言?我要怎么开始呢? 其实回答这个问题很简单,首先, ...
- 用R语言提取数据框中日期对应年份(列表转矩阵)
用R语言提取数据框中日期对应年份(列表转矩阵) 在数据处理中常会遇到要对数据框中的时间做聚类处理,如从"%m/%d/%Y"中提取年份. 对应操作为:拆分成列表——列表转矩阵——利用 ...
随机推荐
- 群晖NAS再折腾
端口转发 两年前我买了一台双盘位的群晖NAS,配置两个4T的硬盘,这玩意儿一度改变了我使用电脑的模式,真是爽爆了!最最主要的功能就是我能用它规整我所有的资料,并且不管何时何地,只要有网就能访问.为了能 ...
- MQTT 单个订阅消息量过大处理
The missing piece between MQTT and a SQL database in a M2M landscape Message Queue Telemetry Transpo ...
- 如何开发使用自定义文件的OEM应用程序
有关创建和使用自定义数据文件的详细信息,请参阅DISM应用程序包(.appx或.appxbundle)服务命令行选项. 了解如何开发使用自定义文件的应用程序,将信息从OEM传递到应用程序. 对于您为O ...
- [Inside HotSpot] Java的方法调用
1. 方法调用模块入口 Java所有的方法调用都会经过JavaCalls模块.该模块又细分为call_virtual调用虚函数,call_static调用静态函数等.虚函数调用会根据对象类型进行方法决 ...
- Hadoop系列009-NameNode工作机制
本人微信公众号,欢迎扫码关注! NameNode工作机制 1 NameNode & SecondaryNameNode工作机制 1.1 第一阶段:namenode启动 1)第一次启动namen ...
- 【Keras篇】---利用keras改写VGG16经典模型在手写数字识别体中的应用
一.前述 VGG16是由16层神经网络构成的经典模型,包括多层卷积,多层全连接层,一般我们改写的时候卷积层基本不动,全连接层从后面几层依次向前改写,因为先改参数较小的. 二.具体 1.因为本文中代码需 ...
- Entity Framework 之存储过程篇
最近几天在搞CRUD,使用的是EF这个ORM,最近的项目中上了存储过程,就把在开发中的经验分享出来!我们先创建一个最基本的存储过程,脚本如下,这是一个不带参数的存储过程,我们从最简单的往上走! cre ...
- Linux自定义分隔符IFS引发的文本处理问题
需求是检查指定应用的某些配置所以就写了个脚本,数据文件的内容是这样的:应用名称|IP|端口 多个IP用空格,这样可以生成数组.这个文件的数据是通过部署平台的API获取后自己组装的. #!/bin ...
- SLAM+语音机器人DIY系列:(四)差分底盘设计——6.底盘里程计标
摘要 运动底盘是移动机器人的重要组成部分,不像激光雷达.IMU.麦克风.音响.摄像头这些通用部件可以直接买到,很难买到通用的底盘.一方面是因为底盘的尺寸结构和参数是要与具体机器人匹配的:另一方面是因为 ...
- Java设计模式系列-装饰器模式
原创文章,转载请标注出处:<Java设计模式系列-装饰器模式> 一.概述 装饰器模式作用是针对目标方法进行增强,提供新的功能或者额外的功能. 不同于适配器模式和桥接模式,装饰器模式涉及的是 ...