• 数据格式如下
gene_id Sham-1 Sham-2 Sham-3 Sham-4 Sham-5 Rep-1h-1 Rep-1h-2 Rep-1h-3 Rep-1h-4 Rep-1h-5 Rep-3h-1 Rep-3h-2 Rep-3h-3 Rep-3h-4 Rep-3h-5 Rep-6h-1 Rep-6h-2 Rep-6h-3 Rep-6h-4 Rep-6h-5 Rep-12h-1 Rep-12h-2 Rep-12h-3 Rep-12h-4 Rep-12h-5 Rep-24h-1 Rep-24h-2 Rep-24h-3 Rep-24h-4 Rep-24h-5
Traf1 0.204531 0.358811 0.24649 0.270231 0.169885 0.588808 0.526418 0.87557 0.403861 1.846186 1.890555 1.041459 0.881003 1.036722 1.016675 2.09069 3.09231 1.180259 2.610673 0.888904 2.936677 1.829962 1.857749 2.93743 2.424644 1.3602 2.654057 2.121849 2.309851 2.052516
  • 代码如下:
a=read.table(file="Traf1.fpkm.lst")
c=t.data.frame(a)
gene_id=c(c[,1])
gene=as.vector(gene_id)
id=gene[2:length(gene)]
va=as.vector(c[,2])[2:length(as.vector(c[,2]))]
fpkm=round(as.numeric(va),3)
dd=data.frame(n,fpkm)
ggplot(dd,aes(x=n,y=fpkm))+
geom_bar(stat = "identity",fill ="#09BFFE",colour="grey")+
xlab("Samples")+ylab("FPKM of Traf1 in different sample")+
theme_classic()+
theme(axis.text.y=element_blank(),axis.text.x=element_text(size=8,color="black",angle = 30,face="bold",hjust = 1))+
geom_text(aes(label=dd$fpkm), position=position_stack(vjust=1.05),angle=30)+
scale_y_continuous(breaks = seq(0,3.5,0.5),limits = c(0,3.5),labels = seq(0,3.5,0.5))


使用fimo对Traf1基因进行motif的寻找

  • 下载motif数据库
wget http://meme-suite.org/meme-software/Databases/motifs/motif_databases.12.18.tgz
tar zxvf motif_databases.12.18.tgz

代码如下

ln -s /media/sda/user/chengxu/project/cardiac-IR/lncRNA_sequencing/expression_data/mRNA_symbol_FPKM_matrix.txt ./
les mRNA_symbol_FPKM_matrix.txt|perl -F"\t" -lane 'print join("\t",@F[0..5])."\t".join("\t",@F[43..67])' |head -1 >Traf1.fpkm.lst
les mRNA_symbol_FPKM_matrix.txt|perl -F"\t" -lane 'print join("\t",@F[0..5])."\t".join("\t",@F[43..67])' |grep Traf1 >>Traf1.fpkm.lst
grep Traf1 /media/sda/database/Ensembl/release-89/mus_musculus/gtf/gene.bed.txt |perl -lane '$s=$F[5]-1;$e=$F[6]-1;print qq{$F[3]\t$s\t$e\t$F[7]}' >Traf1.bed
bedtools getfasta -fi /media/sda/database/Ensembl/release-89/mus_musculus/fasta/mm10.fasta -bed Traf1.bed -fo Traf1.gene.fasta
fimo -oc Traf1 JASPAR2018_CORE_vertebrates_non-redundant.meme Traf1.gene.fasta
  • 需要注意的是bed文件时从0开始算位置的,而gtf等注释文件时从1开始算的,所以gtf转换成bed的时候要减少一个碱基的位置

  • 数据格式
aaa sss fpkm
Sham Sham-1 0.204531
Sham Sham-2 0.358811
Sham Sham-3 0.24649
Sham Sham-4 0.270231
Sham Sham-5 0.169885
Rep-1h Rep-1h-1 0.588808
Rep-1h Rep-1h-2 0.526418
Rep-1h Rep-1h-3 0.87557
Rep-1h Rep-1h-4 0.403861
Rep-1h Rep-1h-5 1.846186
Rep-3h Rep-3h-1 1.890555
Rep-3h Rep-3h-2 1.041459
Rep-3h Rep-3h-3 0.881003
Rep-3h Rep-3h-4 1.036722
Rep-3h Rep-3h-5 1.016675
Rep-6h Rep-6h-1 2.09069
Rep-6h Rep-6h-2 3.09231
Rep-6h Rep-6h-3 1.180259
Rep-6h Rep-6h-4 2.610673
Rep-6h Rep-6h-5 0.888904
Rep-12h Rep-12h-1 2.936677
Rep-12h Rep-12h-2 1.829962
Rep-12h Rep-12h-3 1.857749
Rep-12h Rep-12h-4 2.93743
Rep-12h Rep-12h-5 2.424644
Rep-24h Rep-24h-1 1.3602
Rep-24h Rep-24h-2 2.654057
Rep-24h Rep-24h-3 2.121849
Rep-24h Rep-24h-4 2.309851
Rep-24h Rep-24h-5 2.052516
  • 画图代码
dd=read.table(file = "Traf1.changeformat",header = T)
#修改箱线图的顺序
dd$aaa=factor(dd$aaa,levels=c("Sham","Rep-3h","Rep-6h","Rep-12h","Rep-24h"))
ggplot(dd, aes(x=aaa, y=fpkm, fill=aaa)) +
geom_boxplot() +
scale_fill_manual(values=c("#E41A1C","#377EB8","#4DAF4A","#984EA3","#FF7F00","#FFFF33"), name="Var2") +
labs(x="", y="FPKM of Traf1") + #去掉x轴的Var2
guides(fill = guide_legend(title="Group", keywidth=2, keyheight=2)) +
theme_bw() +
theme(panel.grid = element_blank()) +
theme(axis.title.y = element_text(size=18)) +
theme(axis.text.y = element_text(size=16, hjust=1)) +
theme(axis.text.x = element_text(colour="grey20", size=96/len, angle=30, hjust=1)) +
theme(legend.title = element_text(size=15)) +
theme(legend.text = element_text(size=15))

R画柱形图和箱线图的更多相关文章

  1. R语言绘图:箱线图

    使用ggplot2绘制箱线图 ######*****绘制箱线图代码*****####### data1$学区房 <- factor(data1$school, levels = 0:1, lab ...

  2. Matplotlib学习---用matplotlib画箱线图(boxplot)

    箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)分 ...

  3. 第六篇:R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

    数据分布图简介 中医上讲看病四诊法为:望闻问切.而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样:闻:仔细分析数据是否合理:问:针对前两步工作搜集到的问题与业务方交流:切:结合业务方 ...

  4. R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)

    箱线图 箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图.在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的好处和一个在线绘制箱线图的工具.就这样都 ...

  5. 箱线图boxplot

    箱线图boxplot--展示数据的分布 图表作用: 1.反映一组数据的分布特征,如:分布是否对称,是否存在离群点 2.对多组数据的分布特征进行比较 3.如果只有一个定量变量,很少用箱线图去看数据的分布 ...

  6. R_Studio(学生成绩)对数据缺失值md.pattern()、异常值分析(箱线图)

    我们发现这张Gary.csv表格存在学生成绩不完全的(五十三名学生,三名学生存在成绩不完整.共四个不完整成绩) 79号大学语文.高等数学 96号中国近代史纲要 65号大学体育 (1)NA表示数据集中的 ...

  7. Matplotlib数据可视化(6):饼图与箱线图

    In [1]: from matplotlib import pyplot as plt import numpy as np import matplotlib as mpl mpl.rcParam ...

  8. Matlab boxplot for Multiple Groups(多组数据的箱线图)

    在画之前首先介绍一下Matlab boxplot,下面这段说明内容来自http://www.plob.org/2012/06/10/2153.html   由于matlab具有强大的计算功能,用其统计 ...

  9. 箱线图(boxplot)简介与举例

    简述:   盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的.它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(m ...

随机推荐

  1. manjaro (arch) 安装搜狗输入法

    本文通过MetaWeblog自动发布,原文及更新链接:https://extendswind.top/posts/technical/sogou_input_install_in_arch_manja ...

  2. 第12组 团队Git现场编程实战

    分工及贡献 组内有三人去考证了,只剩下6人 组员 分工 贡献比例 王永福 前后端,爬虫,博客主体 30% 孙承恺 建模,算法设计,统筹 18% 邱畅杰 爬虫 15% 徐祖豪 前端数据可视化 13% 张 ...

  3. 关于Lombok的认识及其应用(一)

    目录 1.Lombok的介绍 2.Lombok的安装 3.Lombok实现原理分析 4.Lombok使用方法 4.1.@Data注解 4.2.@Getter/@Setter注解 1.Lombok的介绍 ...

  4. エンジニア死滅シタ世界之高層ビル [MISSION LEVEL: B]-Python3

    n = input() pre="" next_str = "" new_str = "" for i in range(int(n)): ...

  5. intellij idea tomcat 启动不生成war包

    intellij idea tomcat 启动不生成war包 想把项目打包成war包做测试,但是按照之前的方法居然没有成功导出war包,犯了很低级的错误,特此记录. (1)首先在Project Str ...

  6. 第10组 Alpha冲刺(2/6)

    链接部分 队名:女生都队 组长博客: 博客链接 作业博客:博客链接 小组内容 恩泽(组长) 过去两天完成了哪些任务 描述 了解了如何根据系统获取的实际情况进行后端任务的调整 网易云音乐推荐算法的分析 ...

  7. com.mysql.cj.jdbc.Driver 新特性jdbc.url连接供参考

    com.mysql.cj.jdbc.Driver 是 mysql-connector-java 6及以上版本中的参数详解: jdbc.url=jdbc:mysql://localhost:3306/t ...

  8. appium 多线程还是多进程(转)

    https://www.cnblogs.com/zouzou-busy/p/11440175.html 在前面我们都是使用一个机器进行测试,在做app自动化的时候,我们要测不同的机型,也就是兼容性测试 ...

  9. 深度学习面试题14:Dropout(随机失活)

    目录 卷积层的dropout 全连接层的dropout Dropout的反向传播 Dropout的反向传播举例 参考资料 在训练过程中,Dropout会让输出中的每个值以概率keep_prob变为原来 ...

  10. Sqlmap全参数详解

    sqlmap全参数详解 sqlmap是在sql注入中非常常用的一款工具,由于其开源性,适合从个人到企业,从学习到实战,各领域各阶段的应用,我们还可以将它改造成我们自己独有的渗透利器.这款工具中,大大小 ...