miRNA】的更多相关文章

### miRNA特点 (1)广泛存在于真核生物中, 是一组不编码蛋白质的短序列RNA,它本身不具有开放阅读框架(ORF),并且由不同于mRNA的独立转录单位表达. (2)通常的长度为20-24 nt,但在3′端可以有1-2 个碱基的长度变化(对miRNA 的具体长度范围尚无统一标准). (3)成熟的miRNA , 5′端有磷酸基团, 3′端为羟基,且具有独特的序列特征.它们可以和上游或下游的序列不完全配对形成茎环结构. (4)miRNA5′端第一个碱基对U有强烈的倾向性,而对G却有抗性,但第2…
相比动物miRNA 而言, 植物miRNA 的研究相对较少. 植物miRNA 相比动物miRNA , 有以下特点: 1) 植物miRNA 的长度为 21 nt 左右, 动物miRNA 长度在 22 ~ 23 nt; 2)   植物 miRNA 与 靶标转录本几乎完全互补配对,而动物 miRNA 不是: 3) 植物 miRNA 结合的区域可以位于任何区域,而动物 miRNA 主要在3‘ UTR 区结合: 植物miRNA 的形成过程: pri-miRNA          =>          …
背景: miRNA通过和mRNA的3'UTR区结合,导致mRNA讲解或者抑制mRNA翻译,从而实现转录后调控的作用: 如果在miRNA和 mRNA的结合区域,发生了snp,就可能会影响miRNA和mRNA的结合:导致疾病或者其他的一些变化: 所以位于结合区域的snp 位点有极大的研究价值: 简介: PolymiRTS 数据库是一个miRNA 相关snp 位点的数据库,链接如下: http://compbio.uthsc.edu/miRSNP/ 数据库中收录的snp位点可以分成两种: 1)snp…
转载:http://www.oebiotech.com/Article/mirnabjyyc.html http://www.ebiotrade.com/newsf/2014-9/201492594150379.htm miRNA自从被发现以来,一直备受关注,俨然已成为非编码RNA家庭中永不凋零的“玫瑰”.关于miRNA,主要有两个研究方向,其一是作为biomarker,这方面研究仅需足够庞大的临床样本支撑即可:miRNA的另一研究方向为功能机制研究,此时必须有miRNA靶基因的参与,可是如何确…
MicroRNA (miRNA)  是一类内生的.长度约为20-24个核苷酸的小 RNA,其在细胞内具有多种重要的调节作用.每个 miRNA 可以有多个靶基因的表达,而几个 miRNA 也可以调节同一个基因的表达.据推测,miRNA 调节着人类三分之一的基因. miRNA命名 1.物种 hsa.mmu.rno分别代表人.小鼠.大鼠. 2.类别 mir.MIR.miR分别代表动物未成熟miRNA.植物未成熟miRNA.成熟 RNA. 3.序号 即阿拉伯数字.代表miRNA发现的先后顺序.一般情况下…
生物信息学-miRNA 转录组的分类: Noncoding RNA可分为负责Regulatory和housekeeping,housekeeping就是组织日常功能miRNA便是Regulatory RNA中的一种,长度18-22bp,具有短序列特异性,数量少于lncRNA,在相关物种中保守,20%-30%的miRNA可通过对non-coding RNA的靶向结合,达到调控编码蛋白质过程,从而调控制造蛋白质. miRNA参与生命活动,RNAi(RNA interference)是miRNA的一种…
之前讲过预测植物miRNA的一款软件miR-PREFER, 今天在介绍一款软件miRDeep-p2, 也叫miRDP2 安装 在此之前,应安装一下软件 Bowite, Bowtie2, Vienna (RNA二级结构预测软件大礼包) 安装以上软件以后,在mirdp2下载最新版的miRDP2,以及ncRNA_rfam.tar.g 1 tar -xf miRDP2-v1.1.4.tar 2mv 1.1.4 miRDP2-v1.1.4 在TestData下载测试数据集--TestData.tar.gz…
miRNA分析--数据过滤(一) miRNA分析--比对(二) 根据miRNA Target Prediction in Plants, miRNA并非所有区域都要求严格匹配,其中第1位碱基和第14位以后的碱基是允许错配(以miRNA 5'为始). miRNA 文件提交不管是U或者T都是可以的 miRNA 靶基因预测我采用了3个工具 1.psRNATarget: A plant Samll RNA Target Analysis Server 进去以后,提交自己miRNA文件,fasta格式,并…
miRNA分析--数据过滤(一) 在比对之前为了减少比对时间,将每一个样本中的reads进行合并,得到fasta格式,其命名规则如下: 样本_r数子_x数字 r 中的数字表示reads序号: x 中的数字表示该条reads重复次数 比对分为两条策略 1.根据本物种已有的miRNA序列进行比对, 已知当miRNA序列从 miRBase或者 sRNAanno得到 (应该将clean reads比对到所研究物种到tRNA, rRNA, snoRNA,mRNA等数据,允许一个错配,将比对上等reads过…
miRNA 数据过滤我使用cutadapt 1 cutadapt -a AGATCGGAAGAGCACACGTCT -m 15 -q 20 --discard-untrimmed -o outname .fa --discard-untrimmed 把reads中不含有adaper的reads去掉 -a 剪切reads 3'端adapter(双端测序第一条read),加$表示adapter锚定在reads3'端可找公司要 -g 剪切reads 5'端adapter(双端测序第一条read),加$…
miRNA MicroRNA (miRNA)  是一类内生的.长度约为20-24个核苷酸的小 RNA,其在细胞内具有多种重要的调节作用.每个 miRNA 可以有多个靶基因的表达,而几个 miRNA 也可以调节同一个基因的表达.据推测,miRNA 调节着人类三分之一的基因. 1.物种 hsa.mmu.rno分别代表人.小鼠.大鼠. 2.类别 mir.MIR.miR分别代表动物未成熟miRNA.植物未成熟miRNA.成熟 RNA. 3.序号 即阿拉伯数字.代表miRNA发现的先后顺序.一般情况下,数…
1.miRbasehttp://www.mirbase.org/2.miRDBhttp://www.mirdb.org/miRDB/policy.html3.miRandahttp://www.microrna.org/microrna/home.do4.TargetScanhttp://www.targetscan.org/vert_71/5.miRTarBasehttp://mirtarbase.mbc.nctu.edu.tw/…
基因表达谱数据 基因表达谱可以用一个矩阵来表示,每一行代表一个基因,每一列代表一个样本(如图1).所有基因的表达谱数据在“gene_exp.txt”文件中存储,第一列为基因的entrez geneid,第2~61列是疾病样本的表达,第62~76列是正常样本的表达. 图1 基因表达谱的矩阵表示 寻找差异表达的基因: 原理介绍: 差异表达分析是目前比较常用的识别疾病相关miRNA以及基因的方法,目前也有很多差异表达分析的方法,但比较简单也比较常用的是Fold change方法.它的优点是计算简单直观…
长链非编码RNA(lncRNA) 转自:http://blog.sina.com.cn/s/blog_909da11301010bkz.html     长链非编码RNA(lncRNA)是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控.转录调控以及转录后调控等)调控基因的表达水平. lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能.然而,近年来的研究表明,lncRNA参与了X染色体沉默,基因组…
转自:http://blog.sina.com.cn/s/blog_8088f3700101pab7.html 权威发布:长链非编码RNA命名规则 对于人类基因命名标准的制定而言,雨果基因命名委员会(HGNC)是唯一官方授权的机构.HGNC的数据库中有38000个基因名称,其中大部分是编码蛋 白基因:但HGNC也命名了8500多个人类非编码基因及假非编码基因,通过与各层次专家们的合作,他们命名了大多数的小非编码RNA. 小非编码RNA一般可根据它们的同源性及相同功能来分类.相比而言,长链非编码R…
http://www.gene-quantification.de/liquid-biopsy.html Liquid Biopsy -- Definitions Liquid Biopsy -- reliable biomarkers Liquid Biopsy -- the role in cancer diagnostics Liquid Biopsy -- the role of Exosomes Biofluids Guidelines Liquid Biopsy Research P…
Nanopore sensors for nucleic acid analysis Bala Murali Venkatesan and Rashid Bashir 用于核酸分析的纳米孔传感器 纳米孔分析技术是使用电压使得分子通过一个在两电极之间的电解液中的纳米孔,监测当单个分子穿过纳米孔时离子电流如何变化的技术. 这个方法允许充电的聚合物(包括单链DNA.双链DNA和RNA)来在亚纳米级别被分析而且不需要标记和放大.最近的发展显示,基于纳米孔的传感器与第三代基因测序技术相比具有竞争性,而且很…
CONTENTS *_annoTable.txt (ANNOVAR) *_annoTable.txt (SnpEff) *_genelist.txt (ANNOVAR & SnpEff) dbNSFP Information We provide here detailed Description about the files outputted from the somatic mutation annotators via ANNOVAR and SnpEff. *_annoTable.t…
随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era),向基因的功能及基因的多样性倾斜.通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明不同层次多基因协同作用的机理,进而在人类重大疾病如癌症.心血管疾病的发病机理.诊断治疗.药物开发等方面的研究发挥巨大的作用.它将大大推动人类结构基因组及功能基因组的各项基因组研究计划.生物信息学在基因组…
关于数据挖掘发表文章,我们知道很多人是看不上.瞧不起.嗤之以鼻的.大抵是因为这些人平时只发 CNS 主刊,所以才认为通过数据挖掘这种用「别人的数据」或者叫「干实验」来发文章是“「垃圾」,没有什么价值. 真的是这样吗?今天我们要介绍的就是一篇做数据挖掘的 Cancer Cell 杂志的文章(IF: 27.4),大家来看看文章怎么样. A Comprehensive Pan-Cancer Molecular Study of Gynecologic and Breast Cancers. Cance…
最出名,http://www.cbioportal.org/ 特色:最基本的简单分析基因突变.共表达/共突变的基因,下载数据也可以,最常看的应该还是oncoPrint那个. 详细用法:TCGA数据库的数据怎么查? 最方便,Ge-mini 特色:手机app,可随时查看,主要关注基因表达量的变化 详细用法:装这个app,妈妈再不骂我捧着手机不干正事了 最细致,http://ualcan.path.uab.edu/index.html 特色:1. 对肿瘤样本做了很细很专业的分组subgroup,生存分…
NGS又称为下一代测序技术,高通量测序技术 以高输出量和高解析度为主要特色,能一次并行对几十万到几百万条DNA分子进行序列读取,在提供丰富的遗传学信息的同时,还可大大降低测序费用.缩短测序时间的测序技术. Sanger法测序(一代测序):是一种利用DNA聚合酶来延伸结合在待定序列模板上的引物的测序技术.每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP).由于ddNTP缺乏延伸所需要的3-OH基团,使延长的…
STRING database的挖掘 这个数据库绝对是做实验人的宝藏,里面包含了各种蛋白互作关系,不用做实验就有一大堆证据. IPA了解一下,收费的高端分析软件,大部分就是整合的这个数据库,很多大佬喜欢用IPA来找明星基因,再来讲故事,实例请看之前解读的CSC paper. 首先了解一下STRING里面有哪些文件可以下载: https://string-db.org/cgi/download.pl?sessionId=yMNmD7s36wS8 选你的物种,减少文件大小,常用的就是互作数据: 一般…
通常我们下机得到的数据是raw reads,但是公司通常会质控一份给我们,所以到很多人手上就是clean data了.我们再次使用fastqc来进行测序数据质量查看以及结果分析. fastqc的操作: 1. FastQC使用 fastqc -f [bam | sam | fastq] -o [output] [filename1 filename2] 常用选项: -f --format:输入文件格式.[bam,sam,fastq文件格式] -o --outdir:输出文件夹指定 -t --thr…
RNAseq测序reads定位 发表评论 3,210 A+ 所属分类:Transcriptomics   收  藏 获得RNA-seq的原始数据后,首先需要将所有测序读段通过序列映射(mapping)定位到参考基因组上,这是所有后续处理和分析的基础.在读段定位之前,有时还需要根据测序数据情况对其做某些基本的预处理. 例如,过滤掉测序质量较差的读段,对miRNA测序读段数据去除接头序列等. 高通量测序的海量数据对计算机算法的运行时间提出了很高的要求.针对诸如Illumina/Solexa等测序平台…
circRNA 最初研究的很少,只有很小一部分基因有检测到circRNA, 当时都认为是剪切错误形成的,对于其功能也没人去研究:学者对人类的成纤维细胞进行转录组测序,构建去核糖体文库, 同时采用了RNase酶消化线性RNA 和 不消化线性RNA的两种文库,同时检测circRNA , 最终检测到了25000 多种circRNA ,这些circRNA 来源于exon 区, 叫做 ecircRNA, 保守估计,有14%的基因都产生了circRNA. 利用同样的方法,在小鼠睾丸组织中,鉴定到了69种和人…
转载生信技能树 https://mp.weixin.qq.com/s/JB_329LCWqo5dY6MLawfEA TCGA数据源 - R包RTCGA的简单介绍 - 首先安装及加载包 - 指定任意基因从任意癌症里面获取芯片表达数据 - 绘制指定基因在不同癌症的表达量区别boxplot - 更多boxplot参数 - 指定任意基因从任意癌症里面获取测序表达数据 - 用全部的rnaseq的表达数据来做主成分分析 - 用5个基因在3个癌症的表达量做主成分分析 - 用突变数据做生存分析 - 多个基因在多…
ensembl/release91: cat Homo_sapiens.GRCh38.91.gtf | grep -v "#" | cut -f9 | cut -f1,3,6,8 -d\; | grep gene_biotype | sed -e 's/\"//g' | sed -e 's/\;//g' | cut -f2,6,8 -d" " | sort | uniq > GRCh38.feature.info ENSG00000000003 TS…
hg19有哪些染色体? chr1 chr2 chr3 chr4 chr5 chr6 chr7 chr8 chr9 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr20 chr21 chr22 chrX chrY chrM 其实还有其他“染色体”,只是我们的研究一般用不到,所以就没有合并进来.比如做同源分析,找变异什么的,还是要选好基因组. gene_type有哪些? cat gencode.v27.annotation…
RNA测序相对基因表达芯片有什么优势? RNA-Seq和基因表达芯片相比,哪种方法更有优势?关键看适用不适用.那么RNA-Seq适用哪些研究方向?是否您的研究?来跟随本文了解一下RNA测序相对基因表达芯片有什么优势? 无假设的研究设计和更高的发现能力RNA-Seq是一种基于测序的强大方法,让研究人员能够打破传统技术的低效和花费,如实时定量PCR(RT-PCR)和芯片.无论是将RNA-Seq添加到现有的研究方法中,还是从一种方法彻底转换到另一种,RNA-Seq都带来了许多显而易见的优势.这种方法不…