为了验证杂交的质量,Affymetrix公司加入了两类嵌入探针组:

一、poly-A内参:包括lys、phe、thr、dap

对应的探针组名称为:AFFX-r2-Bs-lys-3_at、AFFX-r2-Bs-dap-3_at、

AFFX-r2-Bs-phe-3_at、AFFX-r2-Bs-thr-3_s_at

(注意:一般只取3’的表达值)

期望检测到的信号强度为lys<phe<thr<dap

期望lys检测值(Detection Call)为P

以样品GSM362947_LTT.CEL和GSM362948_LTT.CEL为例:

1)获取lys、phe、thr、dap的信号强度

library(yaqcaffy)

rawData<-ReadAffy("GSM362947_LTT.CEL","GSM362948_LTT.CEL")

yaqcResult<-yaqc(rawData)

> yaqcResult@morespikes[grep("(lys|phe|thr|dap).*3",rownames(yaqcResult@morespikes), ignore.case = TRUE),]

GSM362947_LTT.CEL GSM362948_LTT.CEL

dap3         621.85881         618.93019

thr3         157.46776         141.04182

lys3          26.22679          24.34060

phe3          80.33482          78.98733

在这个例子中,两个样品的lys、phe、thr、dap信号强度都符合lys<phe<thr<dap

2)arrayanalysis的问题

用R语言软件arrayanalysis分析以上样品得出的结论却是:

这明显不符合lys<phe<thr<dap,这是为什么?

我们先来看看yaqcResult@morespikes是什么:

GSM362947_LTT.CEL GSM362948_LTT.CEL

b5           102.92636         123.20557

b3            98.75225         106.84035

bm           113.12133         129.45077

c5           298.87382         322.52600

c3           361.89032         421.07440

d5          1289.20872        1334.69642

d3          1489.85897        1702.89382

dap5         303.57364         156.58720

dap3         621.85881         618.93019

dapm         414.50848         333.24881

thr5         108.41316          39.60845

thr3         157.46776         141.04182

thrm         129.56930          98.51053

lys5          23.28581          21.26793

lys3          26.22679          24.34060

lysm          30.29455          28.88963

phe5          31.29219          12.49173

phe3          80.33482          78.98733

phem          47.31779          32.76261

在arrayanalysis的源码functions_imagesQC.R中,先用正则表达提取出yaqcResult@morespikes中符合"(lys|phe|thr|dap).*3"条件的:

> spnames<-rownames(yaqcResult@morespikes[grep("(lys|phe|thr|dap).*3", # only 3' !

+ rownames(yaqcResult@morespikes), ignore.case = TRUE),])

> spnames

[1] "dap3" "thr3" "lys3" "phe3"

注意到spnames的顺序是"dap3" "thr3" "lys3" "phe3"而不是"lys3" "phe3" "thr3" "dap3"

然后把名称为spnames的探针组也就是"dap3" "thr3" "lys3" "phe3"的信号强度赋给sprep

> sprep<-t(yaqcResult@morespikes[spnames,])

> sprep

dap3     thr3     lys3     phe3

GSM362947_LTT.CEL 621.8588 157.4678 26.22679 80.33482

GSM362948_LTT.CEL 618.9302 141.0418 24.34060 78.98733

sprep的数据就直接用来作图了,所以上图的信号强度趋势的顺序应该是dap、thr、lys、phe,而不是预想的lys、phe、thr、dap

(现在我所使用的arrayanalysis版本确实存在这个问题,但是也许以后会改进)

3)获取lys的检测值:

calls<-detection.p.val(rawData)$call

lysCall<-calls[rownames(calls)[grep("AFFX-r2-Bs-lys-3_at",rownames(calls), ignore.case = TRUE)],]

> lysCall

GSM362947_LTT.CEL.present  GSM362948_LTT.CEL.present

"P"                       "P"

结论:两个样品的lys的检测值都为P

二、杂交内参:包括BioB、BioC、BioD、CreX

对应的探针组名称为:AFFX-r2-Ec-bioB-3_at、AFFX-r2-Ec-bioC-3_at、

AFFX-r2-Ec-bioD-3_at、AFFX-r2-P1-cre-3_at

(注意:一般只取3’的表达值)

期望检测到的信号强度为BioB<BioC<BioD<CreX

期望BioB检测值(Detection Call)为P

以样品GSM286756.CEL为例:

1)获取BioB、BioC、BioD、CreX的信号强度

library(simpleaffy)

qcResult<-qc(rawData)

> spikeInProbes(qcResult)

AFFX-r2-Ec-bioB-3_at AFFX-r2-Ec-bioC-3_at

GSM362947_LTT.CEL             6.625742             8.499409

GSM362948_LTT.CEL             6.739313             8.717931

AFFX-r2-Ec-bioD-3_at AFFX-r2-P1-cre-3_at

GSM362947_LTT.CEL             10.54096            12.37574

GSM362948_LTT.CEL             10.73377            12.48219

在这个例子中,两个样品的BioB、BioC、BioD、CreX信号强度都符合BioB<BioC<BioD<CreX

2)获取BioB的检测值:

> show(yaqcResult)

GSM362947_LTT.CEL   GSM362948_LTT.CEL

……

AFFX-r2-Ec-bioB-3_at_call  "P"                 "P"

……

结论:两个样品的BioB检测值都为P

三、计算poly-A内参和杂交内参的信号强度表达值采用了JustMAS算法,芯片中必须含有MM探针。除此之外,芯片中还要包含AFFX-r2-Bs-lys-3_at、AFFX-r2-Bs-dap-3_at、AFFX-r2-Bs-phe-3_at、AFFX-r2-Bs-thr-3_s_at、AFFX-r2-Ec-bioB-3_at、AFFX-r2-Ec-bioC-3_at、AFFX-r2-Ec-bioD-3_at、AFFX-r2-P1-cre-3_at探针组。不过这些步骤都由yaqc和qc函数完成了,读者不必过多关心JustMAS算法。yaqc和qc有一点不同,就是计算出信号强度表达值x后,yaqc会取2的x次方,qc则是2的x次方再取2的对数,也就是又变回x了。

07、poly-A内参和杂交内参(arrayanalysis的问题)的更多相关文章

  1. 相机标定过程(opencv) + matlab参数导入opencv + matlab标定和矫正

    %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 辛苦原创所得,转载请注明出处 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% ...

  2. SfMLearner论文笔记——Unsupervised Learning of Depth and Ego-Motion from Video

    1. Abstract 提出了一种无监督单目深度估计和相机运动估计的框架 利用视觉合成作为监督信息,使用端到端的方式学习 网络分为两部分(严格意义上是三个) 单目深度估计 多视图姿态估计 解释性网络( ...

  3. Autoware 进行 Robosense-16 线雷达与 ZED 双目相机联合标定!

    项目要标定雷达和相机,这里记录下我标定过程,用的速腾 Robosense - 16 线雷达和 ZED 双目相机. 一.编译安装 Autoware-1.10.0 我没有安装最新版本的 Autoware, ...

  4. MySQL--运维内参中的binlog_summary脚本

    #!/bin/bash ##===================================================## ## 脚本出自<MySQL运维内参> ##===== ...

  5. Revit API取得变量的内参名称

    与取得元素变量的内参名称类别有个BuiltInParameter //取得内参名称 [Transaction(TransactionMode.Manual)] [Regeneration(Regene ...

  6. 摄像机内参相关(3ds max)

    一般的原理参考:http://ksimek.github.io/2012/08/13/introduction/ 对于3ds max建模时使用的target camera,如果想得到它的内外参,可以利 ...

  7. Nginx实现内参:为什么架构很重要?

    Nginx在web开发者眼中就是高并发高性能的代名词,其基于事件的架构也被众多开发者效仿.我从Nginx的网站找到一篇技术文章将Nginx是怎样实现的,文章是Nginx的产品老大Owen Garret ...

  8. 极客时间|AI技术内参

    学习进度: 014 | 精读AlphaGo Zero论文

  9. imu内参标定

    https://medium.com/@tomas789/iphone-calibration-camera-imu-and-kalibr-33b8645fb0aa how kalibr model ...

随机推荐

  1. Python GUI教程(六):使用Qt设计师进行窗口布局

    本篇介绍使用qt设计师进行GUI窗口的布局管理,主要包含以下内容: 使用Qt设计师布局我们的窗口部件: 垂直布局: 水平布局: 网格布局: 使用间隔: 使用“伙伴”将label标签与窗口部件进行连接. ...

  2. [jmeter] : http采样器 Parameters、Body Data使用区别

    一.使用Jmeter进行接口测试,Headers和请求参数Parameters .Body Data 的联系 1.使用Parameters时,Content-Type 不传默认值为:applicati ...

  3. @vue/cli 3.x 版本配置productionGzip提高性能

    第一步:安装插件 npm i -D compression-webpack-plugin 第二步:引入.在文件vue.config.js里导入compression-webpack-plugin,并添 ...

  4. Linux上python3的安装和使用

    centos7默认是装有python的,咱们先看一下 #检查python版本 [root@oldboy_python ~ 17:23:54]#python -V Python 2.7.5 但是 pyt ...

  5. js对象深拷贝、浅拷贝

    浅拷贝1 //浅拷贝1 let obj01 = { name: 'Lily', age: '20', time: ['13', '15'], person: { name: 'Henry', age: ...

  6. Eclipse控制台输出中文乱码问题的解决

    啥都不说,上图: 1.console控制台打印乱码 2.右键: Run As --> Run Configurations 3.找到common项,在“Encoding”栏,看到当前用的是默认“ ...

  7. TCP定时器 之 坚持定时器

    坚持定时器在接收方通告接收窗口为0,阻止发送端继续发送数据时设定. 由于连接接收端的发送窗口通告不可靠(只有数据才会确认,ACK不会确认),如果一个确认丢失了,双方就有可能因为等待对方而使连接终止:接 ...

  8. Python学习笔记:字典型的数据结构

    根据书上的定义,字典是将数据与键相关联,这个键相当于是一组数据的一个名称,键必须是唯一的. python中提供了内置的映射类型--字典.映射其实就是一组key和value以及之间的映射函数,其特点是: ...

  9. spark MLlib 概念 5: 余弦相似度(Cosine similarity)

    概述: 余弦相似度 是对两个向量相似度的描述,表现为两个向量的夹角的余弦值.当方向相同时(调度为0),余弦值为1,标识强相关:当相互垂直时(在线性代数里,两个维度垂直意味着他们相互独立),余弦值为0, ...

  10. out 传值(传址)

    传值,只将这个变量的值给拿走,不返还,除非return赋值.将a的值传入函数,无论这个值在函数中如何变化,不会影响main中的a 传址,将这个变量的值拿走运算,完成后还是得返还回来(不用return, ...