转录组常见问题解答

一、什么是转录组? 转录组(transcriptome)广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。 二、RNA-seq中什么是有参/无参?如何选择? 参是指参考基因组;一般还未有参考基因组的物种建议做无参,或者测序样本与参考基因组比对率过低也可以做无参。 三、什么是raw d

一、什么是转录组?

转录组(transcriptome)广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。

image

二、RNA-seq中什么是有参/无参?如何选择?

参是指参考基因组;一般还未有参考基因组的物种建议做无参,或者测序样本与参考基因组比对率过低也可以做无参。

三、什么是raw data/ clean data?

raw data,是测序下机的原始数据。clean data,对原始数据进行过滤后,剔除了低质量数据的剩余数据;后续分析均基于clean data。

四、什么是Q20、Q30?

Phred 数值大于20、30的碱基占总体碱基的百分比,其中Phred=-10log10(e)。

五、有参分析都需要什么文件?

相应的参考基因组及基因结构注释文件(gtf/gff/gff3/bed等格式,推荐gtf,gff)、基因的GO注释文件的直接下载链接以及基因功能描述文件。

六、造成mapping rate较低的原因可能有哪些?

(1)由于reference组装不好,或者所测物种与reference的亲缘关系较远;

(2)由于样品的特殊前处理或者相对于参考基因组此样品本身的变异太大,导致mapping rate相对较低。

七、什么是可变剪切?

大多数真核基因转录产生的mRNA前体是按一种方式剪切产生出一种mRNA,因而只产生一种蛋白质。但有些基因产生的mRNA前体可按不同的方式剪切,产生出两种或更多种mRNA,即可变剪切。

八、基因表达水平如何计算?

在RNA-seq技术中,FPKM(expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced)是每百万fragments中来自某一基因每千碱基长度的fragments数目,其同时考虑了测序深度和基因长度对fragments计数的影响,是目前最为常用的基因表达水平估算方法。

九、能否用FPKM/RPKM进行差异分析?

在做差异分析时,是采用readcount数据,通过DESeq或者TMM标准化后,进行差异分析。FPKM/RPKM实际上也是对readcount进行标准化处理的一种方法,在进行差异分析时,DESeq和TMM的标准化效果最好,FPKM/RPKM的标准化效果较差,不推荐使用FPKM/RPKM进行差异分析。

十、某基因在两个样本中表达量差别很大,却不存在与显著差异的基因列表中,这是为何?

差异基因的筛选是基于统计学意义的,不能直观的通过两个数值的大小判断差异基因的是否:

首先:受测序深度的影响,有些样品的测序深度较深,可能导致该样品的readcount数值较高,做差异分析的第一步就是要消除测序深度的影响,对原始数据进行标准化处理(我们在有重复项目中,使用DESeq自带的标准化方法;无重复项目中,使用TMM标准化方法)。

其次:在差异分析过程中,需要对readcount的分布进行估计,经验表明,readcount服从负二项分布。在有重复的项目中,重复的好坏也会对差异基因与否产生影响。如果重复较差,组内差异情况会屏蔽掉部分组间的差异。在估计完参数后,需要用特定检验方法来判断差异基因与否。

再次:在计算完pvalue以后,需要对pvalue进行多重假设检验校正,来减少假阳性。这个过程会使得padj会大于原来的pvalue,使得部分通过pvalue阀值的基因,无法通过padj的阀值。

十一、差异基因列表中,readcount一个为0,另一个不为0,能否说明一个表达,一个不表达?

在有参项目中,一般默认fpkm>1时,基因表达。一般不推荐看readcount的值看判断表达与否。

十二、能否提取部分基因来做差异分析?

不能。差异分析是基于整体来做的。差异分析软件的作者推荐用全部readcount进行差异分析,若使用部分基因做分析,会毁坏掉数据整体的特点,如测序深度、reads分布特征。所以不推荐老师抽取部分来做差异分析。

十三、为什么编码同一个酶的基因,会有的上调有的下调?

这些编号的基因存在着多个条目,也可能包含了一个家族的多个基因,它们间的调控机制可能尚不清楚,反映在图上会有部分上调,部分下调的现象,这是比较常见的现象。

相关推荐

北京科沿有道生物科技有限公司

北京科沿有道生物科技有限公司是一家拥有动物平台、细胞平台、微生物平台、蛋白平台,分子平台,病理平台、流式平台等多平台整体实验室的高科技企业,75%以上的团队成员具有硕士及以上学位,具有丰富的理论以及实验经验,建立了多方面成熟的实验体系,与国内各大医院、高校以及研究所等机构的广大科研人员展开了广泛的合作,并提供专业的一站式科研服务. 联系电话:18698097058/18201011950

修饰蛋白质组学之琥珀酰化鉴定

蛋白质琥珀酰化修饰是新近发现的一种蛋白质翻译后修饰,是在琥珀酰辅酶 A 的介导下将一个负电荷四碳琥珀酰基转移到赖氨酸残基的伯胺上的过程。赖氨酸琥珀酰化在真核细胞及原核细胞中广泛存在,参与调控包括三羧酸循环,氨基酸代谢以及脂肪酸代谢在内的多个代谢信号通路。琥珀酰化蛋白质组以组织、细胞等较为复杂样本为研究对象,目的在于鉴定样品中发生琥珀酰化修饰的蛋白质以及相应的琥珀酰化修饰位点。 一、技术特点:

修饰蛋白质组学之糖基化鉴定

糖基化是在酶的控制下在蛋白质或脂质上附加糖类的过程,起始于内质网,结束于高尔基体。在糖基转移酶作用下将糖转移至蛋白质,和蛋白质上的氨基酸残基形成糖苷键,并在糖基转移酶和糖苷酶的剪切、加工下形成各种类型的糖链。 糖基化蛋白质组学的核心任务是利用组学的手段,从全局上去寻找发生糖基化修饰的位点,解析糖链的结构,鉴定完整的糖肽,探索糖蛋白在生命活动中扮演的角色和生物学功能。 一、技术特点:

修饰蛋白质组学之乙酰化鉴定

蛋白质的乙酰化修饰是在乙酰基转移酶的作用下,蛋白质的赖氨酸残基上添加乙酰基的过程,是细胞控制基因表达、蛋白质的活性或生理过程的一种机制。乙酰化主要集中在对细胞染色体结构的影响以及对核内转录调控因子的激活方面,还参与细胞周期和新陈代谢、肌动蛋白聚合控制。乙酰化蛋白质组以组织、细胞等较为复杂样本为研究对象,目的在于鉴定样品中发生乙酰化的蛋白质以及相应的乙酰化位点。 一、技术特点: (1)采

修饰蛋白质组学之巴豆酰化鉴定

巴豆酰化是一种进化高度保守,且在生物学功能上完全不同于组蛋白赖氨酸乙酰化的蛋白质修饰方式。组蛋白巴豆酰化修饰是指在组蛋白的氨基酸残基上引入巴豆酰基团,参与基因表达调控等重要生物学过程。巴豆酰化蛋白质组以组织、细胞等较为复杂样本为研究对象,目的在于鉴定样品中发生巴豆酰化的蛋白质以及相应的巴豆酰化位点。 一、技术特点: (1)采用化学性质稳定巴豆酰化树脂IP的方法,特异性高,富集效率好;