简介
转录组测序在复杂疾病研究中有着广泛的应用,特别是在了解疾病表达谱、融合基因检测以及分子分型等机制方面。表达量的差异直接影响蛋白表达进而反映了生理机能的情况,对于疾病机制研究是非常强有力的工具。
方案设计
方案步骤及应用
1. 研究目的是通过转录组研究复杂疾病的发病机制。
2. 收集相应疾病组及对照组样本。
3. 对疾病组和对照组样本进行RNA提取、质检并进行转录组测序。
4. 对下机数据进行质控及基础分析,筛选组间差异表达基因,并进行功能和信号通路分析。
5. 根据差异表达基因结果进行高级分析,通过主成分分析,展示样本间的重复性。
6. 根据标准分析中找出差异表达基因进行聚类分析,或根据客户需求调整。
7. 使用GSEA分析,寻找差异表达基因与功能的关系。
8. 根据组间差异基因,通过共表达网络构建找到发病相关的关键基因。
9. 通过对关键基因的分析,找到致病关键基因的调控机制,包括非编码RNA调控发病关键基因的机制。
10. 根据疾病表型对样本重新分组,在基因组表达水平对表型进行分型分析,获得能够区分不同表型的基因群。
11. 进行融合基因分析,找到与发病相关的候选融合基因。后续可对融合基因进行验证,排除假阳性结果。
12. 可变剪切分析,找到调控疾病发生的可变剪切事件,从而揭示可变剪接与疾病的发生的机制。
13. 转录组变异位点检测,通过RNA-seq数据检测SNV/INDEL。
14. 对于血清/血浆样本,主要通过检测miRNA信息研究复杂疾病发病、治疗过程中的差异表达的miRNA,根据miRNA靶基因的信息挖掘疾病作用机制。
典型结果示例

图:主成分分析(PCA),展示样本之间的相似性

图:差异基因火山图,展示比较组别之间差异表达的基因

图:基因表达聚类分析

图:主成分分析(PCA),展示样本之间的相似性

图:GSEA基因功能/通路富集分析,展示表达量变化的基因的富集情况

图:GO分析,展示差异表达基因的GO富集情况

图:KEGG富集分析,展示差异表达基因的信号通路富集情况

图:融合基因分析,检测基因结构上的变化情况

图:WGCNA分析,通过基因的表达模式确定具体的模块(module)

图:模块分析,分析各个模块中基因之间的相互相关系,寻找核心调控基因

图:无监督聚类分型展示,通过无监督方式对不同表型数据进行分型

图:Small RNA的长度统计,检测Small RNA的长度分布范围

图:各种小RNA分子的占比,如rRNA、scRNA、snoRNA和tRNA

图:新miRNA二级结构展示,揭示在样本中表达的新的miRNA

图:miRNA靶基因的富集分析,展示miRNA参与的生物学通路

样本建议

转录组测序和Small RNA测序,推荐正常和对照样本各大于20例;对于血清/血浆等血液相关样本项目,建议样本数目大于100 例。

转录组测序:如果是基因表达分析,每个样本建议大于6 Gb PF data。如果是结构分析,如融合基因,可变剪切,每个样本建议大于12 Gb PF data。

Small RNA测序: 每个样本建议 10 Mb reads。

此方案对于样本要求较高,推荐使用正常组织及病变组织的新鲜冻存样本。组织样本采集过程中尽量避免RNA降解,以免影响最终结果的准确性。因此,不推荐用RNA损失严重的石蜡包埋样本进行该研究。

对于血液相关项目,可以根据项目使用正常及病变样本的血清/血浆、血小板或者外周血单个核细胞(PBMC),尽可能避免用全血样本进行相关研究。尽量缩短血清/血浆、血小板或者外周血单个核细胞收集的时间周期,防止样本RNA降解,影响检测到的转录本的类型以及表达丰度。

案例介绍
案例一
心力衰竭(Heart Failure,AF)简称心衰,是指由于心脏的收缩功能和(或)舒张功能发生障碍,不能将静脉回心血量充分排出心脏,导致静脉系统血液淤积,动脉系统血液灌注不足,从而引起心脏循环障碍症候群。研究人员同时对8对非缺血性心力衰竭植入辅助装置前后的左心室样本(NICM pre-LVAD/Post-LVAD ),8对缺血性心力衰竭植入辅助装置前后的左心室样本(ICM pre-LVAD/Post-LVAD), 8个正常心肌左心室样本(NF)进行转录组测序和Small RNA测序。分析发现,mRNA、miRNA和lncRNA在心肌疾病中的表达模式与正常样本中显著不同。其中,利用unsupervised hierarchical clustering方法对lncRNA表达谱进行聚类发现,lncRNA的表达特征不仅可以区分正常样本(NF)和心肌症左心房病人(ICM/NICM)的样本,而且可以区分LVAD治疗前后的样本。综上所述,相比miRNA和mRNA, lncRNA参与心衰调节,可以作为有效的生物标记来评估心肌疾病。

图:lncRNA区分正常样本NF 和病人ICM/NICM样本

图:lncRNA区分正常样本NF 和ICM/NICM病人LVAD治疗前后的样本

参考文献
Yang K C, Yamada K A, Patel A Y, et al. Deep RNA Sequencing Reveals Dynamic Regulation of Myocardial Noncoding RNAs in Failing Human Heart and Remodeling With Mechanical Circulatory Support[J]. Circulation, 2014, 129(9):1009-21.
案例二
心力衰竭(Heart 急性缺血性脑中风(Ischemic Stroke,IS)是由于脑组织在缺乏血流后而产生的中枢神经学症候。目前,IS分子标志物主要局限于一些特异性差的蛋白标志物,如NSE、GFAP、IL-6等。为了鉴定与急性IS相关的RNA分子标志物,研究人员对20个中风病人(IS)和20个健康人(HC)的血浆样本进行Small RNA-seq,鉴定到32个差异表达(FDR<0.05)的miRNA。随后,研究人员在40位IS患者和40位HC的验证样本,以及200位IS患者、100位HC和72位短暂性脑缺血(TIA)患者的重复样本中进一步确认三个miRNA(miR-125a-5p、miR-125b-5p 和 miR-143-3p)的表达量在IS患者中显著上调。通过受试者工作特性曲线(ROC Curve)分析,研究人员发现这三个miRNA(miR-125a-5p、miR-125b-5p 和 miR-143-3p)可以很好的区分IS患者和HC人群。(NICM pre-LVAD/Post-LVAD ),8对缺血性心力衰竭植入辅助装置前后的左心室样本(ICM pre-LVAD/Post-LVAD), 8个正常心肌左心室样本(NF)进行转录组测序和Small RNA测序。分析发现,mRNA、miRNA和lncRNA在心肌疾病中的表达模式与正常样本中显著不同。其中,利用unsupervised hierarchical clustering方法对lncRNA表达谱进行聚类发现,lncRNA的表达特征不仅可以区分正常样本(NF)和心肌症左心房病人(ICM/NICM)的样本,而且可以区分LVAD治疗前后的样本。综上所述,相比miRNA和mRNA, lncRNA参与心衰调节,可以作为有效的生物标记来评估心肌疾病。

图:实验设计以及miRNA的鉴定

图:miRNA作为生物标志物的性能评估

参考文献
Yang K C, Yamada K A, Patel A Y, et al. Deep RNA Sequencing Reveals Dynamic Regulation of Myocardial Noncoding RNAs in Failing Human Heart and Remodeling With Mechanical Circulatory Support[J]. Circulation, 2014, 129(9):1009-21.