产品介绍
10x Genomics公司的基因组&外显子组解决方案(The Chromium Genome & Exome Sequencing Solution)利用Linked-Reads的强大功能,进行单体型和结构分析,解决了在难以接近以及复杂的基因组区域中进行突变检测的难题,全面解读基因组的遗传信息。
应用方向
结构变异分析
结构变异(Structural Variation,SV)是一种重要的分子机制,能够导致复杂疾病的发生,已经成为复杂疾病领域的研究热点。标准的短读长测序方法难以识别SV,无法分析基因组的重复区域,也无法区分基因组的单体型。已有研究表明,区分单体型信息可以提高SV检测灵敏度。Linked-Reads基因组&外显子组解决方案能够提供重要的单体型信息,可用于分析更完整的结构变异。Linked-Reads可以将reads比对到基因组的重复区域,而结构变异断点通常富集在这些重复区域。Long Ranger软件可以利用Linked-Reads数据可靠地检测基因组和外显子组中的结构变异信息。
HLA全面分析
人类白细胞抗原(Human Leukocyte Antigen,HLA)是人主要组织相容性复合体(Major Histocompatibility Complex,MHC)的表达产物。MHC在抗原递呈和免疫信号传递过程中发挥重要作用,与机体免疫应答和免疫调节密切相关。HLA基因簇具有高度多态性,特别是在定义为ClassⅡ的基因区域内。HLA的多态性不仅包括单核苷酸变异(Single Nucleotide Variation,SNV),还包括拷贝数变异(Copy Number Variation,CNV)和SV等这类大片段DNA序列的结构变异。因此,在整个HLA基因簇区域内准确重构每个等位基因至关重要。利用10x Genomics公司的Linked-Reads基因组解决方案分析HLA基因簇所在区域的序列信息,有助于研究HLA在人类疾病发生和治疗等过程中的作用。
技术优势

长片段信息

利用短reads可获得DNA长片段信息

检测范围广

检测基因组不可接近区域以及复杂区域结构变异

数据分析强

专业的分析流程以及可视化软件

分析全面

分析同源序列,包括对重复序列、基因倒位和假基因的检测

技术参数

样本类型

高质量的DNA、细胞、组织、全血等

送样要求

gDNA:总量≥100 ng,体积≥10 μL,70% DNA长度≥48.5 kb

细胞数量:≥1×106

全血:≥0.25 mL

组织:≥10 mg

推荐检测策略

Linked-Reads基因组&外显子组研究平台:10x Genomics的Chromium平台

测序平台:Illumina HiSeq X TEN或者Illumina NovaSeq 6000

测序策略:PE 150

测序数据量:Genome:128 Gb

Exome:13 Gb(Agilent SureSelect Human All Exon V6)

服务周期

4个样本以内16个工作日完成所有实验和生物信息分析工作

8个样本以内20个工作日完成所有实验和生物信息分析工作

实验流程

图1 Chromium Genome Solution实验流程

图2 Chromium Exome Solution实验流程

Linked-Reads技术利用微流体将长片段DNA分是选到不同的油滴微粒中,油滴中的barcode序列及随机引物与DNA序列进行反应,扩增生成具有大于1,000,000个独特barcode的DNA库(图1)。在DNA分子加上barcode后,混合样本并进行标准文库制备,最终的文库能够兼容大多数Illumina测序系统。其中,外显子组解决方案需要利用Agilent SureSelect Human All Exon V6对外显子区域进行捕获(图2)。测序后,根据barcode序列将短reads拼接成长reads,识别单个高分子量DNA分子,从而提供超长片段的基因组信息并获得短读长测序无法获得的基因组复杂区域的信息,在连续的兆碱基长度基因组片段上挖掘与疾病、癌症有关的单体型,并描绘复杂重排的结构。
生物信息分析流程

图3 生物信息分析流程

重要分析结果展示

图4 使用barcode重叠和barcode覆盖检测大型SV(与参考基因组比对,在区域A-F和T-Z

(A)之间时,几乎没有barcode重叠当出现删除(B)或者反转(C)时标准barcode重叠

模式的示例。在(D)中,上部显示barcode覆盖,而下部显示reads覆盖。barcode覆盖

平滑,更适合SV检测)

经典案例解读
Linked-Reads基因组测序揭示基因结构变异导致去势抵抗性前列腺癌
几乎所有前列腺癌死亡都是转移性去势抵抗性前列腺癌(metastatic Castration-Resistant Prostate Cancer,mCRPC)造成的,但目前对这种疾病进行全基因组测序(Whole Genome Sequencing,WGS)的研究却很少。为了更全面地了解mCRPC的体细胞突变和SV,作者采用10x Genomics平台对23例mCRPC活检标本进行Linked-Reads基因组测序(平均测序深度31X),并分析了86例mCRPC患者的cfDNA测序数据。研究发现,除了一些已知前列腺癌基因重排外,在大多数样本中存在雄激素受体(Androgen Receptor,AR)基因座的复杂重排。作者还发现在70%-87%的病例中,AR基因上游的增强子区域存在串联重复序列,而只有不到2%的原发性前列腺癌患者中存在这一现象。一组病例的分析结果显示,AR或MYC增强子重复与CDK12失活相关。研究结果强调了mCRPC中复杂的结构变异在维持晚期前列腺癌AR信号传导中的重要作用,特别是非编码基因所在区域的变异,这些结果对指导前列腺癌治疗方法的改进有着重要的意义。

图5 mCRPC队列的重排和测序指标

参考文献
Viswanathan, S. R., Ha, G., Hoff, A. M., et al. Structural Alterations Driving Castration-Resistant Prostate Cancer Revealed by Linked-Read Genome Sequencing [J]. Cell, 2018, 174(2):433-447.e19.