简介
全基因组关联分析(Genome-Wide Association Studies,GWAS)是指在基因组水平进行大量样本与复杂疾病和性状的关联性分析,从而全方位地分析疾病的发生发展机制,筛选出与疾病相关的致病基因及变异位点。
方案设计
1. 研究目的为发现并确证复杂性遗传疾病的致病变异或基因。
2. 收集患者人群(Case)及正常人群(Control)的血液样本,建议case和control不得小于500例样本,推荐大于1000例样本。样本过少时,假阳性关联结果概率增加。样本大于2000个,可研究低频罕见突变。
3. 抽提血液样本DNA并质检,根据全基因组重测序(WGS)或全外显子测序(WES)的检测方向选择相应文库构建并进行测序。
4. 对所有样本数据进行质控及基础分析,发现单碱基变异(SNV)、小片段插入缺失(Indel)、基因组拷贝数变异(CNV)及结构变异(SV)等信息。
5. 对样本中的变异信息进行高级分析,利用WuXiNextCODE分析系统,利用Fisher检验、Logistic回归、Plink软件等方法寻找疾病相关的位点/基因,与其他表型进行联合分析。
6. 探索复杂疾病表型和位点/基因的关联关系。针对复杂性疾病的关联表型,例如预后、病程发展速度、并发症等进行关联分析,确证表型指标与相关位点/基因的对应关系。
典型结果示例

WuXiNextCODE系统中基于单个SNV位点的Case_Control关联分析

WuXiNextCODE系统中基于单个SNV位点的Case_Control关联分析

感基因及位点展示

QQ图

其他高级分析内容包括:

1. 突变位点过滤及有害性评估

2. PCA分析及λGC的计算

3. 基于WuXiNextCODE系统的Case_Control关联分析及显著性P值矫正

4. 曼哈顿图和QQ图绘制

5. GO和KEGG注释

6. 其他高级分析(视情况而定,我公司认为评估疾病或者表型的遗传力很有必要,尤其针对复杂性状)

样本建议

全外显子测序:10 Gb PF data(Agilent SureSelect V5,有效测序深度约100×)

13 Gb PF data(Agilent SureSelect V6,有效测序深度约100×)

全基因组测序:110 Gb PF data(测序深度约30×)

诊断需要有明确的国际诊断标准;所有样本都有详细的表型信息,包括性别、年龄、发病年龄、是否吸烟、样本采集地点等;对一切可能影响疾病发生与发展的因素要有详细记录,例如是否有患有其他类型疾病等信息。

案例介绍
案例一
冠状动脉疾病(Coronary artery disease, CAD)是发病率和致死率最高的疾病之一。以前的科学研究共识别了65个与CAD关联的突变,但大多位于基因的非编码区。研究人员对包括CAD在内的共5种血管类疾病(偏头痛、颈动脉剥离、肌纤维发育不良、高血压)进行了GWAS研究,发现PHACTR1基因与这5种血管疾病都显著关联。基于基因型填补的精细定位,在PHACTR1基因的第三个内含子上发现了最显著的关联信号-rs9349379。CRISPR/cas9结果证明该变异位点可以调控内皮素-1(EDN1)基因的表达,而EDN1与血管收缩紧密相关。研究发现,rs9349379的G等位基因可以增加CAD的患病风险,但却可以使其他4种疾病的患病风险降低。
参考文献
Gupta R M, Hadaya J, Trehan A, et al. A Genetic Variant Associated with Five Vascular Diseases Is a Distal Regulator of Endothelin-1 Gene Expression [J]. Cell, 2017, 170(3):522-549.
案例二
心房颤动(Atrial Fibrillation,AF)是一种常见的快速心律失常疾病。随着年龄增长,AF的发病率也成倍增加。科学家对8,180例AF患者和28,612例正常对照人群样本进行研究,新发现了6个位点,其中HAND2为最显著的AF候选基因,其编码的蛋白与心脏的形态以及生长发育相关。此外,研究还发现该基因的变异在东亚人群中更常见。无独有偶,同一天同一期刊上,一项参与人数更多的AF GWAS研究也被报道,研究人员不仅探索了常见突变,还探究了遗传效应值更大的低频罕见突变对AF的影响,最终获得了12个新的位点。综上,两篇关于AF的报道新发现了18个致病位点。

图:易感基因及位点展示

参考文献
Low S K, Takahashi A, Ebana Y, et al. Identification of six new genetic loci associated with atrial fibrillation in the Japanese population [J]. Nature genetics, 2017, 49(6): 953. Christophersen I E, Rienstra M, Roselli C, et al. Large-scale analyses of common and rare variants identify 12 new loci associated with atrial fibrillation [J]. Nature genetics, 2017, 49(6): 946.