血缘关系数据分析论文提纲

2022-11-15

论文题目:全转录组关联研究鉴定慢性乙型肝炎病毒感染易感基因

摘要:研究背景:HBV的感染是影响全球公共卫生的重大传染性疾病之一,全球约有至少20亿人有过HBV感染,其中3.5-4亿人为慢性HBV感染,主要分布于亚太地区。根据最新2017全球疾病负担(2017 GBD)报道,每年由HBV感染导致死亡的人数约79.9万人,位居感染性疾病导致死亡的前五位。在中国,每年因HBV感染导致的肝硬化和肝癌(hepatocellular carcinoma,HCC)死亡约30万人。因此,慢性HBV感染仍然是我国长期危害人民健康的重大公共卫生问题之一。HBV感染的转归受许多因素的影响,主要来自三个方面:病毒、环境和宿主。不同的种族间的HBV感染率存在很大差异,亚洲人更易感染HBV,亚裔在迁徙至HBV低感染地区,其HBV的感染率仍高于原住居民。中国人群的双生子研究表明,同卵双生子的慢性HBV感染率高于异卵双生子。此外,基于家庭的HBV慢性感染研究发现,有血缘关系的亲属较不具有血缘关系的亲属,在感染HBV后更易发展成为慢性感染,这表明遗传因素也是HBV慢性感染的重要影响因素。遗传易感性的差异目前被认为由胚系遗传变异(Germline variant)所决定,胚系遗传变异中较为常见是单核苷酸多态性(Single nucleotide polymorphism,SNP)。近年来,伴随着基因组研究技术的突飞猛进,全基因组关联研究(Genome-wide association study,GWAS)作为一种高效的分子流行病学研究手段已广泛应用于复杂疾病或性状的遗传易感性研究。近十年来,亚洲地区的HBV慢性感染的GWASs取得了很大的进展。自2009年,首个由日本基因组研究中心(Human Genome Center)开展的HBV慢性感染的GWAS以来,已经发现了HBV慢性感染的4个易感区域。然而,GWAS发现的大部分的关联位点并不能全面解释其在HBV慢性感染中的机制,特别是HLA区域,发现的位点几乎在所有的GWAS中都得到了验证,但是从位点到疾病发生的生物功能改变至今尚未明确。由于GWASs发现的90%以上的遗传变异位于非编码区域,这导致真正引起疾病生物学功能改变的致病基因很难被发现。目前认为基因表达水平的改变是连接基因组遗传变异和疾病表型的关键,表达数量性状位点(expression quantitative trait loci,e QTL)是评估位点与基因表达之间关联的有效方式,然而受限于生物样本的可及性,e QTL分析仅能评估易获取的生物样本,如外周血中的白细胞中基因表达水平与遗传变异的关联,特定组织中e QTL研究无法在大样本量的人群中顺利推进。基因型-组织表达数据库(Genotype-Tissue Expression,GTEx)共享了人类五十余种组织的全转录组测序(RNA-seq)数据,这为特定组织的全转录组水平的关联研究提供了可能。全转录组关联研究(transcriptome-wide association study,TWAS)的研究思路:主要通过较小样本量的特定组织的基因表达数据和对应个体的基因型数据构建基因型-基因表达水平的模型;随后,根据构建的模型以及个体的基因分型信息预测特定组织的基因表达量;最后,评估预测的基因表达量与疾病表型之间的关联,从而发现疾病表型相关的易感基因。近年来,TWAS已在多种复杂疾病的关联研究中获得了显著的研究进展,如恶性肿瘤,精神分裂,高血压,多动症等。TWAS是GWAS的深入探索方式,不但可以发现新的易感区域及潜在目的基因,还能为GWASs报道区域易感基因的鉴定提供依据。目的:从肝组织的全转录组层面出发,结合本课题组前期HBV慢性感染GWAS的研究基础,探讨HBV慢性感染有关的易感基因。开展基于生物信息学的易感基因通路富集分析。易感基因顺式调控区域(上下游1MB为顺式调控区)独立效应易感位点鉴定。易感位点在HBV相关HCC中关联评估。对象与方法:本研究采用病例-对照的研究设计开展全转录组关联研究。首先,从GTEx项目中获取97例肝组织转录组测序数据及配套基因分型数据,评估基因表达水平的遗传度,筛选受到遗传因素影响的基因(heritable gene),采用全基因组复杂性状分析(Genome-wide Complex Trait Analysi,GCTA)中的混合线性模型(mixed linear model,MIM)构建遗传相似矩阵(Genetic Relatedness Matrix,GRM)获得遗传度,限制性极大似然比(Restricted Maximum Likelihood,REML)评估遗传效应,以P值<0.05为阈值筛选基因(cis-heritable genes)纳入下一步模型构建。随后,构建基因型-基因表达量的最优拟合模型,模型的拟合采用贝叶斯稀疏混合模型方法(Bayesian Sparse Linear Mixed Model,BSLMM),使用全基因组高效混合模型关联分析软件(Genome-wide Efficient Mixed Model Association,GEMMA)实现上述分析。随后,将预测模型应用于HBV慢性感染GWAS的基因分型数据(病例组:951例HBV慢性感染者;对照组:937例HBV一过性感染者),以预测病例/对照个体肝组织中的基因表达水平,使用logistic回归评估基因表达对疾病的贡献,调整协变量包括年龄、性别及基因分型第一主成分,以错误发现率(False Discovery Rate,FDR)Q<0.2为阈值筛选HBV慢性感染相关的易感基因。基于肝组织转录组测序数据,采用Spearman相关检验评价基因间的表达相关性,使用基于相关系数的基因集富集分析(Gene Set Enrichment Analysis,GSEA),探讨易感基因潜在的分子生物学功能,基因集选自基因本体数据库(Gene Ontology,GO)中涵盖基因最多的生物学通路基因集。采用逐步logistic回归的方法(stepwise logistic regression)鉴定易感区域独立效应的位点。逐步回归用于鉴定易感基因上下游1MB的顺式调控区域的独立效应位点,,纳入回归模型的位点满足设定条件后,在调整相互的效应后,SNP在模型中仍满足关联P<0.05。最后,探讨HBV慢性感染易感位点与HBV相关HCC的关联,纳入1538例HBV阳性的HCC病例和1465例HBV慢性感染者,采用Sequenom Mass ARRAY平台进行基因分型,使用logistic回归模型评估关联。结果:TWAS发现8个与HBV慢性感染相关的易感基因,2个基因位于新发现区域,包括位于3q21.1区域的PAPR9(Z=3.69,P=2.20×10-4)基因和位于7q11.23的假基因AC138783.12(Z=3.57,P=2.20×10-4);6个基因位于既往报道区域,包括位于HLA区域的HLA-DPA1(Z=-5.2,P=2.02×10-7)和HLA-DPB1(Z=-5.1,P=3.37×10-7)这两个被既往GWAS研究广泛鉴定的基因。此外,该经典区域还发现3个新的基因,HLA-DOB(Z=-3.72,P=2.00×10-7),BAK1(Z=-3.95,P=7.84×10-5)和C4A(Z=-3.64,P=2.70×10-4);既往GWAS报道的22q11.21区域,发现新的基因TMEM191A(Z=3.55,P=3.80×10-4)。基因共表达分析结果显示,8个HBV慢性感染相关易感基因中,HLA-DPA1和HLA=DPB1之间存在显著相关(r=0.86,P=4.49?10-25),其他6个基因之间表达无显著关联。GSEA结果提示PARP9基因参与多条免疫相关通路,包括免疫反应的正向调节通和免疫效应过程及其调节通路,提示PARP9可能在免疫过程中发挥重要作用。HLA区域基因除了参与固有免疫应答和免疫反应的正向调节等免疫相关通路,还均参与了细胞活化通路。易感区域独立效应分析鉴定发现14个慢性HBV感染有关的易感位点,在HBV相关HCC中评估得到3个SNPs与HCC相关。相加模型下,rs9394104(OR=1.23,95%CI:1.10-1.37,P=3.97?10-4),rs9272714(OR=1.29,95%CI:1.12-1.42,P=1.19?10-4)和rs9272770(OR=1.23,95%CI:1.07-1.42,P=4.75?10-3)与HBV相关HCC存在显著关联,提示这三个SNPs可能通过影响HBV感染慢性转归,参与HCC的发生。结论:TWAS研究不但验证了既往GWAS报道的HLA-DPA1和HLA-DPB1,还发现了6个新的HBV慢性感染易感基因,其中3个位于HLA区域;而非HLA区域易感基因的富集分析也提示与免疫密切相关,进一步证实遗传学水平的免疫异常是HBV慢性感染重要机制,为进一步的机制研究提供了方向。此外,这些区域中的关键位点,不仅可以影响HBV慢性感染,还可以继而影响HCC的易感性。该结果为慢性HBV感染的高危人群评估提供了新的分子生物标志物。

关键词:HBV慢性感染;全转录组关联研究;易感基因;HBV相关肝癌

学科专业:流行病与卫生统计学

中文摘要

英文摘要

前言

对象与方法

结果

讨论与分析

总结

参考文献

综述 乙型肝炎病毒感染的宿主遗传易感性及其致癌机制的研究进展

参考文献

附录一 主要缩略词中英文对照

致谢

上一篇:学生自主学习高中物理论文提纲下一篇:高校英语教学金融专业论文提纲