生物统计论文提纲

2022-11-15

论文题目:生物信息中的统计模型及其仿真与应用

摘要:本文主要介绍了生物统计中的部分统计模型,以及这些模型在生物信息中的相关应用。对一种统计模型提出了两种改进方法。近年来,通过统计模型对生物信息进行分析的方法越来越流行。本文主要研究如何确定疾病相关的变异位点的问题,通过统计模型来达到这一目的。本文第一章是绪论,介绍了研究背景与研究意义,分析了国内外的研究现状。重点介绍了全基因组关联分析研究的研究进展。第二章对生物学基础知识进行了介绍,并对线性混合模型进行了详细讲解,为第三章做铺垫。第三章对线性混合模型进行的仿真。将最基本的线性混合模型进行扩展,以使得扩展后的线性混合模型可以在各种实际情形下得以应用。同时对这些应用进行了实验仿真,验证了模型的可行性。第四章提出对整合模型的改进。整合模型建立在每个变异位点的p值数据基础之上,同时利用附加信息,对模型参数进行求解。这些p值是通过前面所提到的线性模型做回归所得到的。本文改进了原有的整合模型,将GWAS数据信息与附加信息之间的关联性考虑进模型中,通过它们之间的关联性来更好的估计模型中的参数。本文使用EM算法对模型进行参数求解,通过仿真验证了模型的合理性。针对改进后的模型在处理高密度附加信息上的缺点,第五章提出可扩展的整合模型来解决此问题。扩展后的模型可以利用大量的附加信息来对模型参数进行估计,进而通过显著性水平指标来筛选出重要的突变位点。通过仿真实验,改进的整合模型和可扩展的整合模型均可以将FDR指标控制在预设的值,AUC和统计功效等指标的表现均优良。将模型应用到真实数据中,对模型求解结果进行了分析。

关键词:全基因组关联分析;统计模型;整合模型;线性混合模型;EM算法

学科专业:电子与通信工程(专业学位)

摘要

ABSTRACT

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 本文研究内容与结构安排

第二章 生物背景知识与线性混合模型介绍

2.1 生物学背景知识

2.1.1 细胞与DNA

2.1.2 单核苷酸多态性

2.2 线性混合模型介绍

2.2.1 线性模型

2.2.2 采样之间的相关性

2.2.3 线性混合模型

2.3 本章小结

第三章 线性混合模型的应用

3.1 遗传力估计

3.1.1 遗传力分析介绍

3.1.2 基于家系数据的模型

3.1.3 基于GWAS数据的模型

3.2 关联分析

3.2.1 关联分析介绍

3.2.2 基于PCA的关联分析

3.2.3 基于LMM的关联分析

3.3 患病风险预测

3.3.1 岭回归与Lasso

3.3.2 统计预测模型

3.4 模型仿真

3.4.1 遗传力估计

3.4.2 关联分析

3.5 GWAS发展前景

3.5.1 GWAS项目间联合建模

3.5.2 借助其他信息的整合分析

3.6 本章小结

第四章 整合分析模型

4.1 基因功能注释信息介绍

4.2 建立模型

4.2.1 非整合模型

4.2.2 整合模型的建立

4.3 算法求解

4.3.1 EM算法介绍

4.3.2 应用EM算法求解

4.4 改进的整合模型

4.4.1 建立模型

4.5 模型仿真

4.5.1 统计指标分析

4.5.2 参数的估计与比较

4.6 在真实数据上的应用

4.7 本章小结

第五章 可扩展的整合模型

5.1 可扩展模型的介绍

5.1.1 对附加信息的扩展

5.1.2 对GWAS信息分布的修改

5.1.3 模型分析

5.2 可扩展模型的参数估计

5.3 模型仿真

5.4 在真实数据上的应用

5.5 本章小结

第六章 结论

6.1 本文的主要贡献

6.2 下一步工作的展望

致谢

参考文献

上一篇:生态旅游计量经济论文提纲下一篇:中国式分权农业经济论文提纲