选择语言
< 返回主菜单
11.jpg

东亚人群古DNA大数据分析与人工智能的应用-

付巧妹

课题介绍

生命科学研究正转向海量数据信息的获取和收集、读取和和修复、处理和分析,基因组学技术与计算机科学、数据信息理论的融合,使生命科学的研究者们向新的研究范式转变,并带来研究广度与深度的空前进步。基因组学领域的主要分析模式被称为“数据建模”,我们将基因组相关参数输入某个模型并计算响应变量,且通过拟合优度测试或残差评估的来检验模型的效果。然而,新研究范式的转变,使基因组领域趋向另一种分析模式——“算法建模”,比如机器学习——实现人工智能的一种核心方法。目前,机器学习已为语音识别、自然语言处理和图像分类等领域带来革新。相比之下,机器学习在基因组学领域的应用,尤其是在古基因组学领域的应用尚处于起步阶段。本课题拟着重于探索机器学习方法在东亚人类古基因组数据分析和研究中的延展和应用,尤其用于对海量古基因组数据的挖掘、筛选和分析,包括准确检测古DNA特征片段、区分遗传成分差异较小的古代群体、估计现代人类基因组中残留的古人类基因片段、检测基因组中受到自然选择的区段以及人口复杂历史动态的模拟等,为我们阐明东亚现代人迁徙、扩散、融合历史等重要问题提供重要方法支撑,并为推动古基因组学领域的新方法探索和大数据时代到来提供重要助力。