图像识别和机器学习助力基因组嵌合突变检测

图灵汇官网

近日,加州大学圣地亚哥分校的研究团队在《自然·生物技术》杂志上发布了一款名为DeepMosaic的基因嵌合突变检测工具。该工具采用深度学习技术,能够比人眼更敏锐地发现基因组中的低频突变,其灵感源于对人脑神经信号处理方式的理解。

嵌合突变是指在个体部分细胞中发生的遗传突变,反映了胚胎发育、环境和衰老等因素对个体基因组的影响,也是数百种人类疾病的原因之一。由于非癌症疾病和正常人群中嵌合突变的频率较低且假阳性率较高,检测这些突变尤为困难。

现有的许多嵌合突变检测方法在特定情况下难以满足需求。这些方法大多专注于癌症相关突变的检测,并且难以区分测序过程中的误差和真实的突变。此外,研究人员经常需要人工检查原始数据,这不仅耗时耗力,还难以标准化。因此,开发一种专门针对非癌症样本和正常组织样本的嵌合突变检测工具显得尤为重要。

加州大学圣地亚哥分校的杨晓旭博士和Joseph Gleeson教授以及徐歆为共同作者,于2023年1月2日发表了研究论文《无控制嵌合单核苷酸变异检测的DeepMosaic》。DeepMosaic基于深度学习技术,能够高效检测嵌合突变。该工具已被开源,可供所有科研人员使用。

杨晓旭博士解释了DeepMosaic的工作原理。研究团队首先将原始测序数据转化为图像形式,并区分“正常”和“突变”数据,从而将一个字符串统计问题转化为图像识别问题。他们生成了多个独立的数据集,包括模拟数据和真实数据,用于训练、测试和评估DeepMosaic模型。结果显示,混合使用模拟数据和真实数据训练的模型,在独立测试集上的表现甚至优于纯真实数据训练的模型,说明模拟数据提高了模型的适应性。

研究团队还利用DeepMosaic和其他检测工具,在皮质发育不良患者样本中发现了新的致病突变,并通过手术切除患者脑组织和小鼠模型验证了这些突变的作用。这项研究为难治性癫痫的发病机理提供了新思路,并发表在《自然·遗传学》杂志上。

DeepMosaic不仅是一个突变检测工具,还可以让用户基于团队提供的平台,训练出针对特定突变检测的个性化模型。这种基于图像识别的突变检测方法有望广泛应用于更多科学研究领域,促进疾病诊断和其他基础研究的发展。

Joseph Gleeson教授指出,DeepMosaic的一个应用场景是对未知局灶性癫痫的检测。这些患者的病症很多是由嵌合突变引起的,使用DeepMosaic工具后,突变检测的阳性率显著提高,且检测出的突变均为致病突变。这为未知疾病的诊断和治疗迈出了重要一步。

未来光锥是果壳发起的一个科创品牌,旨在为科学家提供从公司注册、知识产权保护到融资需求、团队组建等全方位的服务,加速科技成果从实验室到市场的转化。如果您正在创办一家科技企业,欢迎与未来光锥团队联系。您可以发送商业计划书或其他项目资料至wlgz@guokr.com,或者添加果壳硬科技的企业微信进行私信沟通。

本文来源: 图灵汇 文章作者: 铭世博国际