单细胞大语言模型能够解读细胞间的“分子语言”,为探索生命本质和疾病机理开辟了新途径。不过,当前这类模型由于数据量有限以及算力不足的问题,在性能提升方面遇到了瓶颈。
为了解决这个问题,中山大学的杨跃东教授团队携手重庆大学、华为以及新格元生物科技,借助国家超算广州中心“天河星逸”的强大计算资源,利用国产智能计算芯片开发出了全球范围内规模最大的单细胞基础大模型——CellFM。
这个模型不仅集合了超过一亿个人类单细胞数据(规模相当于其他同类产品的两倍),还创建了一个拥有八亿参数的深度学习架构(参数数量远超同类产品八倍),在生物特征学习和跨数据集适应能力上实现了重要突破。
5月20日,这项研究成果被刊登在国际顶级科学杂志《自然·通讯》上。CellFM 的推出标志着国产芯片在训练大模型方面的成功实践,也是中国在生物智能计算领域的关键进展,为个性化医疗和新药开发提供了智能化的新工具。
图灵汇还提供了相关的论文和代码链接:
[论文链接]
[代码链接]
需要说明的是,文章中的外部链接(如超链接、二维码等)旨在提供更多参考信息,帮助读者节省筛选时间,但结果仅供参考。图灵汇的所有内容都会附带此免责声明。