En 生科百年 内网 新内网

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的极速模式浏览,或者使用谷歌、火狐等浏览器。

下载Firefox

Small Methods | 高歌实验室提出面向大规模异质性空间转录组学切片的表征与解析新方法

日期: 2025-02-12

生命是细胞有序排列构成的整体。单个细胞在脱离生物体后难以独立发挥功能。因此需要联合细胞所处的微环境和空间位置来全面理解细胞功能。随着近年来空间组学技术的迅猛发展,已经基于多种技术平台产生了大量来自不同组织、器官的空间组数据,如何精准表征这些快速增长的海量大规模异质数据不仅是相应计算模型方法开发的基础,也是有效解析其中蕴含丰富生物医学信息的前提。

针对上述挑战,必赢bwin线路检测中心/昌平实验室高歌课题组提出了面向大规模异质性空间转录组学切片的表征与解析方法PASSAGE。有别于当前方法主要关注于单个或数个切片中细胞级别特征,PASSAGE提出的基于多层次注意力的大规模异构空间组学表征方法从空间组切片(slice)、细胞与分子多个层次进行不同粒度的表征学习与解析,有效增强了计算效率和可扩展性。具体来说,PASSAGE在基于图注意力自编码器的细胞级表征基础上设计了注意池化层(attention pooling layer),将同一切片的所有细胞加权融合成切片级表征,而后通过由表型信息指导的对比学习策略对切片级表示进行优化,并进而采用非负矩阵分解方法获得基因级别的注意力分数,从而实现对特定表型关联空间组学特征的有效解析(图1)。

1 PASSAGE模型的结构示意图

如针对来自两个不同空转平台(STVisium)、42个不同病人的103张乳腺组织与乳腺癌切片,PASSAGE不仅有效处理了不同样本之间存在的批次效应,从而准确识别出不同病人切片中与乳腺癌组织相关的空间区域(图2a)。与此同时,PASSAGE引入的分子水平注意力表征可从注意池化层权重中获得与表型高度相关的基因集,如乳腺癌案例中识别的基因在之前的乳腺癌研究中已被发现与疾病进程高度相关,从而增强了模型的生物学可解释性(图2b)。

2 A) PASSAGE在乳腺癌案例中成功学习到良好的切片级表征与所识别的表型关联空间特征 B) PASSAGE在乳腺癌案例中成功学习到与表型关联空间特征高度关联的基因集

值得指出的是,上述多尺度表征学习架构使得PASSAGE可以有效实现针对大规模异质性空间转录组学数据的表型相关组学特征系统解析,一张常规4090消费级别GPU卡的算力即可达到平均每分钟600个空间点/细胞的处理速度。

本研究由中国科学院广州生物医药与健康研究院彭广敦实验室研究生郭臣凯于高歌实验室进行访学期间,与实验室博士生夏辰睿合作完成。必赢bwin线路检测中心/昌平实验室高歌教授、曹智杰博士和中国科学院广州生物医药与健康研究院彭广敦研究员为该论文共同通讯作者。研究工作得到了国家自然科学基金(32270854)、中国博士后科学基金特别资助(2023T160009)、国家自然科学基金青年学生基础研究项目(博士研究生,323B2017)、以及基因功能研究与操控全国重点实验室、北京未来基因诊断高精尖创新中心和昌平实验室的支持。相关论文202525日于期刊Small Methods Single-cell and Spatial transcriptomics专辑应邀在线发表,全部代码均已开源发布于https://github.com/gao-lab/PASSAGE

论文链接:https://doi.org/10.1002/smtd.202401451

代码链接:https://github.com/gao-lab/PASSAGE