基因的时空动态表达调控着复杂的生理与病理过程,因此解析基因的时空动态表达模式及其调控机制,对于理解这些生物学过程具有重要意义。然而,当前的空间转录组技术仍存在测序深度低,基因检测能力有限以及成本过高等局限性[1, 2],bulk RNA-seq仍然是转录组学研究中的广泛采用的技术手段。而现有的生物信息学工具需要同时依赖匹配的单细胞数据和空间转录组数据,才能从bulk RNA-seq中预测基因的空间表达图式[3-5]。因此,开发一种能够直接整合bulk RNA-seq和空间转录组数据,从而预测基因表达图式的生物信息学工具,成为该领域亟待解决的问题。
浙江大学医学院徐鹏飞团队长期以斑马鱼为模型,研究胚胎早期发育过程中的生物学事件以及其调控机制。2026年1月2日,徐鹏飞团队与范骁辉团队合作在Genome Biology上发表了题为“Unravelling the progression of the zebrafish primary bogy axis with reconstructed spatiotemporal transcriptomics”的研究论文。该研究开发了生物信息学流程Palette,用于整合bulk RNA-seq和空间转录组数据以预测基因空间表达图式。研究团队进一步利用Palette,重构了斑马鱼时空表达图谱(zebrafish SpatioTemporal Expression Profiles, zSTEP),并通过机器学习的方法,找出了在不同发育节点中参与调控前后轴建立与调控的关键形态发生素和核心转录因子。

研究团队首先构建了生物信息学流程Palette(图1),该流程通过整合bulk RNA-seq和空间转录组数据,能够捕获与生物学功能高度相关的基因表达图式。Palette在算法设计中综合考虑了每个空间点的分子特征以及点与点之间的空间距离,对空转数据中由于技术限制而产生的稀疏表达进行合理差补,并使表达图式更加连续和平滑,最后利用bulk RNA-seq的数据对基因的表达进行矫正。

图1 Palette流程图。
研究团队进一步利用Palette,整合了三个发育阶段共53张连续切片的斑马鱼bulk RNA-seq数据、已发表的斑马鱼空间转录组数据[6]以及活体成像数据[7],成功重构了斑马鱼时空表达图谱(zebrafish SpatioTemporal Expression Profiles, zSTEP)(图2)。

图2 重构后的斑马鱼时空表达图谱zSTEP。
在此基础上,研究团队进一步采用了随机森林的模型进行分析(图3)。研究人员分别将每个空间点内所有形态发生素和转录因子的表达作为变量,而该点在前后轴上的空间位置作为观测值,对模型进行训练,从而系统鉴定出决定细胞在前后轴空间定位的关键形态发生素和核心转录因子。

图3 通过随机森林的方法筛选关键形态发生素和核心转录因子。
浙江大学徐鹏飞教授,范骁辉教授和廖杰博士为本文的共同通讯作者,浙江大学医学院董洋博士为第一作者,程涛博士和刘祥博士为共同第一作者。相关工作得到了科技部重点研发计划、国家自然科学基金等项目的资助。
参考文献
1. Wang, R., et al., Integration of computational analysis and spatial transcriptomics in single-cell study. Genomics Proteomics Bioinformatics, 2022.
2. Cable, D.M., et al., Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol, 2022. 40(4): p. 517-526.
3. Liao, J., et al., De novo analysis of bulk RNA-seq data at spatially resolved single-cell resolution. Nature Communications, 2022. 13(1).
4. Xu, H., et al., SPACEL: deep learning-based characterization of spatial transcriptome architectures.Nat Commun, 2023. 14(1): p. 7603.
5. Baul, S., et al., Integrating spatial transcriptomics and bulk RNA-seq: predicting gene expression with enhanced resolution through graph attention networks. Brief Bioinform, 2024. 25(4).
6. Liu, C., et al., Spatiotemporal mapping of gene expression landscapes and developmental trajectories during zebrafish embryogenesis. Dev Cell, 2022. 57(10): p. 1284-1298 e5.
7. Shah, G., et al., Multi-scale imaging and analysis identify pan-embryo cell dynamics of germlayer formation in zebrafish.Nat Commun, 2019. 10(1): p. 5753.



