基孔肯雅病毒(Chikungunya virus, CHIKV)是一种由伊蚊传播的重要虫媒病毒,可引起基孔肯雅热,其特征是严重且往往持续性的关节痛,对全球公共卫生造成重大负担。近年来,CHIKV 的暴发频率和地理范围均有所增加,凸显出加强基因组监测和快速疫情应对的迫切需求。然而,现有的公共CHIKV基因组数据库通常数据分散、注释不完整,且分析流程效率有待提高,限制了其在紧急情况下的应用价值。
近日,中国科学院微生物研究所国家微生物科学数据中心(National Microbiology Data Center, NMDC)吴林寰、马俊才研究团队在hLife发表了题为“CHIKVdb: A comprehensive genomic resource for chikungunya virus surveillance and outbreak response”的文章(图1),开发了基孔肯雅病毒数据库(CHIKVdb,https://nmdc.cn/gcpathogen/chikv)。该资源整合了来自99个国家、跨越40年的8193条CHIKV核苷酸序列(涵盖五大宿主类型)以及10,637条蛋白质序列,旨在为当前及未来的疫情响应提供支撑。

图1:论文标题及作者信息
CHIKVdb具备在线分析平台,嵌入一站式分析流程,极大简化了传统复杂流程(图2A)。其首页提供数据概览,每个指标均可链接至“序列数据概览”页,展示可搜索和筛选的元数据表格,包括分离株名称、来源、采样时间、地理来源、宿主等信息。“物种概览”子页面提供生物学与生物信息学总结以及序列分布的时空可视化;“知识图谱”子页面则展示作者与机构合作网络,以及CHIKV研究领域的精选文献与专利列表。
该数据库还集成交互式分子监测模块,用户可通过动态全球与中国地图可视化2000–2024年间CHIKV的地理传播。用户注册后还可通过“数据提交”模块上传核苷酸、基因组或蛋白质序列。
CHIKVdb的一站式分析平台包含三大核心工具(图2A):“溯源分析系统”通过序列比对与系统发育树构建推断毒株间传播关系;“SNP分析”工具可识别用户上传序列与参考序列之间的单核苷酸多态性变异;“基因型鉴定”工具则通过比对327条经实验验证的参考序列,准确判定查询序列的基因型。
基于全球数据的分析显示(图2B–2D),印度、巴西和泰国是序列数量最多的国家(分别为1530、1516和838条),宿主以人类和蚊子为主。中国序列中20%来自蚊子,显著高于其他国家;马来西亚有4%的序列来自猴子,泰国则有0.1%来自大鼠。ECSA(东中南非谱系)与ECSA-IOL(东中南非-印度洋谱系)为全球最广泛分布的基因型,其中ECSA自2020年起频率持续上升,2023年后超过93%。
系统发育分析(图2E)显示,2017年孟加拉国与2019年泰国分离的ECSA毒株聚为一支,提示两国间可能存在共同传播链,而2016年前来自印尼和马来西亚的亚太基因型毒株则形成独立分支,体现出CHIKV传播动态具有显著的时空异质性。

图2:CHIKVdb工作流程与CHIKV的全球监测分析
综上所述,CHIKVdb通过整合全球范围的基因组序列与标准化、高质量的元数据,有效填补了CHIKV监测中的关键空白。其直观的用户界面与嵌入式分析工具为传播链重建和基因型分类提供了一站式平台,克服了现有公共数据库的碎片化、注释不完整和操作效率有待提升等问题。
未来可借助CHIKVdb加强对野生动物宿主的系统采样,提升区域基因组监测能力,从而深化对CHIKV传播生态学的理解,支持制定有针对性的、数据驱动的控制策略。数据库将定期更新,以保持数据的时效性、完整性与准确性,为全球CHIKV疫情防控提供持续支持。
原文链接:https://www.escience.org.cn/news/activity-detail?id=05ffd2ca98465d9e0fb83669f7770451&code=work



