4月2日,美国国立卫生研究院(NIH)主任办公室(OD)在网站上发布一份《实施更新:增强NIH受控访问数据的安全措施》文件,称自2025年4月4日起,NIH将禁止位于中国、俄罗斯、伊朗等受关注国家的机构访问其受控访问数据存储库和相关数据。
这一政策调整将对中国科研人员在数据获取、科研合作、学术发表等方面产生显著影响。医药学及生命科学从业者依赖度甚高的美国国家生物技术信息中心(NCBI)是NIH下属机构,国内科研人员后续也将无法直接使用。
南方+记者4月7日从深圳国家基因库(China National GeneBank,CNGB)获悉,面对这一挑战,中国在生物信息数据领域已构建了自主可控的数据资源共享平台-国家基因库生命大数据平台(CNGBdb),为科研人员提供了强有力的支持。目前,CNGBdb在成果发表及数据资源自主性等方面已逐渐打破国际垄断。
深圳国家基因库由国家发展和改革委员会、财政部、工业和信息化部、国家卫生健康委员会(原卫生部)四部委批复建设。由深圳国家高技术产业创新中心负责运行管理,委托深圳华大生命科学研究院开展运维工作,是服务于国家战略的重大科技基础设施之一,是世界领先的综合性生物遗传资源基因库。
据悉,CNGBdb-序列归档系统作为我国自主可控的公共核酸序列数据库,数据所有者可递交数据到CNGBdb进行归档和公开共享(支持原始数据(fastq/bam),组装数据(fasta),变异数据,代谢数据,单细胞数据和时空组数据等多种数据类型的归档),打破外国对生命科学领域数据库的垄断,从而保障我国科研工作者的成果发表,促进我国生命科学领域的健康发展。
CNGBdb一直致力于稳定、可靠、持续的科学数据存储库建设,并推动科学数据的安全共享:CNGBdb已通过CoreTrustSeal全球核心可信存储库、FAIRsharing国际认证及国际科研数据仓储目录re3data收录,支持Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science等多个国际著名出版社/系列期刊投稿发文,交到CNGBdb的数据统一进行DOI(数字对象标识符)标识。
此外,CNGBdb还成为国际科学理事会(ISC)世界数据系统(WDS)在生物信息领域的首个正式会员,显著提升了我国在国际生物科学数据领域的主权地位。
截至2025年4月,CNGBdb已归档多组学数据17664TB,支撑全球642个科研单位的科研数据汇交和共享,支持论文发表1902篇,发表期刊435种,包括The Lancet、Science、Cell等。
除了用户自主递交的数据外,CNGBdb还定期备份全球其他重要数据源(如美国国家生物技术信息中心NCBI、欧洲生物信息研究所EBI等)的公开数据,包括NCBI的基因组装数据等。CNGBdb提供文献数据,样本数据,基因数据,变异数据等多种数据的互联互通和开放使用。
用户可以通过常规数据搜索和专有科学数据库两种方式查找目标数据信息:
一、常规数据搜索功能:通过首页搜索框,使用关键词搜索9大子库中的基因、蛋白、变异等数据信息;
二、专有数据库:CNGBdb整理和收录了30余个植物、动物、微生物、疾病等方向的科学数据库,方便相关领域研究者查找和使用相关数据。
据了解,CNGBdb未来将以国家政策法规为导向,以数据安全为基本点,持续提升数据资源建设和数据应用服务力,为全球科研工作者提供更优质、可靠的科学数据服务。
采写:南方+记者 马芳
图片:深圳国家基因库
订阅后可查看全文(剩余80%)