为40000000000000个细胞“写家谱”

广东科技头条 2025-03-28 07:00

由一颗受精卵分化为约40万亿个形态功能各异的细胞,再紧密地组织成一个人体,其中规律到底由谁写定,又由谁执行?我国科学家正在广东布局“国之重器”,回答“生命之问”。

3月25日,由中国科学院广州生物医药与健康研究院(下称“广州健康院”)牵头建设的“十四五”重大科技基础设施——人类细胞谱系大科学研究设施(下称“细胞谱系设施”)在广州国际生物岛正式启动建设,建成后有望将人体每一个细胞的全生命周期动态演化过程进行数字化刻画,进而探索人类发育、患病、衰老的奥秘。

为什么要给细胞“写家谱”?研究细胞谱系将如何改变我们的生活?别急,故事可以从线虫说起——

编写“细胞家谱”

获得2002年诺贝尔生理学或医学奖的英国生物学家约翰・萨尔斯顿,因一番“笨功夫”变得世界闻名。

他曾连续18个月,每天上两班、每班4小时,就待在一个小房间里,拿显微镜观察一种线虫。观察之余,萨尔斯顿每隔5分钟就画出显微镜下的现象:从1个受精卵开始,1变2,2变4,形成胚胎,最终发育成线虫。

他笔下的“线虫细胞画”,精确地描绘了671个细胞的出生、111个(或113个,取决于线虫的性别)细胞的死亡。每个细胞都可以追溯到其母细胞,一直往上追溯到受精卵。

后来,萨尔斯顿等人根据这些图像和其他信息,形成了秀丽隐杆线虫从受精卵到成体的细胞谱系,完整记录了近千个细胞的命运。

萨尔斯顿的成功,既得益于他选对了线虫这种生命周期短、个体小的模式生物,也得益于他18个月如一日,几乎从不分心的枯燥观察。

要突破人类知识的边界常常要下“笨功夫”。研究人类细胞谱系,某种程度上也是一种“笨功夫”。

细胞是生命的基本单元,人体由约40万亿细胞组成,这些细胞从一个受精卵开始,所历经增殖、分化直至衰老的全生命周期动态演化过程,就是“细胞谱系”。

再通俗一点,想象我们把组成人体的每个细胞逐一拎出来,各拍摄一部全生命周期的“纪录片”,再收集整理归档。这个巨大的资料库就是人类细胞谱系,而“片场”就是细胞谱系设施。

“这就像为生命编写一部详尽的‘细胞家谱’,让科学家乃至公众能够清晰追踪每个细胞的‘前世今生’。”广州健康院副院长(主持工作)、研究员,细胞谱系设施总指挥孙飞介绍,该设施将以样品保活存储、空间多组学、先进成像等创新技术和装置研发为核心,集成人工智能等前沿技术,创建出涵盖发育、疾病、衰老三大维度的数字化细胞谱系。

在这份多组学的细胞谱系里,不仅有每个细胞的生命历程,还记载了细胞所处的位置、可以生成的蛋白质、内部的微细结构等;不仅包括成年人的细胞,还包括从受精卵开始到人体不同生理阶段的,发育中的、患病了的、衰老中的细胞。

再以刚才提到的线虫细胞谱系图为例,其中包括的主要是影像数据。而细胞谱系设施,目标是记录下影像组、表观组、转录组、空间组、蛋白组、代谢组、超微结构组7大类数据。

研究这7大类数据,就是从7个维度研究生命。比如,转录组就是在研究细胞中遗传信息从DNA流动到RNA的情况,而表观组则是研究遗传信息解码如何被调控;影像组能显示细胞在不同状态下的结构,而空间组则提供了这些细胞在人体组织中的空间分布。

随着这些数据逐步丰富,科学家们有望揭示生命发育与演变的奥秘,探索疾病发生的根源,发现操作生命活动因果的钥匙。

细胞谱系设施(效果图)。

细胞谱系设施(效果图)。

打造“全息扫描仪”

研究细胞谱系,就是要把人体细胞数字化。但面对40万亿个细胞,没有人能够仅仅通过显微镜、画笔来完成记录。

细胞谱系设施中的高精尖仪器,可以帮助科学家完成这些“笨功夫”。

在2023年发布在国际顶尖学术期刊《细胞》上的一项研究中,我们可以一窥细胞谱系研究的方法——

在该项研究中,科学家们从猕猴的大脑皮层获取161张厚度只有10微米(头发丝的直径为60微米左右)的薄片,再采用时空组学技术对薄片“拍照”,采集数据。

这不仅能准确记录下每个细胞的位置和形状,还能捕捉每个细胞里面的mRNA分子。mRNA分子是生命活动的信使,能帮助科学家理解细胞在做什么。

对所有薄片进行数据采集后,科学家把这些信息重组为一个三维模型,在数字世界里还原出一个精确的猕猴大脑。这个数字大脑有着极丰富的信息容量,为模拟猕猴大脑的生理活动奠定了基础。

数字大脑背后,是106名研究人员通力合作2年,留下的超过300000G数据。这仅是研究一个猕猴大脑的工作量,而细胞谱系设施的目标是整个人体。

待细胞谱系设施建成后,科学家们也将用类似方法研究人体细胞,但不仅是空间多组学测序,还包括核磁共振成像、CT、光学相干断层成像、数字全息成像、亚细胞原位测序、质谱等多种技术。

人体组织进入细胞谱系设施后,会根据不同需要,被安排到不同的“流水线”上。

有一些组织会被制作成“保活切片”,以完成一些特定任务。比如,针对一些关键部位要开展“微观摄影”,获取超微结构组数据;为了进行单细胞测序,要用仪器将细胞逐个分离,并单独测序。

另一些组织会被制作成“冰冻切片”,完成空间组学分析、原位亚细胞测序等任务。还有一些组织则会被作为活细胞保存起来,最终用来验证数据的准确性。

总而言之,细胞谱系设施就像一台“全息扫描仪”,科学家们希望用上一切手段,尽可能记录下细胞的信息。

同时,细胞谱系设施还将是一个“超级图书馆”,能把上面采集到的数据进行标准化存储和处理,为每个细胞开辟一本“档案”。

根据目前的设计,该设施的设施楼将建成一座地上6层,地下1层的“黑灯工厂”,里面的仪器可以在无人看管的状态下自动完成样本处理、储存、成像分析等全流程的工作。

“生命科学研究领域有一个问题,就是在不同的实验室、不同操作者手中,实验结果存在一定的偏差。在大数据、大模型的时代,这种偏差会导致大模型的性能下降。”广州健康院研究员、细胞谱系设施副总指挥兼总工艺师陈捷凯认为,生命科学与人工智能高度结合,要求提高数据的一致性,也就倒逼着工艺的统一性,“为了建好这个标准化的‘工厂’,我们前期做了大量工作,优化了大量关键步骤,以保障采集到的数据都是高质量的。”

数字生理人(概念图)。

数字生理人(概念图)。

孕育“数字生理人”

细胞谱系设施位于广州国际生物岛,规划建设周期4.5年,总建筑面积超5万平方米。从上方俯瞰沙盘模型,设施楼由三个不太规则的椭圆形组成,宛若正在分裂中的细胞。

这个项目确实“三生万物”。在即将催生的无数新事物中,最吸引人眼球的要数“数字生理人”。

“要让人在数字空间里活起来。”陈捷凯说。就像是上文提到的数字猕猴大脑,不仅有形态,还要有生理功能。

科学家们计划在数字世界中构建一个高精度单细胞级别的数字生理人,它可以在数字世界中模拟人体细胞生理过程。

通过多模态数据整合,数字生理人就像是汇总了人体的“说明书”。而通过动态模拟和AI大模型驱动,科学家可以把数字生理人当做一个复杂的“人体沙盘推演系统”,在上面构建细胞间的交互机制,让数字生理人具备预测疾病演变和药物反应的能力。

说得直白一点,科学家们能使数字生理人患上“数字病”,并给它试“数字药”,以增进人类对疾病的了解。

“我们希望在一两年内构筑出数字生理人的雏形,可以理解为1.0版本。待设施建成后,根据获得的新数据,我们将继续升级到2.0版、3.0版,提升其性能,加速与产业对接。”陈捷凯说。

越来越多的数据能孕育越来越好的数字生理人,从而越来越精确地在数字世界中预见我们的健康。

孕育中的数字生理人,只是细胞谱系设施将要取得的其中一项成果。

“细胞谱系设施正式启动建设,其中涉及的仪器设备有超过80%属于自主研发。这些新设备在建设的过程中就能实现转化,推动相关产业的发展。”孙飞表示,细胞谱系设施的建设过程中将秉持“沿途下蛋”的理念,产生一系列科技成果,“主要可以归类为四个方面。一是科学仪器,二是先进的试剂,三是人工智能与生物医学相结合的软件算法等,四是高质量的生物医学数据。”

细胞谱系设施(效果图)。

细胞谱系设施(效果图)。

让医疗变成“量体裁衣”

作为粤港澳大湾区首个生命科学领域的国家级大科学装置,细胞谱系设施有一个官方别称——扁鹊。

以古代神医为名,细胞谱系设施最终将服务于人民生命健康。

在创新药研发领域,有一条无人不知的“行规”——一款新药想成功上市,平均要耗时10年、耗费26亿美元。而且,有90%的药物会倒在临床试验阶段之前,最终能上市的不足10%。

创新药研发为什么这么难?陈捷凯认为,原因之一在于药物研发过程是在动物模型中进行的。一个全新的化合物,无论用在小鼠、猴子、巴马香猪等动物身上的效果再好,仍然有可能在人类身上折戟沉沙。

而通过数字生理人,科研人员有望“换道超车”,突破药物研发的“死亡之谷”,极大提升药物研发的效率和成功率。

通过在数字生理人身上回溯、模拟、预测疾病细胞的谱系演化,科学家可以精准找到诱发疾病的关键靶点,研究致病机理,寻找有效的化合物,把筛选过程从“大海捞针”变为“有的放矢”。

在药物分子设计、结构优化等环节,人工智能已经能帮上许多忙。设计出药物后,科学家可以制作成“数字药”,在数字生理人上测试药效,并进行药物分子动力学研究和安全性评估等。

这种全新的药物研发方式,将极大提升药物研发在临床试验阶段的成功率。

再大胆一点,想远一点。在技术更成熟的未来,临床医生可以用病人的细胞信息,制作出一模一样的“数字孪生患者”,在其身上尝试不同的治疗方案,看看哪种方案的效果更好。

治疗疾病有如“量体裁衣”的未来,值得我们期待。

近几年,个人基因检测服务逐步普及。在肺癌治疗中,患者一般要先进行基因测序,了解自己的基因型,才能帮助医生找到更安全有效的治疗方案。

这可以追溯到上世纪90年代启动的人类基因组计划。正因为有了科学计划打下的基础,基因检测才能成为现实,并且逐步改进技术、降低成本,走入寻常百姓家。

细胞谱系设施所期望达到的也是这样一个未来,这不仅关乎科学理想,也链接着全民健康。

细胞谱系设施是广州市构建“2+2+N”科技创新平台体系的重要内容之一。汇聚了广州国家实验室、细胞谱系设施和生物岛实验室等高端平台和大科学装置的广州国际生物岛,将吸引全球顶尖科研人才和团队进驻,开展科学研究与学术交流,为新型颠覆性医疗技术的诞生奠定基础,催生万亿级生物医药产业集群。

“铸大国重器,护人民健康。这是我们的使命,也是我们的荣耀。”孙飞说,“以建设人类细胞谱系大科学研究设施为契机,广州健康院将坚持走基础研究与应用研究并重融合的道路,以高水平基础研究提升学术水平、社会影响力和国际影响力,打造人才高地,为可持续应用研究赋能;以高质量应用研究提升科技成果转化能力,打造高技术蓄水池,持续为产业界供给创新技术,促进生物医药与健康产业高质量发展。”

00:39

南方+镜头带你走进广州最新国家级大科学装置

文字:南方+记者 钟哲

摄影:许舒智

剪辑:徐昊

策划/统筹:张志超

编辑 蒲思伊
校对 何翠莹

订阅后可查看全文(剩余80%)

手机扫码打开本网页
扫码下载南方+客户端