一个成年人体内大约有37.2万亿细胞,对这些生命的基本单位,人类至今还没有像掌握基因“密码本”一样,拥有一份来自细胞的全“图谱”。“这个细胞总数是一个巨大的数字,但对人体细胞分类,以及对细胞各自功能的研究,对人类疾病治疗非常重要。”
近日,深圳华大生命科学研究院刘龙奇在接受澎湃新闻(www.thepaper.cn)记者专访时表示,现阶段而言,人类细胞图谱的全面解析仍存在多项挑战,他们近年来将目光聚焦到和人的基因相似度高达93%的食蟹猕猴(Macaca fascicularis)。来自6个国家的35个科研团队首次展示了这一非人灵长类动物(NHP)的大规模细胞转录组图谱。该研究于4月13日晚间在线发表于顶级学术期刊《自然》(Nature),题为“非人类灵长类猕猴的细胞转录组图谱”( Cell transcriptomic atlas of the non-human primate Macaca fascicularis)。研究由深圳华大生命科学研究院联合北京华大生命科学研究院、深圳国家基因库、吉林大学、中国科学院广州生物医药与健康研究院、瑞典卡罗林斯卡医学院、英国剑桥大学、西班牙ICREA研究所、新加坡ASTAR等来自6个国家的研究团队联合完成。
“这个图谱就像一张‘地图’,有了它就相当于有了一个探索生命细胞分辨率的高精度仪器,可以‘看到’每个器官都有哪些细胞,还可以精细到每个细胞里具体的分子特征及与其他细胞的互作关系。”该论文第一作者、深圳华大生命科学研究院韩磊博士介绍说,“这为我们更好地认识生命的基本结构,探究疾病和细胞的关系打下了基础,也为疾病的精准治疗提供了新的方向。”
中科院脑科学与智能技术卓越创新中心主任蒲慕明院士也分析了此项研究在生物学和应用上的重要意义。他认为,作为临床药物研发重要的模式动物,未来五到十年,食蟹猴各种疾病模型将不断出现。“今天获得的数据就是一个最好的基础,是药物研发最好的数据库,是非常重要的一个里程碑。”
值得关注的是,研究团队还搭建了非人灵长类动物百万单细胞的资源网站NHPCA (https://db.cngb.org/nhpca/)。该数据库开放且具有交互式特征,刘龙奇对澎湃新闻记者表示,“可以实现用户自行探索,也可以实现用户数据和我们数据的整合。”
他强调,上述理念非常重要,也是未来细胞图谱领域的大趋势。“在未来细胞图谱体量越来越大的情况下,如何整合不同平台、不同实验室的数据是非常重要的。而如何把数据库建得更好,本身也是一个很重要的学问。”
深圳华大生命科学研究院刘龙奇博士。
人类细胞图谱挑战携带着遗传物质的细胞,我们如何窥探其奥秘?把细胞放置在显微镜下,可以观察到其形态和结构,然而科学发展至今,科学家们想在分子水平上解析细胞与细胞之间的细微差别。
单细胞测序技术的出现为深入“阅读”细胞带来了前所未有的机会。2009年,汤富酬(现任北京未来基因诊断高精尖创新中心研究员、北京大学生命科学学院BIOPIC中心教授)在博士后期间即发表了世界上第一篇单细胞mRNA测序的文章,实现了“从0到1”的跨越。这次重要的尝试开启了单细胞转录组测序的时代。
而近年来,高通量单细胞测序技术的发展也催生了“人类细胞图谱”(Human Cell Atlas)的提出。该计划提出之初主要由英美科学家主导,2017年10月,美国麻省理工学院-哈佛大学博德研究所的计算生物学家Aviv Regev、英国威康信托桑格研究所细胞遗传学负责人Sarah A. Teichmann在论文预印本平台bioRxiv发表了一篇文章,文章标题即为“The Human Cell Atlas”,系统论述了HCA的意义、目标、任务和实施路径。而在公开发表该文章的近一年之前,Regev等人在英国伦敦已召开了一次关于该计划的会议。
浙江大学医学院干细胞与再生医学中心教授郭国骥此前在接受澎湃新闻(www.thepaper.cn)记者采访时表示,作为生命科学领域近年来兴起的国际大科学计划,“人类细胞图谱计划旨在描述人体中每个细胞的详细特征,呈现不同类型细胞在人体组织的3D结构,勾勒所有人体系统的相互联系,揭示图谱变化与健康和疾病的关系。人类细胞图谱计划将彻底改善人们对疾病的理解、诊断和治疗。”
此前的2020年3月,郭国骥等人在《自然》发表了一项研究成果,他们对60种人体组织样品和7种细胞培养样品进行了Microwell-seq高通量单细胞测序分析,系统性地绘制了跨越胚胎和成年两个时期,涵盖八大系统的人类细胞图谱。郭国骥彼时表示,这项研究工作构建了人类细胞图谱的基本框架,对未来图谱的进一步完善具有指导性意义。
然而,截至目前,人类细胞图谱的构建仍充满挑战。刘龙奇对澎湃新闻记者表示,“其中最大的挑战就在于当前工具的通量和成本,这也是最直接的难点。”如果按照商业工具来算,测一个细胞的成本为几块钱,“对37万亿个细胞进行测序的成本是非常高的,不可能支撑。”
成本带来的限制还在于,相比于1990年正式启动的人类基因组计划(HGP),人类细胞图谱计划当前并没有固定的经费支持,“人类基因组计划相对来说经费比较固定,而人类细胞图谱计划现在是由各个科学家筹集经费,这一点带来很大的挑战。”
第二点挑战则在于项目目标不是特别明确。“组织相对自由,每个人有自己的研究计划,不同人的分工可能也很难做到很明确,当前都是大家根据各自感兴趣的方向来做。”刘龙奇认为,整体而言,人类细胞图谱计划目前还没有做到明确的目标和任务分工。
第三大挑战还在于各实验室之间的“壁垒”。“目前这个阶段,不同的实验室使用的工具可能会有差异,最终的结果是给大家之间的数据共享和分析挖掘带来不同的挑战。”这也源于当前整个该领域的工具还没有非常成熟。
自主可控的工具先行
刘龙奇所在的深圳华大生命科学研究院主导的这项最新研究先将目光投向了和人的基因相似度高达93%的食蟹猕猴。
研究团队在论文中写道,考虑到进化上的接近性,非人类灵长类动物(NHPs)代表了最接近人类的选择。构建一份非人类灵长类动物细胞图谱(NHPCA)将产生一份可用于研究人类生理、疾病和衰老的特征目录。这也将为人类和非人类灵长类动物之间不同身体功能的进化机制提供洞见。
当然,非人类灵长类动物也包括一个庞大而多样的物种群体,它们在生态、饮食、运动和行为方面都有很大的差异。鉴于更频繁的生殖周期、更广泛的分布等特点,特别是食蟹猕猴,其在全球常被用于以科研为目的的研究。
刘龙奇也表示,“从基因组序列来看,猕猴和人的差异相比小鼠等模式动物要小很多,这是选择猴的第一个原因;第二,如果想真正了解人类的疾病,比如帕金森、阿尔兹海默症等,你不能在人身上直接做研究,我们必须构建动物疾病模型,非人灵长类尤其在认知和神经系统疾病研究中具有显著优势。”
刘龙奇谈到,目前这类数据较少,猕猴还是一个空白,“所以这些数据的发布对于未来进行一系列的研究都非常重要,包括疾病机制理解、药物筛选等。”
单细胞建库系统DNBelab C4。
这项研究中的所有实验都使用了单细胞建库系统DNBelab C4,以及DNBSEQ系列测序平台。刘龙奇认为,在成本太高难以支撑的情况下,“工具突破是首先必须要解决的问题。”DNBelab C4即由华大智造自主研发,于2019年10月正式对外发布。此外华大智造自主拥有DNBSEQ系列测序平台,“我们在构建细胞图谱时已经有了非常显著的优势,从上游的建库到下游的测序,在工具上已经全面掌控了。”
DNBSEQ测序平台。
而如何从组织器官分离到细胞图谱产生?刘龙奇介绍道,对于用单细胞核RNA测序(snRNA-seq)分析的样本,采集后首先被保存至液氮(-190℃)中,直至进行细胞核提取。用密度梯度离心法获得较纯的细胞核,单细胞(核)悬液制备好后,通过DNBelab C4,细胞核被包裹成液滴,在液滴中完成细胞裂解及微珠捕获mRNA,有效回收微珠后,在单管中完成反转录、cDNA合成,根据高通量测序流程制备文库并进行测序及生信分析。“其实单细胞工具做的就是一件事,给每个单细胞核打上一个DNA标签,就像二维码一样,打完标签的细胞放到一起,我们就可以进行下一步的建库和测序。测完序之后我们根据标签去区分每个细胞,通过这样的过程我们就可以生成一个细胞图谱。”刘龙奇进一步形象地解释道。
这项研究中一处令人关注的细节是,少数组织样本采用了过去常用的单细胞RNA测序(scRNA-seq)技术,而大多数组织则采用了单细胞核RNA测序(snRNA-seq)进行图谱分析。
刘龙奇解释称,“首先,虽然大部分mRNA是在细胞质里面,但是mRNA是从细胞核里面转录出来,细胞核里面依然有很多的mRNA,所以从理论上来说这是可行的。”
另一个关键的原因在于单细胞核RNA测序对样本处理“非常友好”。刘龙奇提到,这项研究涉及到45个器官和组织,大多器官的样本解离上策略不一,针对每个细胞需要进行方法优化,而且当研究人员在分析全细胞的时候,一个器官里面细胞大小有差异,“比如肝,肝实质细胞较大,免疫细胞又非常小,所以在组织解离的过程中,按照传统的方法很容易丢掉一些细胞。”另外,基于液滴包裹技术的单细胞工具对于细胞大小较为敏感,“大的细胞很难包裹,小的细胞比较容易包裹,这些都会带来非常明显的偏好性。”
总体来说,细胞核大小几乎固定,在1微米左右,这一点消除了数据的偏好性。此外,无论多少个器官,研究团队可用统一的方法去分离提取,因此也消除了样本处理带来的影响。“我们把这些影响降到最低。”当然,对胰腺这样的组织,本身也难以分离出高质量的细胞,较为稳定的细胞核是唯一选择。
对于骨髓这样的游离细胞,研究团队仍然采用了单细胞RNA测序。“骨髓的细胞整体来说非常小,提核相对来讲比其他组织难度大一点,但是分离细胞非常容易。”
据刘龙奇介绍,对于单细胞测序和单细胞核测序,研究团队进行了系统的分析,“有些细胞我们既做了细胞又做了细胞核,从全局角度来看,它们的一致性大概是在90%-95%之间。但是,当你看单个基因的时候,可能细胞跟细胞核在某些基因表达上有差异。”
研究团队认为,这项研究的结果也证实了单细胞核RNA测序用于生成大规模细胞图谱的实用性。
全球首个非人灵长类动物全细胞图谱
研究团队最终基于华大自主研发的单细胞建库和测序平台,对成年猕猴的45个器官的约114万个细胞进行了单细胞测序分析。将其分成了113种主要的细胞类型和463种细胞亚类。
这也是全球首个非人灵长类动物全细胞图谱。“实际上还可以继续细分,就看研究人员希望得出多大的颗粒度,理论上可以分出上千上万种,只要能理解细胞的功能是什么。”刘龙奇认为,细胞的精细分类是后续很多研究工作的基础。
食蟹猕猴细胞图谱。
目前这张猕猴图谱为我们提供了哪些信息?研究团队选取了一些重要研究话题进行了初步的探索。其中包括,基于该图谱,他们构建了包含新冠、乙肝、狂犬病毒等126种病毒易感细胞类型的病毒数据库。这就像一本“病毒字典”,可以通过它快速查询病毒最有可能侵染的细胞类型,同时看到该细胞类型可能分布的器官。尤其值得关注的是,鉴于COVID-19大流行仍在全球蔓延,这项研究集中研究了新冠病毒(SARS-CoV-2)的受体ACE2(血管紧张素转化酶2)和TMPRSS2(跨膜丝氨酸蛋白酶2)。此前的多项研究已经证明,SARS-CoV-2进入宿主细胞是通过刺突蛋白(S蛋白)与细胞表面的ACE2结合,以及TMPRSS2裂解S蛋白而启动的。ACE2被比作为病毒入侵的“门锁”,TMPRSS2则被视作“润滑油”。
这项研究评估了它们在猕猴组织中的表达。它们分析发现,TMPRSS2在猕猴的多个组织中广泛表达,ACE2的表达相对受限。ACE2在胆囊(粘液细胞、内皮细胞、腺细胞和平滑肌细胞)、睾丸支持细胞、肾上皮细胞(主要是近端小管细胞)、肺(纤毛细胞、棒状细胞,特别是肺泡2型细胞)和肝脏(肝细胞,尤其是胆管细胞)中表达最高。
此前有研究认为,ACE2+TMPRSS2+双阳性细胞对SARS-CoV-2感染的风险较高。研究团队注意到,这些细胞在猕猴胆囊细胞中数量最多,这也与COVID-19患者发生急性胆囊炎的报道一致。而在肺和肾细胞中也观察到相当多的共表达,在其他细胞类型如膀胱上皮细胞、胰管和胰岛细胞中则观察到较少的共表达。
接下来,研究团队还对猴子和人类ACE2和TMPRSS2的表达进行了比较分析。结果显示,在这两个不同的物种中,肝脏的模式相似,而胆囊、肾脏和肺的模式更为不同。
他们在讨论环节就此分析,这项研究表明,猕猴和人类之间比较发现,ACE2和TMPRSS2在不同细胞类型中的表达分布并不相同。“这可能会影响SARS-CoV-2的发病机制研究,并可能解释为什么羟氯喹等药物尽管在体外猴细胞系中提供了有希望的结果,但在人类中却无效。”
当然,这样的例子也同样提醒,人类和猕猴之间存在靶细胞易感性的差异,尽管在神经系统疾病等方面,猕猴相比小鼠是更优的模式动物,但仍需谨慎对待实验结果。
研究还提到,除了ACE2和TMPRSS2,许多其他分子也参与了促进SARS-CoV-2与细胞表面的结合或COVID-19的发病机制。“它们在猕猴组织中的表达或共表达、其他关联和病毒与宿主的相互作用,以及物种间的差异,都可以通过NHPCA网站进行研究。”
刘龙奇谈到,新冠只是一个典型的例子,“我们构建了整个病毒易感的数据库,大家可以根据这个数据库得到乙肝病毒、狂犬病毒等对应的受体在什么器官里面存在,为疾病的临床诊断和治疗指明方向。”
值得一提的是,这项研究在华大团队的主导下,由来自6个国家35个研究团队共同完成。“研究覆盖了45个器官,每个器官都是非常复杂的,很难说有哪一个独立的团队会对每一个器官都非常熟悉,所以我们跟国际上很多非常顶尖的团队合作,去进行联合解读。”刘龙奇举例道,对肾这一器官,团队和肾脏病领域著名专家、剑桥大学临床医学院院长Patrick Maxwell教授合作,“确保我们充分理解这个器官中获得的信息。”
刘龙奇认为,这种全球合作的方式,特别是通过大科学计划组织的方式去进行联合解读,“这应该是未来细胞图谱发展的重要策略。”
研究团队同时创建了数据库。“图谱作为基本的数据,我相信国际上会有很多人使用这个图谱进行数据的挖掘,我们现在也收到了很多这方面的需求,现在的数据也都是公开的。”刘龙奇谈到,“首先,数据的体量是非常大的,一般的科研用户接触你的数据的方式,可能就是依赖一个很明确的数据库。”此外,这一数据库是交互式的。“不管懂不懂数据分析,你都可以通过鼠标点击去探索,我们现在建的是一个非常全的数据库,一方面涉及到整个数据的展示,另一方面用户对于他感兴趣的基因、疾病的表型等,都可以通过这个数据进行探索选择。”刘龙奇表示。
刘龙奇同时表示,单细胞测序领域,仍在期待在成本、性能等方面具有“降维打击”式效应的技术和工具出现。全球研究团队更好的合作,以及人类细胞图谱的实现,或许都在期待下一个质的飞跃。