4 月 27~28 日,第四届工程生物创新大会暨第二届中国合成生物学学术年会暨首届亚洲合成生物创新大会在深圳光明科学城成功举办,本次大会以“合成生物:未来生物经济的引擎”为题。
清华大学化学工程系长聘副教授、聚树生物科学创始人张翀出席大会并发表了精彩演讲。
“回顾工程细胞百年的历程,从时间换空间到技术换空间,未来,我们期待数据能够成为细胞构建的重要驱动力。”
以下为张翀完整版演讲内容,经少量编辑、修改后发出。
我今天汇报的题目是 《超高通量技术赋能工程细胞系统智创》。 我来自清华大学化学工程系,同时也是聚树生物的科学创始人。
今天我们的主题是合成生物驱动制造。生物制造的驱动力是什么?2021 年诺贝尔物理学奖得主乔治·帕里西说过,生物学正在经历一个巨大的转型时期:对大量超比例增长的数据进行识别,使定量研究方法的使用不仅成为可能,而且是必不可少的环节。 回顾工程细胞百年历程,从最初的时间换空间,到技术换空间,未来,我们期待数据能够成为细胞构建的重要驱动力。
这个百年的历程从 1928 年弗莱明发现青霉素开始,人类第一次开始有意识地纯培养微生物做生物制造,后面我们有了基因工程、经典代谢工程、系统代谢工程等一系列进展,我们发现工程细胞的选育技术经历了百年的演进。从发展的历程来看,工程的对象逐渐地从细胞外到细胞内,从细胞单个基因,到系统甚至基因组层次。所谓育种的本质是什么?从工科人的视角来看,就是根据表型需求设计基因型,其中表型是产量、产率、转化率等生物制造关心的工业参数,基因型简单讲就是 A、T、C、G,包括了基因表达、抑制、敲除,单碱基突变等等。
实际上经过那么多年的探索,我们对于工程细胞基因型-表型关联的认知,依然是非常少的。目前典型的微生物细胞工厂,我们在构建它的时候,也仅仅用了非常少量的已知生物学信息。事实上,微生物全基因组范围内还有巨量的未知大陆需要我们去开发。 如果我们有一张与目的表型相关联的全基因组图谱(GPA),将会为工程细胞的设计和构建提供重要的数据资源。
怎么实现这件事?如果以传统的方式来做,我们需要对基因组范围内的基因逐个的进行研究,随着生物技术的发展,我们有没有可能做到更大规模的研究?我们要感谢 CRISPR 技术 的到来,CRISPR 让我们能够在全基因组水平上的任意位置,可定制、可编辑、可追踪地进行基因编辑、抑制、激活、敲除等基因组扰动的状态;我们还要感谢核酸 合成技术, 让我们能够基于全基因组设计的 gRNA,非常便宜地获得实体 sgRNA 文库,从而获得覆盖全基因组的工程细胞文库。
我们知道,一个典型的工业微生物,它的基因超过 4000 个,如果我们对每个基因进行 10 个位点的干扰或激活,文库会达到 4 万,我们就不可能一个一个地测,而是需要用混合的方法。考虑到混合文库的覆盖度,大概需要做百万量级的测试,才有可能实现这个全基因组规模和表型关联的研究。
面对这个问题,我们把液滴微流控技术应用于表型筛选上。实际上微流控是一个老技术,我们可以把液滴看成是微小的生物反应器,利用装备手段,把液滴控制在皮升、纳升和微升的不同量级,可以很容易的在单次实验实现百万量级的单克隆培养。同时,还可以通过液滴微注入、分选等各种不同层面的操作,最终实现目的表型的超高通量分选。
如果做一个简单的比较,相比于基于孔板做表型测试,液滴微反应器在通量、成本降低等方面都具有非常显著的优势。同时,我们也注意到,在孔板体系里做培养的时候,菌株的溶氧和混合往往会受到一定的限制,在液滴体系里,溶氧和混合非常均一,这让我们有更好的机会测试特定代谢物或生长表型的工业表型。
目前,我们已经将这项技术应用在不同类型的工业微生物,通过全基因组规模无偏的挖掘与目的工业表型关联的位点,具有典型的专利“三性”的特征:一是挖掘的往往是新颖的位点,因为前人没有在全基因组范围这样做过;另外,这些位点往往对于特定表型具有意想不到的效果,具有创造性、实用性的特征。我们希望通过这样的方法论,为新一代具有自主知识产权底盘细胞的创制提供强有力的技术支撑。
接下来简单介绍一下基于这个方法的技术体系我们产业化方面在做的事情。聚树生物成立于 2022 年,是一家基于超高通量技术的微生物和 CHO 底盘的工程生物学细胞创制平台与产品研发公司。我们以超高通量“小设施”平台为基础,进一步搭建了工程细胞构建与测试、中试转化等自动化“大设施”,可实现百万级通量的底盘细胞快速迭代优化。同时,结合全基因组代谢网络模型和深度学习等数据科学手段,建立了数据-机理混合驱动的工程细胞智慧设计平台,绕开现有理性设计知识局限性,实现工程细胞定制化设计与构建,平衡了数据通量与丰富度。目前,我们在北京市昌平区建立了第一期平台,具备一体化的全基因组规模测试、自动化基因编辑,以及小试和工艺优化能力。
另外,我们从全基因组范围深度挖掘传统分子生物学手段难以触及的与目标表型关联的未知基因,与 GEM 模型整合,捕获工程细胞工业表型关联基因数据集,以建立标准化、集成化的可重用主题数据库。目前,我们已经可以在不同工程细胞的层面上产生高通量 GPA 数据。基于生物调控的图数据网络,我们希望通过清晰和规范的数据,提供标准的 GPA 数据的定义和接口,并结合 GEM 模型实现数据的解读和可视化,为工程细胞的改造提供辅助决策系统。
当然,除了工业微生物领域,我们对哺乳动物细胞合成生物学领域也充满期待。众所周知,CHO 及 HEK 这样的工程细胞在生物医药领域具有重要价值,细胞株是生物药生产链条中非常重要的上游基础设施,但是,这方面我们仍受制于人,国内自主知识产权的优质细胞株长期空缺。聚树生物正着力开发集高通量基因组 CRISPR 编辑、高通量表型和工艺筛选及多组学数据模型为一体的工程化哺乳动物细胞构建流程,通过对哺乳动物细胞系全基因组的深度开发,来实现治疗性蛋白制造平台在技术上的突破。
我们也知道,传统的 CHO 或 HEK 体系的开发流程基本上是基于单克隆的逐级筛选,最终实现工艺优化。在基因型-表型层面上能够获取多样性细胞株能力的情况下,我们也希望整合一个大上游平台, 把细胞的高通量分选、工艺筛选和多组学研究整合在一起,从宿主细胞池开始,就能判断其工艺的可持续性和最终产品的可制造性,这种大上游平台对于 CHO 细胞的制造来说,将会是整合合成生物学和工艺端的研发新范式。
目前我们在 CHO 细胞上具备了基因编辑和改造及高通量表型筛选的能力。无论是蛋白质的产量、质量,还是在细胞生长的 profile 层面,都具备百万级高通量的能力。结合我们的 GPA 模型,在去唾液酸化、半乳糖基化等方面,我们也具备模型开发能力。
最后,对未来的构想做个总结。随着我们对 GPA 数据的挖掘、获取与模型整合能力的提升,这都将有助于我们实现基于 GPA 数据的未来制造,包括通过对微生物与哺乳动物细胞底盘优化,开展一系列覆盖大健康、生物基化学品/材料、生物农业和未来食品等领域产品的自主研发及产业化推广,面向全球打造下一代超高通量 CHO+ 微生物底盘工程生物学蛋白生产平台,这也将是我本人与团队努力的方向。