前言
2022年6月9日,西南大学蚕桑纺织与生物质科学学院,家蚕基因组生物学国家重点实验室徐汉福教授团队在Nature Communications(IF 17.694)发表以单细胞分辨率解析家蚕丝腺的细胞异质性及其转录图谱的研究论文。
马艳老师为该篇文章的第一作者,欧易生物深度参与了本篇文章的单细胞测序和分析工作,其中,欧易生物巴永兵为文章的共同一作,欧易生物唐旋为署名作者。
材料:家蚕丝腺
期刊:Nature Communications
发表时间:2022年6月
方法:欧易生物10× Genomics scRNA-seq
研究背景和研究目的
天然蚕丝具有人造/合成纺织纤维无法超越的独特性能,包括机械性能、生物相容性和生物降解性。家蚕丝腺(SG)是合成和分泌构成蚕丝的两种主要成分:丝心蛋白和丝胶蛋白的独特器官。SG是成对结构,通常分为三个区域:前部丝腺(ASG),中部丝腺(MSG)和后部丝腺(PSG)。丝心蛋白在PSG中合成后转运到MSG,由丝胶蛋白进一步包裹后转运到ASG,再通过蚕丝蛋白复合体将蚕丝蛋白转化为液体蚕丝纤维,以完成吐丝。有趣地是,SG细胞有丝分裂在第25阶段(产卵后6天)后停止,表明SG在这个阶段已经完成形态建成。在此之后,SG的大小仅通过染色体内复制引起的细胞体积增加而增加。
虽然以往的研究有助于对SG的了解,但针对SG细胞的分子基础,如SG的细胞类型及其生物学功能、不同发育阶段的细胞状态、单细胞水平的基因表达谱等,仍知之甚少。因此,在单细胞分辨率上前瞻性地表征SG的分子特征,对于探究SG如何发育、蚕丝蛋白如何合成是非常重要的。
内容概述
作者针对三个时期:胚胎期(E8D),幼虫期(1L1D)和幼虫期(1LM)的家蚕丝腺进行单细胞测序(图1),测序结果得到14972个细胞,作者针对聚类后的10个细胞群进行注释,并探究这些细胞类型在丝腺不同区域的分布。此外,作者还解析了丝腺细胞的发育轨迹和相关基因表达状态。最后,作者找到了参与调控丝腺发育和丝蛋白合成的关键基因。总之,这项研究揭示了家蚕丝腺细胞异质性及其基因表达动力学变化,为在单细胞水平上深入了解产丝器官提供了依据。
图1 | 家蚕幼虫、SG以及蚕丝示意图
具体研究内容解析
1、家蚕细胞类型组成
作者针对E8D, 1L1D和1LM三个发育时期的家蚕各收集了约2000条丝腺,以确保后续单细胞解离及分析流程的顺利进行。经过严格的质控,共获得14972个细胞,使用UMAP降维聚类为10个细胞群(图2a),并针对各个细胞群中细胞数目、细胞占比以及检出基因进行统计分析(图2b)。E8D中以C1、C3、C4和C6组成为主;1L1D中以C1、C3、C4和C9组成为主;1LM则以C1、C2、C3、C5、C7和C8组成为主。同时,作者挑选各细胞群top5 marker基因以及各个群的特异性基因进行展示(图2c, d)。这些结果揭示了家蚕SG的细胞类型组成,反映了SG细胞组成的多样性。
图2 | 家蚕SG中的细胞组成
2、家蚕丝腺细胞类型鉴定
作者使用如下方案针对丝腺各个区域的细胞类型进行鉴定:
1)使用经典marker,用qRT PCR结果辅助注释细胞类型;
2)挑选各细胞群中的marker基因,用qRT PCR以及免疫荧光进行验证;
3)针对各细胞群top marker基因进行GO和KEGG分析。
ASG细胞类型组成
具体而言,基于两个ASG经典marker BMASSCP2和BGIBMGA011721和4个细胞群特异性marker LOC101746180(C5)、LOC101740197(C8)、Btl(C9)和LOC101743237(C4和C9)在特定区域的定义这四个亚群为ASG区域特有的(图3a),并经过LOC101746180(C5)、LOC101740197(C8)的免疫荧光染色结果进一步证实该结论(图3b)。进一步分析发现,C4富集到的通路“ ATP水解耦合质子转运”、“氧化磷酸化”和“mTOR信号通路”,表明该类细胞在SG发育过程中发挥供能作用。C5和C8细胞群主要在1LM中,分别富集到“多线染色体”、“多线染色体疏松团”;“几丁质代谢过程”、“几丁质结合”等通路,表明这些细胞正在经历核内复制,并且可能在吐丝过程中为官腔提供润滑和良好的通透性。
C9则主要存在于1L1D中,并富集丝氨酸型内肽酶抑制因子相关基因,表明这种细胞类型可能在蚕丝蛋白分泌前起到防降解的作用,并在蚕丝纤维形成和吐丝过程中维持蚕丝质量和内稳态。基于这些分析,C4,C5,C8和C9分别被定义为液态丝纤维化细胞(liquid silk fibrosis cells, LSFs),上皮细胞重塑细胞(epithelial cell remodeling cells, ECRs),几丁质代谢细胞(chitin metabolism cells, CMs)和牵引力细胞(traction forces cells, TRs)(图3c)。
MSG细胞类型组成
针对MSG,C3、C6和C10细胞群因为表达编码丝胶蛋白基因Ser1、Ser2和Ser3,以及细胞群特异性marker LOC101745308(C3)、LOC101740733(C6)和LOC101744718(C10),并进一步通过LOC101745308(C3)免疫荧光染色进行验证(图3a, b)。同样地,针对各细胞群 富集到的通路结果发现,C3主要参与“翻译”、“细胞质翻译”和“翻译起始”,表明该细胞群在丝胶蛋白合成中发挥重要作用。E8D特异性细胞群——C6,富集得到的主要通路有“内质网腔”、“戊糖和葡萄糖醛酸转换”、“内质网中的蛋白质加工”和“氧化磷酸化”,说明C6在蚕蛹即将孵化时SG的能量代谢中起重要作用。而C10则在1LM中占优势,富集基因与泛素依赖的蛋白质分解代谢过程、昼夜节律和长寿调节通路等相关,表明其可能在幼虫蜕皮时在MSG的特征性生理功能中发挥特殊作用。
根据这些分析,C3、C6和C10分别被定义为丝胶蛋白合成细胞(sericin protein-synthesizing cells, SPSs)、内质网应激信号细胞(endoplasmic reticulum stress signaling cells, ERSSs)和丝胶蛋白分解代谢细胞(sericin protein catabolism cells, SPCs)(图3c)。
PSG细胞类型组成
C1、C2和C7大量表达编码丝心蛋白基因fibH、fibL和P25,以及聚类特异性标记LOC101746861(C1)和LOC101743535(C7),同样通过免疫荧光染色结果进行了验证(图3a, b)。富集分析结果发现C1主要参与“翻译”和“核糖体”相关通路,说明C1在丝心蛋白的翻译和运输中起重要作用。C2主要参与“抗原加工和呈递”、“B细胞受体信号通路”和“TNF信号通路”,表明该细胞类型与丝的抗菌特性有关。1LM特异性细胞群C7富集了与细胞对营养物质的响应、多线染色体疏松团、miRNA基因沉默和自噬调节相关通路,这表明C7可能在幼虫蜕皮期的PSG中执行分解代谢相关的功能。
根据以上分析,C1、C2和C7分别被定义为丝素蛋白合成细胞(fibroin protein-synthesizing cells, FPSs)、凋亡和重塑调节细胞(death and remodeling regulation cells, DRRs)和丝心蛋白分解代谢细胞(fibroin protein catabolism cells, FPCs)(图3c)。
图3 | 鉴定SG各区域细胞类型
3、SG细胞早期发育轨迹
为进一步了解SG发育过程中的基因表达情况,作者使用拟时序进行分析。有趣地是,SG各区域的拟时序分析结果发现均只有一条路径,ASG、MSG和PSG的细胞类型沿拟时序轨迹排列清晰,表明SG三个区域的早期发育趋势是一致的(图4)。此外,作者还分析了每种细胞类型top10marker在拟时序中的表达情况。
在ASG中,LSFs和TRs在E8D出现,在1L1D增加,在1LM消失,与它们在液体丝蛋白加工中的作用一致(图4a)。RNA velocity结果表明,TRs从LSFs发育而来,而ECRs从CMs发育而来(图4b)。拟时序热图结果发现,模块1和模块2高变基因富集表皮蛋白基因(CPG6、CPH4和CPH19)、肌动蛋白相关基因(LOC101738722和LOC105841947)和有机阳离子转运蛋白基因(LOC101745503),提示这些基因可能参与了ASG中液体蚕丝蛋白转化过程。模块3中高变基因包含酶编码基因LOC101742565、LOC101746180和LOC105842186,这些酶编码基因可能为细胞代谢提供能量(图4c)。这些结果为了解ASG细胞发育轨迹提供了新的思路。
在MSG的细胞类型中,与孵化前SG营养供应密切相关的ERSSs在E8D出现,在1L1D消失,SPCs在1LM出现,SPSs则在三个发育阶段广泛分布,这表明这种细胞类型的发育更为复杂(图4a)。RNA velocity结果与拟时序结果一致,ERSSs发育为SPSs,进而发育为SPCs (图4b)。拟时序热图结果发现,三个模块中出现的基因,只有CPH21、UGT33R2、Y-d等少数基因具有明确的功能或功能注释,其他基因的作用有待验证(图4c)。
在PSG的细胞类型中,FPSs在E8D出现(图4a)。RNA velocity结果与拟时序结果一致,ERSSs发育为SPSs,进而发育为SPCs (图4b)。拟时序热图结果发现,三个模块中出现的基因,只有CPH21、UGT33R2、Y-d等少数基因具有明确的功能或功能注释,其他基因的作用有待验证(图4c)。
在PSG的细胞类型中,FPSs出现在E8D,在1LM逐渐减少,提示这种细胞类型在丝心蛋白合成中起关键作用。随着发育阶段的进展,DRRs逐渐增加,FPCs仅在1LM出现(图4a)。RNA velocity结果与拟时序结果一致,FPSs其中一小部分转变为DRRs,而其他转变为FPCs(图4b)。拟时序热图表明,三个模块中的top10基因大多数是蛋白质编码基因(图4c)。模块1和2包括编码转运蛋白(LOC733070),细胞质肌动蛋白(LOC101741610)和跨膜蛋白(LOC101737070)的代表性基因,这表明它们在丝心蛋白合成和分泌过程中起重要作用。模块3包含四个lncRNAs和两个锌指转录因子,这对于PSG中细胞命运的调节可能至关重要。总的来说,这些结果对了解PSG细胞发育轨迹提供了基础。
图4 | 拟时序分析SG三个区域细胞发育轨迹
4、SG细胞中基因表达的动态变化
家蚕的SG,尤其是MSG和PSG,具有优秀的丝蛋白合成能力,这一过程主要通过大量基因转录协调控制。作者针对检测到的基因进行gene-switch分析,以探究在不同区域SG细胞类型中基因表达顺序。针对包括top15的TFs沿着拟时序时间轴进行呈现(图5)。在ASG的细胞类型中,有199个基因失活,其中大部分是早期基因,2211个基因被激活,包括12个早期基因和2045个晚期基因(图5a)。一些早期和中期基因可能在ASG细胞中起关键作用,例如Tret129可以分解大分子物质并提供能量。在后期活跃基因中,作者发现了大量的转录因子,包括20E响应因子Br-c, E74和Hr38,它们参与调节幼虫蜕皮(图5b)。这些结果表明,ASG细胞中激活的早期和中期基因对维持ASG的基本生物学功能是必要的,而大量的晚期基因可能负责幼虫的蜕皮和变态,并且在蜕皮和变态发育过程中需要有大量的转录因子参与协调基因表达。
在MSG的细胞类型中,有47个基因失活,而有6329个基因被激活,其中早期基因32个,中期基因1487个,晚期基因4810个(图5c)。核糖体蛋白是蛋白生物合成工厂的重要组成部分。作者分析得到12个核糖体蛋白基因(例如RpS10、RpS15和RpL38)在早期被激活,表明MSG细胞在这一阶段蛋白合成过程活跃。值得注意的是,fibL、fih和P25基因在早期或中期被激活。此外,Ser1、Ser2和两个关键的TFs也在中期被检测到。从而推测,丝蛋白基因可能在幼虫蜕皮的早期和中期被激活,因为幼虫在蜕皮前会分泌少量丝蛋白来稳定它们的身体(图5d)。这些结果对揭示MSG细胞中基因表达的动态变化具有重要意义。
在PSG细胞类型中,有52个基因失活,4572个基因被激活(图5e),在被激活的基因中,早期发现fibH、Ser2被激活,晚期检测到P25、Ser1,结合在MSG细胞中的发现,MSG细胞除了丝心蛋白基因外还表达丝胶蛋白基因,而在PSG细胞中除了表达丝胶蛋白基因还表达丝胶蛋白基因,这表明早期幼虫所产生的蚕丝蛋白具有独特的功能,因此必须同时利用MSG和PSG细胞进行合成。
此外,作者发现41个lncRNAs在前期和中期表达,但有244个lncRNAs在后期表达,这意味着lncRNAs在激活基因表达中发挥了重要作用,尤其是在幼虫蜕皮过程中(图5f)。综上所述,这些结果揭示了PSG细胞中复杂的基因表达情况,提供了许多关于基因激活的见解,值得进一步研究。
图5 | SG各区域细胞中优先激活与关闭的基因
5、诱导SG细胞生长的有效策略
家蚕SG的一个典型特征是,一旦在第25阶段器官形态发生完成,细胞只进行核内复制,而不进行有丝分裂,从而导致细胞体积的增加。然而,SG细胞早期发育的调控机制尚不清楚。作者发现,从E8D到1LM, ASG、MSG和PSG细胞的体积以及细胞内DNA含量显著增加(图6a, b)。此外,1LM期SG细胞间距变窄,连接更紧密(图6a)。这些结果表明,SG的发育与细胞数量、细胞大小以及细胞内物质循环和细胞通讯调控密切相关。因此,作者决定研究在早期发育过程中可能参与调控这些过程的基因。有趣地是,在SG细胞的marker基因中,发现了大量与细胞数量调控相关的基因。例如,控制管状器官发生、细胞增殖和迁移的关键基因Btl位于膜上,并在E8D和1L1D的ASG和MSG中高表达(图6c)。
基于富集分析结果,作者确定了SG (ECRs, FPCs, CMs和SPCs)中的四种细胞类型富含与mTOR、InR、PI3K/Akt途径相关的基因(图6d),表明这些途径中的基因参与调节SG中的细胞大小。通过富集分析,我们发现一些marker基因在间隙连接、紧密连接和黏着连接中富集(图6e),提示这些基因可能与SG细胞间通讯密切相关。此外,还发现了一些与细胞自噬相关的其他通路,包括Hippo通路、MAPK和溶酶体通路(图6f)。虽然还需要进一步的实验来验证它们在SG细胞重塑中的作用,但这些结果为SG细胞早期发育过程中的生长调控提供了重要的见解。
图6 | 诱导SG细胞生长的有效策略
6、蚕丝蛋白合成的时空调控
在SG的三个功能区域中,已知只有MSG和PSG分别具有合成丝胶蛋白和丝心蛋白的能力。然而,目前还没有相关研究在单细胞水平上对参与蚕丝蛋白合成调控的基因进行分析。为了更深入地了解蚕丝蛋白合成的时空调控,作者分析了MSG和PSG细胞中的marker基因。在MSG的细胞类型中,丝胶蛋白编码基因Ser1和Ser2在SPSs和SPCs中高表达,而Ser3在10种细胞类型中均未被鉴定为marker基因,且Ser3在SPSs和SPCs中表达水平非常低(图7a),免疫荧光染色进一步证实了Ser1、Ser2和Ser3的分布(图7b)。新发现的基因Ser4编码丝胶蛋白4,在SPSs和SPCs中高表达。
这些结果表明,丝胶蛋白的合成在MSG细胞中受到不同程度的调控。其中SPSs似乎是合成丝胶蛋白的主要细胞类型,因为该群表达E8D、1L1D和1LM的所有三个基因(Ser1、Ser2和Ser4)。GO富集分析结果表明,SPSs细胞群主要富集功能为“细胞质翻译起始复合物的形成”,其中主要由真核翻译起始因子3(EIF3)的剪接异构体,在调节蛋白质合成中起着关键作用(图7c)。
在PSG的细胞类型中,丝心蛋白编码基因fibH、fibL和P25均在FPSs, DRRs和FPCs中表达(图7a)。这3个基因在3个发育阶段的表达量存在显著差异,在1L1D表达量最高,在E8D表达量最低。其中,fibH表达水平最高,P25表达水平最低(图3a)。至于1L1D幼虫吐丝,作者专注于FPSs(1L1D富含的独特细胞类型),以探究参与丝心蛋白蛋白合成的调节基因,并鉴定出大量包含在“核糖体”通路中的核糖体基因(例如RPL3–19和RPS3–21)(图7d),这表明这些基因可能有助于丝心蛋白的有效合成。值得注意的是,在FPSs中也发现了几个可能参与丝心蛋白合成转录调控的TFs,包括Ybp、ALY、Rack1和LOC692655。
一个有趣的发现是,1LM个体(DRRs和FPCs)的PSG细胞中表达了丝心蛋白基因,并且在DRRs和FPCs中检测到许多以前被证明可以调节丝心蛋白基因的TFs,包括SGF1、sage和20E信号通路的核心成员(EcR、Br-c、Hr3、E74、E75和Ftz-f1)。此外,Hippo和MAPK信号通路的核心成员,包括yki、sd、Myc、Diap1、14-3-3和Ras也在DRRs和FPCs中被发现(图7e, f)。因此,在1LM而非1L1D的PSG细胞中表达的众多TFs,反映了丝心蛋白合成阶段特异性调控的复杂性。此外,在发育早期准确抑制丝心蛋白合成似乎更为重要,这是一个值得进一步研究的有趣的生物学现象。
图7 | 蚕丝蛋白合成的时空调控
研究结论
本研究中,作者构建了家蚕SG单细胞图谱,该图谱由分布在SG的三个不同生理区域ASG、MSG和PSG的10种不同的细胞类型组成,并揭示了它们的发育轨迹、基因表达状态以及参与SG发育和蚕丝蛋白合成的代表性标记基因(图8)。本研究将有助于进一步了解家蚕SG的细胞组成和异质性,并为今后以家蚕SG为实验模型的研究提供宝贵的资源,从而加快蚕丝产生器官的发育、蚕丝蛋白合成机制的研究,甚至利用细胞特异性基因对蚕丝进行遗传修饰的研究。
图8 | 家蚕丝腺主要细胞类型组成
欢迎百度搜索欧易生物——访问欧易生物官网——了解单细胞测序技术
猜你想看
1、CELL METAB | 单细胞转录组助力解析运动促进骨形成和免疫功能的新机制
2、J IMMUNOTHER CANCER | 单细胞测序+空间转录组测序助力解析新型溶瘤腺病毒发挥多种协同抗肿瘤作用机理
3、Front Cardiovasc Med | 单细胞测序助力解析主动脉夹层中免疫微环境特征
4、单细胞测序助力解析miR-6077促进肺腺癌顺铂/培美曲塞耐药机制
原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。