厦门免费医学论文发表-敲除小鼠乳腺基因调控网络的单细胞分析

2025-07-24

厦门免费医学论文发表-敲除小鼠乳腺基因调控网络的单细胞分析


阿克沙特·古普塔,黄丽琳,刘金鹏,陈珂,任旭 ,吴伟


抽象

脯氨酰羟基化由胶原蛋白脯氨酰 4-羟化酶 (P4H) 催化,是参与胶原蛋白生物合成的关键翻译后修饰。P4HA1是P4H的亚型,在稳定缺氧诱导因子-1α(HIF-1α)中起着重要作用。P4HA1 在高度侵袭性的三阴性乳腺癌中经常上调,并与肿瘤进展、转移和化疗耐药有关。在这项研究中,我们通过分析两个小鼠组(对照组 (5Ht)和 P4HA1 敲除 (6Ho) 小鼠基底上皮细胞中的基因调控网络 (GRN) 来研究 P4HA1 在小鼠乳腺中的作用。具体来说,我们采用单细胞网络推理方法,将单细胞RNA测序与SCENIC管道相结合,并结合多种验证策略来构建每个小鼠组的基底上皮细胞特异性基因调控网络(GRN)。尽管单细胞数据存在固有挑战,但我们的方法在两个小鼠组中确定了可靠且可重复的 GRN 模式。基于这些模式,我们在两个小鼠组中鉴定了具有相似调控特征的基底上皮细胞亚簇,以及对照小鼠中具有P4HA1缺陷6Ho小鼠中不存在明显调控模式的独特亚簇。这个独特的亚簇表现出干细胞发育和炎症反应途径的同时激活,表明 P4HA1 在调节这些与癌症发生和进展相关的生物过程中的作用。我们通过多种方法验证了这些发现,包括使用多个外部数据集的计算机验证以及实验验证。鉴于 P4HA1 的缺失可能会破坏干细胞发育和炎症反应,我们的结果表明,靶向 P4HA1 可能为乳腺癌治疗提供一种有前途的治疗策略。


作者总结

在这项研究中,我们使用单细胞网络方法研究了 P4HA1 在调节小鼠乳腺基底上皮细胞转录程序中的作用。P4HA1 是参与胶原蛋白生成的关键酶,对于维持正常组织的结构至关重要。然而,它还有助于稳定对低氧水平做出反应的缺氧诱导因子 1α (HIF-1α) 蛋白,这种情况常见于各种癌症。我们生成并分析了单细胞RNA测序数据,以了解P4HA1在两组小鼠中的调控作用:一组具有P4HA1的单个功能等位基因,另一组具有敲除P4HA1基因。我们使用 SCENIC 管道构建了两组基底上皮细胞的基因网络。由于单细胞数据中固有的复杂性和噪声,我们采用了多种验证策略来确保两个小鼠组的网络中识别的调控模式和结果是可靠和可重复的。我们的结果表明,P4HA1基因在干细胞发育和炎症相关途径中起着重要作用,这对于组织形态发生和修复以及癌症进展至关重要。仅在具有 P4HA1 的对照小鼠中鉴定出的一个独特的基底上皮细胞亚簇显示出干细胞和促炎过程的同时激活,表明该细胞群在调节这些重要的细胞过程中发挥着重要作用。我们的工作为P4HA1如何作为乳腺发育的关键调节因子以及减缓或预防侵袭性癌症进展的潜在靶点提供了新的见解。


数字

Fig 7图1图2图3图4图5图6图7图1图2图3

   

引文: Gupta A, Huang L, Liu J, Chen K, Xu R, Wu W (2025) P4HA1 敲除小鼠乳腺基因调控网络的单细胞分析。公共科学图书馆基因 21(7): 电子邮件1011505。 https://doi.org/10.1371/journal.pgen.1011505


编辑 器: James G. Jackson,美国杜兰大学医学院


收到: 2024 年 11 月 16 日;接受: 2025 年 6 月 23 日;发表: 7月 22, 2025


版权所有: © 2025 Gupta 等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。


数据可用性: 原始 scRNA-seq 数据可在基因表达综合 (GEO) 数据库 (GSE301994) 中找到。处理后的 scRNA-seq 数据和代码可在 https://github.com/AkshatGupta-CB/P4HA1-KO-Mammary-Gene-Networks (DOI: https://doi.org/10.5281/zenodo.15765181) 获得。


资金: 这项工作得到了美国国家科学基金会(WW 的奖项编号 1955532)、美国国立卫生研究院(RX 的 R01CA207772、R01CA277946 和 R01CA274981)以及 TC Biopharm(WW)的资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。


利益争夺: 提交人声明不存在竞争利益。


介绍

脯氨酰羟基化是一种关键的翻译后修饰,主要通过影响胶原蛋白生物合成来增强蛋白质折叠和稳定性[1]。这种修饰是由胶原蛋白脯氨酰 4-羟化酶 (P4H) 催化的。我们和其他人已经表明,P4HA1(P4H的亚型)可增强缺氧诱导因子-1α(HIF-1α)的稳定性,HIF-1α是细胞对缺氧反应的重要调节因子,可促进血管生成、癌症转移和化疗耐药[2,3]。P4HA1在癌症中经常上调,特别是在三阴性乳腺癌(triple-negative breast cancer, TNBC)中,这是一种预后不良和侵袭性生长相关的亚型[4,5]。


据报道,基底上皮细胞在正常乳腺中起着至关重要的作用,它们与组织微环境的相互作用可以影响乳腺形态发生[6,7]。在这项研究中,我们旨在研究 P4HA1 在两个不同小鼠组的小鼠乳腺 (MMG) 基底上皮细胞中的作用。第一组称为 5Ht,具有 P4HA1 的一个功能性等位基因并作为对照,而第二组称为 6Ho,具有 P4HA1 敲除,其中 P4HA1 表达在基底乳腺上皮细胞中被沉默。


单细胞RNA测序(scRNA-seq)数据集的出现和广泛采用刺激了各种用于重建基因调控网络(GRN)的推理方法的发展[8]。GRN是生物系统的图形表示,其中节点代表基因,边缘表示这些基因之间的调控相互作用[9],为了解细胞行为背后的复杂调控机制提供了见解。然而,长期以来,使用单细胞转录组学数据生成和推断GRN一直具有挑战性。随着scRNA-seq数据量的增长,有效和可靠的网络重建变得越来越重要。特别是,SILGGM方法利用高斯图形模型(GGM),通过将网络估计问题转换为精度矩阵的稀疏估计来估计基因之间的条件依赖性[10]。信息合并的高斯图形模型方法通过整合现有研究的先验知识,使用惩罚来平衡观察数据与补充信息,从而增强了传统的 GGM。这种方法自适应地包括可靠的基因连接,同时降低了潜在不准确信息的权重,提高了推理的准确性和鲁棒性[11]。另一方面,信息论方法使用互信息等措施来捕获基因之间的线性和非线性关系[12]。通过考虑高阶相互作用和多变量依赖性,PIDC等方法可以通过识别跨基因组的协同和冗余信息来推断更复杂的调控网络[12,13]。布尔网络方法将基因建模为二元变量,它们的相互作用使用逻辑运算符进行建模;该方法通过异步更新模拟状态转换来捕获GRN的动态行为[14]。


在几项基准研究[8,15]中,SCENIC [16]已成为一种稳健且可扩展的单细胞数据基因网络推理方法。具体来说,SCENIC 首先利用非线性、非参数模型(例如梯度提升回归)来推断基于共表达的网络。然后,它使用基序富集分析来识别转录因子 (TF) 及其直接靶基因,将共表达网络细化为调节子(指 TF 及其靶基因的统称)。最后,使用曲线下面积 (AUC) 指标测量单个细胞中这些调节子的活性。该指标根据细胞中的所有基因的表达水平对其进行排名,并检查调节子中的基因是否接近该排名的顶部。调节子中基因的排名越高,该调节子在该细胞中的活跃度就越高。


在这项研究中,我们旨在研究对照 5Ht 和 P4HA1 敲除 6Ho 小鼠乳腺中基底上皮细胞的转录机制。最近的研究根据scRNA-seq数据,使用聚类分析确定了小鼠乳腺中具有潜在不同潜在分子机制的几个基底上皮细胞亚簇[17,18]。因此,一项自然的下游任务是比较对照小鼠和敲除小鼠中的相应亚簇,以阐明它们的转录差异。然而,要实现这一目标,需要解决三个主要挑战。首先,基于scRNA-seq数据的聚类分析识别的亚簇可能受到多种因素的影响[19];例如,根据数据中的细胞数量、细胞类型和细胞比率,聚类方法可以产生不同的结果。这种变化对下游分析构成了重大挑战,特别是在比较两组生物样本之间的子聚类时(例如,本研究中的 5Ht 与 6Ho 小鼠),因为很难区分观察到的差异是源于聚类方法引入的技术偏差还是反映了组之间的真实生物学差异。其次,根据基因表达谱鉴定的亚簇可能包含具有不同潜在调控机制的细胞子集,当这些细胞群较小时,这些亚群可能特别难以检测。第三,在比较不同组的小鼠时,对齐亚簇可能具有挑战性,因为细胞群的差异可能导致个体小鼠之间潜在转录程序和细胞组成的变化。


为了应对这些挑战,在这项研究中,我们采用了一种基于 GRN 的替代方法来识别 5Ht 和 6Ho 小鼠中乳腺基底上皮细胞的亚簇。我们还制定了一种策略,使我们能够对齐两个小鼠组中的子集群。此外,我们利用各种验证策略,包括计算机验证和实验验证,以提高我们在两个小鼠组中基于GRN的子聚类比较结果的可靠性。通过这样做,我们为 P4HA1 在调节炎症和免疫反应以及小鼠乳腺基底上皮细胞内干细胞分化中的作用提供了新的见解。我们的研究结果揭示了对照小鼠基底上皮细胞中具有促炎反应和干细胞特征的独特亚簇,这可能可能驱动乳腺癌的发生和发展[20\u201222]。P4HA1缺陷的6Ho小鼠中缺乏该亚簇表明,去除P4HA1会破坏基因敲除小鼠中的这些途径。鉴于炎症在癌症发展中的作用[22],我们的结果表明,抑制P4HA1可以为治疗乳腺癌提供一种有前途的治疗策略。此外,我们的工作表明,基于GRN的亚簇识别和比较提供了一种替代方法来比较不同生物样品组中不同细胞群的转录机制。


结果

在这项研究中,我们从两组小鼠的乳腺中生成了scRNA-seq数据:对照5Ht小鼠和P4HA1敲除6Ho小鼠。S1 图中的免疫荧光图像显示,6Ho 小鼠中的 P4HA1 表达在 K14 阳性乳腺上皮细胞中被沉默。我们使用Seurat [23]整合了来自5Ht和6Ho小鼠的单细胞数据,以比较两个小鼠组之间的基因表达差异、共享细胞状态和类型。图1A中的均匀流形近似和投影(UMAP)图[24]显示,两组的scRNA-seq数据整合良好,在不同细胞类型中几乎完美重叠。为了单独可视化每个小鼠组,同时保留整合的整体上下文,我们将集成的 UMAP 图按小鼠组拆分(S2 图)。我们观察到,5Ht 和 6Ho 小鼠的细胞簇在形状和位置方面保持高度相似。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图1. 由5Ht和6Ho小鼠组(A)和细胞类型(B)注释的集成UMAP图。

https://doi.org/10.1371/journal.pgen.1011505.g001


与之前的研究[18,25]一致,整合的UMAP将三种主要细胞类型——上皮基底细胞和管腔细胞以及巨噬细胞——分离成不同的簇(图1B)。这些簇的细胞类型特异性典型标记如S3图所示(有关详细信息,另见材料和方法)。S1表汇总了两个小鼠组中这三种主要细胞类型中的细胞数量。可以看出,与对照小鼠相比,6Ho敲除小鼠的基底上皮细胞和巨噬细胞数量显着减少(S1表)。


网络分析

接下来,我们旨在通过网络和聚类分析来确定 5Ht 和 6Ho 小鼠之间乳腺基底上皮细胞潜在的转录组学差异。我们分别使用 SCENIC 鉴定了 289 个和 290 个在 5Ht 和 6Ho 基底上皮细胞中激活的调节子。在这些调节子中,有245个受两个小鼠组之间的共同TF调节(如S2表所示)。每个小鼠组的基底上皮细胞中剩余的调节子被鉴定为唯一的。


聚类分析

由于我们的目标是了解两个小鼠组之间的转录调控差异,因此我们试图根据这些小鼠的调节活性来识别基底上皮细胞的亚簇。特别是,我们利用 245 个常见调节子进行聚类分析;由于调节这些调节子的TF是通过网络分析在两个小鼠组中鉴定的,因此我们认为这些调节子比仅在一个小鼠组中检测到的独特调节子更可靠。


比对 5Ht 和 6Ho 小鼠的基底上皮亚簇。

我们的聚类分析揭示了对照小鼠中有 4 个基底上皮细胞亚簇,在敲除小鼠中有 3 个亚簇(图 2)。为了比较它们,我们首先需要对齐子集群。虽然两个小鼠组中的大多数细胞应该属于相同的类型,但这些组之间的差异可能会导致不同的调控行为和基因表达模式,从而使比对具有挑战性。尽管如此,我们推断,由于6Ho小鼠的基底上皮细胞缺乏P4HA1,因此与5Ht小鼠中的细胞亚簇相比,某些细胞亚簇应表现出不同的调节模式,而其他亚簇应保持相似。因此,我们采用以下策略来比对两个小鼠组中的基底上皮亚簇。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图2. 5Ht 和 6Ho 小鼠基底上皮细胞的亚簇通过基于共同调节子活性的分层聚类揭示。


热图显示了(A)5Ht小鼠和(B)6Ho小鼠的基底上皮亚簇和调节模式。单元格以行形式显示;在两个小鼠组中检测到的 245 种常见调节子列中显示。


https://doi.org/10.1371/journal.pgen.1011505.g002


我们首先使用分层聚类分别对5Ht小鼠的基底上皮细胞及其调节子进行聚类(S4A图)。然后,我们将6Ho小鼠的基底上皮细胞聚类,同样采用分层聚类。随后,为了可视化两个小鼠组中常见调节子的模式,我们以与5Ht小鼠中簇化调节子相同的顺序对6Ho小鼠中的调节子重新排序,没有任何进一步的聚类(S4B图,详见材料和方法)。


在分别对5Ht和6Ho小鼠的基底上皮细胞及其调节子进行重新排序后,两个小鼠组中的几个亚簇显示出相似的调节子活性模式,如图2和S4所示,使它们很容易比对。具体来说,基底上皮细胞的分层聚类在 5Ht 和 6Ho 小鼠中产生了两个大亚簇 S1 和 S2,每个亚簇在两个小鼠组之间都表现出相似的调节活性模式。同样明显的是,有两个子簇(我们命名为 S3 和 U1_wt)嵌套在 5Ht 细胞的子簇 S2 中,一个子簇 S3 嵌套在 6Ho 细胞的子簇 S2 中。亚簇 S3 在 5Ht 和 6Ho 小鼠中表现出相似的调节活性模式。


除了两个小鼠组中都存在的“相似”亚簇外,同样明显的是,5Ht 小鼠中的一个亚簇 U1_wt 在 6Ho 小鼠中没有任何具有相似调节模式的相应亚簇,这表明基底上皮细胞中 P4HA1 的耗竭对敲除小鼠中的细胞亚簇有直接影响, 这可能导致这些 6Ho 细胞中某些调节活性的丧失或显着改变。总体而言,使用这种亚簇比对策略,我们在 5Ht 和 6Ho 小鼠的基底上皮细胞中鉴定了亚簇 S1-S3 及其对应物。两个小鼠组的每个子簇中的细胞数汇总在 S3A 表中。


值得注意的是,分层聚类通常不被认为是对单细胞进行划分的理想选择,因为它有时会产生带有scRNA-seq数据的碎片簇[26]。尽管如此,我们发现这种方法对于子簇对齐特别有用,因为它的层次结构使我们能够发现数据中的模式并检测细微的信号,甚至来自小的细胞子簇。


为确保两个小鼠组中的亚簇 S1-S3 以及 5Ht 特异性U1_wt亚簇代表真正的基底上皮细胞,不受其他细胞类型的污染,我们检查了这些簇中典型基底细胞标记物的表达(有关详细信息,请参阅材料和方法)。如图 S5 所示,上皮基底标记物在两个小鼠组的所有亚簇中都强烈表达,而免疫细胞 (Ptprc) 和巨噬细胞 (Adgre1) 特异性标记物不存在。这些表达模式证实,亚簇完全由基底上皮细胞组成,并且它们的调节活性不会因免疫细胞(包括巨噬细胞)的污染而混淆。


此外,我们采用了更定量的方法来验证子聚类比对的正确性。首先,我们根据 UMAP 图的 AUC 分数检查了已识别的子集群。如图 S6 所示,子簇 S1 和 S2 与两个小鼠组中的对应物非常吻合。有趣的是,子簇 S3(来自 5Ht 和 6Ho 小鼠)和 U1_wt(来自 5Ht)在 S6 图中作为两个异常子簇出现。为了定量测量这些子簇之间的相似性,我们计算了 5Ht 和 6Ho 子簇质心之间的成对距离(有关详细信息,请参阅材料和方法)。如S4表所示,子簇S1-S3的质心确实与各自小鼠中的对应质心的距离最短;另一方面,5Ht小鼠的子簇U1_wt质心与任何6Ho子簇的质心都不接近。这些结果支持了两个小鼠组中比对子簇的有效性。


为了进一步比较,我们还使用从 scRNA-seq 表达谱生成的 UMAP 图检查了 5Ht 和 6Ho 小鼠中基底上皮亚簇的分布。如图S7所示,除了来自两个小鼠组的细胞映射到UMAP空间中的相似区域的亚簇S3外,其他亚簇(S1、S2和U1_wt)在UMAP图中没有形成不同的簇——尽管表现出不同的调节活性模式,如图2所示。总的来说,这些结果表明,基于调节活性模式鉴定的亚簇与源自 scRNA-seq 表达谱的亚簇不同,从而为理解细胞的转录调控提供了另一种视角。


验证我们的结果

为了确保我们为5Ht和6Ho小鼠生成的网络结果准确可靠,我们使用小鼠基因组信息学(MGI)数据库验证了在这些小鼠中检测到的TF驱动的调节子[27]。


我们首先使用 MGI 数据库整理了一组在小鼠乳腺中活跃的 1032 个 TF。然后,我们将在5Ht和6Ho小鼠的基底上皮细胞中鉴定的调节子与这组TF进行了比较。结果总结在S2表中。在5Ht基底上皮细胞中检测到的289个TF驱动调节子中,有242个TF(~84%)与MGI组重叠。同样,在 6Ho 基底上皮细胞中检测到的 290 个 TF 驱动调节子中,有 244 个 TF (~84%) 与 MGI 组重叠。我们还检查了调节每个小鼠组独特和共同调节子的 TF,以了解它们如何与 MGI 集重叠。在两个小鼠组中观察到这些TF与MGI集的高度重叠(S2表)。


另一方面,在网络分析中纳入但未在 5Ht 细胞中检测到作为调节子的 196 个 TF 中,只有 55 个 (~28%) 是 MGI 组的一部分。同样,在 195 个未在 6Ho 细胞中检测到作为调节子的 TF 中,只有 53 个 (~27%) 在 MGI 组中。这些发现表明,使用 SCENIC 鉴定的 TF 驱动调节子在生物学上是有效的,与 MGI 数据库中已知在小鼠乳腺细胞中活跃的 TF 一致。


比较 5Ht 和 6Ho 小鼠的基底上皮亚簇

首先,我们使用差异基因表达(DGE)分析比较了两个小鼠组的基础亚簇。对于每个“相似”亚簇,在该亚簇的 5Ht 和 6Ho 基底上皮细胞之间鉴定出差异表达基因 (DEG)。相比之下,对于5Ht小鼠中的“独特”亚簇U1_wt,在该亚簇的基底上皮细胞和同一小鼠组的剩余基底上皮细胞之间鉴定出DEG。


5Ht 和 6Ho 小鼠之间的“相似”子簇 S1-S3:在所有“相似”子簇中,我们发现子簇 S1 的 DEG 数量最少,而子簇 S3 的 DEG 数量最多(S3B 表),表明 S1在两个小鼠组之间最相似。我们的功能富集分析表明,在每个“相似”亚簇的 6Ho 小鼠中,许多参与调节蛋白质稳定性、对未折叠蛋白的反应和伴侣介导的蛋白质折叠的基因在上调基因中显着富集(S5A-S5C 表)。众所周知,P4HA1介导的羟基化在细胞中胶原蛋白的适当折叠中起着至关重要的作用[2],因此,我们的富集结果与6Ho小鼠中P4HA1的耗竭导致胶原蛋白由于缺乏羟脯氨酸而错误折叠和降解的事实一致。此外,参与细胞呼吸、氧化磷酸化、糖酵解和各种线粒体活性(例如线粒体呼吸链复合物组装)的基因在6Ho小鼠每个“相似”亚簇的上调基因中也显着富集(S5A-S5C表)。例如,在亚簇 S1 中,我们的结果表明,与对照小鼠相比,6Ho 小鼠中参与细胞呼吸的 38 个基因、氧化磷酸化的 30 个基因和糖酵解的 8 个基因上调(S5A 表)。我们在亚簇 S2 和 S3 中观察到类似的结果,表明这些细胞过程在两个小鼠组的大多数基底上皮细胞中普遍存在。我们的结果还显示,在亚簇S2中,参与内质网应激反应的基因显著富集(S5B表),在亚簇S3中,参与氧化应激的基因在DEG中富集(S5C表)。


对这些数据中Hif1a表达水平的检查表明,Hif1a在6Ho小鼠的亚簇S3中下调,倍数变化为0.65,标称p值为0.02。总之,这些结果与我们之前的研究表明P4HA1通过乳腺癌细胞中的HIF-1通路调节ROS和氧化磷酸化[5]。特别是,乳腺癌细胞中P4HA1的上调增加了HIF-1蛋白的稳定性,并伴随着乳腺癌细胞中呼吸、糖酵解、氧化磷酸化和活性氧(ROS)水平的降低[5]。


对照小鼠中独特的亚簇U1_wt。我们的GO分析表明,在这些细胞中,参与胶原代谢过程的13个基因在上调基因DEGs中显著富集(S6A表,图3A)。这一结果与由于缺乏P4HA1而无法在6Ho小鼠中正确合成胶原蛋白的事实一致,这解释了为什么该亚簇仅存在于5Ht小鼠中。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图3. 亚簇 U1_wt 与其他富含胶原蛋白和干细胞途径的 5Ht 基底上皮细胞之间的 DEG。


点图显示了富集在 (A) 胶原蛋白代谢和 (B) 干细胞分化途径中的 DEG。DEG 根据表达它们的亚簇U1_wt细胞的比例按降序排序。


https://doi.org/10.1371/journal.pgen.1011505.g003


此外,我们发现包括Zeb2(前10个最重要的DEG之一)在内的18个DEG参与干细胞分化,并且在该亚簇的DEG中显着富集(S6A表,图3B)。在这 18 个 DEG 中,发现 16 个在该亚簇中上调。这一结果与我们之前的研究结果一致,即乳腺癌细胞中P4HA1的上调增加了HIF-1蛋白的稳定性,从而增强了细胞的干性[5]。此外,我们的分析还表明,在该亚簇中检测到的DEGs中,21个参与调控细胞形态发生的基因和34个与血管生成相关的基因显著富集(S6A表)。


然而,与类似的簇不同,我们的结果还表明,亚簇U1_wt显着富集了许多上调基因,这些基因参与了许多炎症和免疫反应过程,例如,急性炎症反应、巨噬细胞迁移和趋化性的正调节、巨噬细胞激活、B 细胞和 T 细胞介导的免疫,以及(S6B 表)。


值得注意的是,在我们在5Ht小鼠中鉴定出这个富含炎症基因的基底上皮亚簇后,我们发现最近发表的一项小鼠衰老图谱研究报告了类似的促炎肌上皮亚簇(Epi-C11)[28]。特别是,在该研究中强调的 8 个在亚簇 Epi-C11 中表达的促炎和干扰素-γ 特征基因中,其中 4 个——Cd74、H2-Ab1、H2-Eb1 和 Ccl2——在 5Ht U1_wt亚簇中也上调(S8 图)。这些重叠炎症基因的上调,以及促炎肌上皮亚簇和U1_wt之间的共享转录回路(如下所述),提供了交叉研究证实,即U1_wt细胞代表5Ht小鼠基底上皮细胞群内的促炎状态。


显着的调节子和差异表达的靶基因 (DETG)。

为了进一步确定 5Ht 和 6Ho 小鼠之间的差异,我们使用 SCENIC 的 AUC 评分量化了这些小鼠单个细胞内每个调节子的活性。该评分评估TF驱动的调节子在每个细胞中的活性程度。然后,我们将分析重点放在DETG上,DETG是调节子内TF的靶基因,在5Ht和6Ho小鼠的相应亚簇之间差异表达。我们推断,这些基因驱动两个小鼠组中每个调节子的不同调节活动,从而揭示了这些生物过程如何在这些亚簇的细胞中受到调节。


Our results show that subclusters S1 and S2 had the lowest numbers of significantly different regulons amongst all the subclusters between the two mouse groups, indicating that similar transcriptional mechanisms drive the corresponding subclusters in the control and the knockout mice. In contrast, subclusters S3 and U1_wt had the highest numbers of significantly different regulons (S3B Table). Our results show that the activity of the Hif1a regulon in the S1 cells of the 6Ho mice is significantly lower than that in 5Ht mice (adjusted p value = 0.01), again consistent with our previous study showing that upregulation of P4HA1 in aggressive breast cancers leads to the increased level of HIF-1α in the mammary tissues of the patients [5]. The Hif1a regulon in the S3 cells also has a lower activity (but not statistically significant) in the 6Ho mice.


Since our goal is to elucidate transcriptional differences underlying mammary basal epithelial cells in the control and the P4HA1-knockout mice, we subsequently identified and characterized the regulons potentially playing roles in key signaling pathways in subcluster S3 of the two mouse groups and subcluster U1_wt of the 5Ht mice.


Subcluster S3 of the 5Ht and 6Ho mice. Our analyses revealed that the percentage of basal cells in subcluster S3 of the 6Ho mice is 1.5 times higher than that in the 5Ht mice (S3A Table). Moreover, several regulons in subcluster S3 regulate DETGs that were enriched in potentially important signaling pathways in both the mouse groups. For example, among the DETGs of a significantly different regulon E2f1, those participating in mitochondrion organization and carbohydrate derivative metabolic processes were significantly enriched and downregulated in the control mice (S7A Table). In contrast, the DETGs of this regulon involved in rRNA and peptide metabolic processes were significantly enriched and upregulated in the knockout mice (S7B Table). These findings implicate E2f1 as a key regulator of various metabolic processes in response to the loss of P4HA1 in this subcluster of the knockout mice.


Subcluster U1_wt of the 5Ht mice. Genes involved in the collagen metabolic and catabolic processes were significantly enriched among the DETGs regulated by the two significantly different regulons Spi1 and Mitf in these cells (S8A Table; Fig 4 A & 4B). Both these regulons were among the top significantly different regulons, with the Spi1 regulon being the most significantly different in this subcluster. Moreover, we identified significant enrichment of 5 DETGs regulated by Mitf – Zeb2, Ednrb, Nrp1, Rbpj, and Vsir – which were involved in the stem cell development pathway(S8B Table). It can be seen in Fig 4C that their expression levels are upregulated in subcluster U1_wt, compared to those in the other subclusters of the two mouse groups.


thumbnailDownload:

PPTPowerPoint slide

PNGlarger image

TIFForiginal image

Fig 4. The regulons detected in subcluster U1_wt of the 5Ht mice with the DETGs involved in the collagen metabolic process and stem cell development pathway.


Dot plots show paired comparisons of the (A) Spi1 and (B) Mitf regulons, with their DETGS participating in collagen metabolic pathways, and (C) Mitf regulon with its DETGS participating in the stem cell differentiation, across the basal epithelial subclusters of the 5Ht and 6Ho mice. DETGs are sorted by their ranks within their respective 5Ht regulons.


https://doi.org/10.1371/journal.pgen.1011505.g004


Inflammatory and immune responses.

Using SCENIC, we identified 15 significantly different regulons between the two mouse groups that showed a significant enrichment of the DETGs participating in inflammatory and immune-responses (S9 Table, Fig 5). Among these regulons, 9 regulons also regulate DETGs with significant enrichment of the genes involved in macrophage activation and migration (S9 Table).


thumbnailDownload:

PPTPowerPoint slide

PNGlarger image

TIFForiginal image

Fig 5. Dot plots illustrating four regulons in subcluster U1_wt of the 5Ht mice with the DETGs participating in the inflammatory response pathways.


Dot plots show paired comparisons of the (A) Fli1, (B) Spi1, (C) Mitf, and (D) Irf8 regulons, and their DETGs across the basal epithelial subclusters of the 5Ht and 6Ho mice. Panels (A-D) show the DETGs involved in inflammatory response, which are sorted by their ranks within their respective 5Ht regulon.


https://doi.org/10.1371/journal.pgen.1011505.g005


Notably, of these 15 regulons, Fli1 regulated 32 DETGs involved in the inflammatory response pathway – all of which were upregulated in subcluster U1_wt (Fig 5A) – 9 of these DETGs were also found to participate in macrophage activation and chemotaxis. Feature plots in Fig 6 show the distributions of the 8 DETGs in the Fli1 regulon across all basal epithelial cells of the 5Ht and 6Ho mice; it can be seen that their expression levels align very well with the expression of Fli1 in the 5Ht U1_wt cells. A literature review highlighted Fli1 as a key proto-oncogene with crucial roles in hematopoiesis and vascular development [29]. Its overexpression has been implicated in highly malignant triple-negative breast cancer, where it promotes tumor progression by driving proliferation, inhibiting differentiation, and enhancing cellular survival under hypoxic conditions [30–32].


thumbnailDownload:

PPTPowerPoint slide

PNGlarger image

TIFForiginal image

Fig 6. Feature plots of the Fli1 regulon and its DETGs participating in the inflammation response pathway in subcluster U1_wt of the 5Ht mice.


Expression levels of Fli1 (TF) and several DETGs (within the regulon) detected in the cells of subcluster U1_wt are shown across all basal epithelial cells of the 5Ht and 6Ho mice.


https://doi.org/10.1371/journal.pgen.1011505.g006


We also found that, among the TFs driving the 15 significantly different regulons with the pro-inflammatory DETGs, Spi1 and Mitf (Fig 5) each regulated DETGs involved in the collagen metabolic processes (S8A Table, Fig 4A & 4B). Within the same subcluster, we also found significant enrichment of DETGs regulated by Mitf participating in the stem cell development pathway (S8B Table, Fig 4C).


Taken together, these results show that multiple TFs regulate pro-inflammatory DETGs in subcluster U1_wt of the control mice, and that TFs such as Spi1 and Mitf may mediate potential crosstalks between inflammatory responses, macrophage activation and migration, as well as collagen metabolism, and stem cell development in this subcluster of the 5Ht cells. Furthermore, the presence of this subcluster with pro-inflammatory and stem cell signatures in the control mice, while absent in the knockout mice, supports the notion that expression of P4HA1 in the control mice leads to increased stemness and inflammation in this subcluster of the cells.


External and experimental validation

External validation.

Following our findings above, a recent mouse aging atlas study reported a myoepithelial subcluster Epi-C11 with similar expression of pro-inflammatory genes in mouse mammary glands [28]. Fli1 was highlighted in this study and was found to be expressed in MMGs with accessible chromatin in both 3-month-old (3M) and 18-month-old (18M) mice by single-nucleus assay for transposase-accessible chromatin with sequencing (snATAC-seq). The differentially accessible (DA) peak between the two mouse groups detected in the promoter region of Fli1 also contained binding motifs for Irf4 and Irf8, which agrees with our finding showing the activation of the Fli1, Irf4, and Irf8 regulons in the U1_wt subcluster of the control mice. Additionally, among the 15 proinflammatory regulons we identified (S9 Table), 6 of them (Fli1, Irf8, Rel, Stat1, Jund, Runx3) showed peak opening in the promoter region while 6 (Spi1, Mitf, Klf2, Maf, Irf5, Pparg) showed openings in other regions (such as exons and introns) in the mouse aging atlas study (S10A Table).


We also verified other results using the data provided by the mouse aging atlas study. In particular, among 81 significantly different regulons we detected, 72 TFs showed peak accessibility in various genomic regions—54 TFs exhibited peaks in promoter regions and 18 in other regions (e.g., exons and introns) (S10A Table). Additionally, 42 of these TFs were expressed in the Epi‑C11 cluster of 3‑month‑old mice—matching the age of the mice used in our study (S10B Table).


Moreover, among 534 DEGs in U1_wt, i) 370 genes have opening peaks in various regions, with 298 genes having peak openings in the promoter region and 72 additional genes in other regions (S11A Table); ii) 311 genes were expressed in 3M mice in Epi-C11 (S11B Table); and iii) 64 genes, including Cd74, H2-Ab1, H2-Eb1, H2-Aa, Ccl2, and Ccl7, were also differentially expressed between Epi-C11 and other myoepithelial cells in the mouse aging atlas study (S11C Table). Taken together, these results indicate that subcluster U1_wt shares substantial similarity with subcluster Epi-C11 in the mouse aging atlas study, thus supporting the validity of our findings.


To further investigate whether significantly different regulons and DEGs in U1_wt are linked to breast cancer, we examined two external publicly available microarray datasets, GSE65194 [33] and GSE45827 [34], from the Gene Expression Omnibus (GEO) database. These datasets were generated from the same cohort of 41 triple-negative breast cancer samples and 11 normal samples from healthy breast tissues [33,34]. We found that of the 81 TFs that regulate significantly different regulons, 51 were differentially expressed between the TNBC and normal samples (S12 Table, A & B), including 9 pro-inflammatory TFs (Mitf, Irf5, Irf7, Stat1, Rel, Klf2, Jund, Runx3, and Maf) shown in S9 Table. Also, of the 534 DEGs in U1_wt, 315 were differentially expressed between the TNBC and normal samples (S12C & S12D Table), including Cd74 and Ccl2. These findings indicate that the transcriptional modules active in subcluster U1_wt shares notable similarities with gene expression patterns observed in the human TNBC samples, suggesting that the U1_wt regulons may play a functional role in tumor initiation, progression, and immune-related processes associated with TNBC.


Experimental validation.

Since our results showed that several regulons in the 5Ht U1_wt subcluster upregulated DETGs enriched in inflammatory response and macrophage migration (S9 Table), and given the crucial role of macrophages in the inflammatory response and their potential involvement in promoting breast cancer initiation within premalignant mammary lesions [35], we performed immunohistochemistry (IHC) to examine macrophage accumulation in the mammary glands of the 5Ht and 6Ho mice.


To identify macrophages, we immunostained sections of the mouse mammary gland with F4/80 antibodies [36]. Representative images in Fig 7 showed that the mammary tissue of the 5Ht mouse has a higher presence of macrophages (Fig 7A), which may indicate more active immune involvement. On the other hand, the mammary tissue of the 6Ho mouse has fewer macrophages (Fig 7B), suggesting that the P4HA1 deficiency could be linked to a reduction in macrophage-driven inflammation in these mice. This observation was confirmed by quantification of the F4/80 positive cells in immunohistochemistry (IHC) staining from 4 pairs of mice (Fig 7C), and is also consistent with our scRNA-seq analysis revealing a substantial decrease in the number of macrophages in the mammary glands of the 6Ho mice compared to those of the 5Ht mice (S1 Table). Together, these findings validated our results, confirming that macrophage activation is indeed disrupted in the P4HA1-deficient mice, thus reinforcing the critical role of P4HA1 in supporting macrophage-mediated inflammatory processes in mouse mammary tissues.


thumbnailDownload:

PPTPowerPoint slide

PNGlarger image

TIFForiginal image

Fig 7. Immunostaining of macrophages in the mammary glands of the 5Ht and 6Ho mice.


Macrophages were identified by the F4/80 antibody, shown by brown staining. Representative figures show the presence of macrophages in the mammary tissue of (A) 5Ht mouse, and (B) 6Ho mouse. Scale bar, 100 µm. (C) Quantification of F4/80-positive macrophages in the IHC staining images; n = 4 mice per group, *p < 0.05.


https://doi.org/10.1371/journal.pgen.1011505.g007


Discussion

在这项研究中,我们利用scRNA-seq数据研究了P4HA1在对照5Ht和P4HA1敲除6Ho小鼠乳腺基底上皮细胞中的转录机制。使用基于GRN的聚类方法,然后进行亚簇比对,我们在两个小鼠组中鉴定了三个“相似”的基底上皮细胞亚簇,以及在对照小鼠中鉴定出一个独特的亚簇U1_wt。我们的GRN分析揭示了两个小鼠组的基底上皮亚簇之间明显的调节差异。具体来说,在两个小鼠组共有的亚簇(S1-S3)中,6Ho小鼠P4HA1的缺失改变了几个重要的途径,包括蛋白质折叠、呼吸、氧化磷酸化、糖酵解和线粒体活性,以及显着降低S1细胞中的Hif1a调节活性和下调S3细胞中的Hif1a表达。这些结果与我们之前的研究一致,该研究表明,P4HA/HIF-1轴的上调增强了癌细胞的干性,并伴随着氧化磷酸化和ROS水平的降低[5]。相比之下,我们鉴定出对照小鼠特异性的独特亚簇U1_wt——在干细胞发育和促炎反应中富含 DEG 和 DETG——表明依赖于 P4HA1 的独特基底上皮细胞状态。


我们基于GRN的聚类方法使我们能够识别受共享调控机制控制的子聚类,确保观察到的模式反映真实的生物过程,而不是噪声或技术变异性引入的伪影。正如我们的结果所表明的,这种方法对于检测具有独特调控机制的少量细胞特别有用,否则基于 scRNA-seq 表达谱的传统聚类方法可能会遗漏这些细胞。例如,我们的方法确定了子聚类 S3 和 U1_wt,它们在基于调节子活动的 UMAP 图中是明显不同的(尽管很小)子聚类,值得进一步研究。这些亚簇可能无法通过用于细胞类型鉴定的常规聚类方法检测到。因此,我们的方法提供了一种识别功能相关细胞亚簇的替代策略。


单细胞网络分析的重大挑战之一是与 scRNA-seq 数据相关的固有噪声和技术变异性。当比较来自不同生物条件的网络时,这个问题变得更加复杂,例如 5Ht 和 6Ho 小鼠组,在这些条件下,区分真正的生物学差异和技术伪影变得至关重要。为了应对这些挑战,我们在整个工作中采用了多种验证策略。首先,我们使用可重复的调节活性模式(图2)仔细对齐5Ht和6Ho小鼠中基底上皮细胞的亚簇,并使用基于亚簇的调节活性(S6图)的UMAP图以及质心分析(S4表)确认它们的相似性。其次,我们根据精选的公共数据库(例如 MGI 数据库)验证了调节 TF,重点关注已知在小鼠乳腺中活跃的 TF。我们这样做是为了确保检测到的 TF 及其调节子在生物学上有效。第三,我们将对照小鼠的结果与我们之前发表的研究[5]和最近发表的小鼠衰老图谱研究[28]进行了交叉验证,确保我们的发现与已知的生物学知识一致。最后,我们使用两个外部人类数据集(包括 TNBC 和健康乳腺组织样本)验证了我们的结果,确认我们的小鼠模型中发现的调节模块可以转化为人类疾病背景。


此外,我们使用免疫组织化学进行了实验验证,以评估两个小鼠组乳腺中的巨噬细胞积累。与5Ht小鼠相比,我们观察到6Ho小鼠乳腺组织中巨噬细胞的存在显着减少(图7)。这一结果与我们的scRNA-seq数据一致,该数据显示6Ho小鼠中巨噬细胞数量大幅减少(S1表)。这些发现支持了 P4HA1 的缺失抑制基因敲除小鼠巨噬细胞激活和迁移的观点。


这些验证策略共同确保了我们对重建网络的发现是稳健的,并反映了 5Ht 组和 6Ho 组之间真正的生物学差异,从而减轻了对 scRNA-seq 数据产生的噪声和技术伪影的担忧。


值得注意的是,我们的结果揭示了对照小鼠中基底上皮细胞的独特亚簇 (U1_wt),具有上调的促炎特征基因,以及参与巨噬细胞激活和迁移的基因。该亚簇类似于最近的一项小鼠衰老图谱研究中报告的促炎性肌上皮亚簇。此外,我们的研究还确定了多种 TF 在调节炎症反应和巨噬细胞迁移方面的冗余功能。我们发现,包括 Fli1、Spi1、Mitf 和 Irf8 在内的 15 个 TF 调节了参与这些过程的重叠 DETG,从而形成了一个高度冗余的调控网络。一项文献综述进一步强调了Fli1作为原癌基因的关键功能,暗示它是造血干细胞和祖细胞的十大关键调节因子之一[29,37]。在侵袭性TNBC细胞系中观察到的Fli1失调[32]表明其在驱动乳腺癌进展中的潜在作用。此外,已知Spi1编码在造血和细胞命运决策中起关键作用的主TF[38],而Mitf编码在免疫反应中起关键作用的小眼症相关转录因子[39]。有趣的是,Spi1和Mitf在破骨细胞分化过程中协同发挥作用[40\u201241],这与我们的结果一致,表明它们都调节参与5Ht U1_wt细胞免疫反应的DETG。此外,许多研究表明,功能冗余对于维持细胞稳定性至关重要,特别是在肿瘤发生等动态环境中[42,43]。当单个TF的功能被破坏时,它提供代偿性调节,确保免疫反应和干细胞分化等关键过程不受阻碍地继续进行[44]。此外,Spi1 和 Mitf 调节子还富含参与胶原蛋白代谢过程和干细胞发育的 DETG,这表明这些过程在U1_wt细胞中存在潜在的串扰。尽管在这项研究中在对照小鼠中发现了促炎U1_wt亚簇,但来自各种癌症研究的大量证据表明,慢性炎症可以驱动肿瘤发生和生长[45]。我们使用两个外部人类微阵列数据集的研究表明,U1_wt TNBC 和正常样本之间也有相当多的显着不同的调节子 TF 和 DEGs 在 TNBC 和正常样本之间差异表达,这表明该亚簇中的转录网络和 DEG 在驱动 TNBC 的启动和发育中发挥着潜在的重要作用。


虽然我们的研究为 P4HA1 的分子机制提供了新的见解,但重要的是要承认一些局限性。在这项工作中,我们使用具有单等位基因 P4HA1 缺失 (5Ht) 的小鼠作为我们的对照组,因为我们没有观察到野生型和 5Ht 小鼠之间的乳腺形态发生显着差异。然而,我们不能完全排除单个P4HA1等位基因的丢失可能影响小鼠乳腺基底上皮细胞转录调节的可能性。此外,我们通过分析来自同一窝的三对 8 周龄 5Ht-6Ho 小鼠来控制年龄,以尽量减少变异;然而,我们没有考虑可能影响上皮细胞状态的发情周期。未来结合发情周期分期的研究将更好地了解与 P4HA1 缺乏相关的转录变化。


此外,在对照小鼠中发现的促炎U1_wt基底亚簇可能会引起对基底上皮细胞群内潜在巨噬细胞污染的担忧。为了减轻这种担忧,在网络分析的预处理步骤中,我们去除了所有表达免疫细胞(Ptprc)和巨噬细胞(Adgre1)经典标记基因的基底上皮细胞。我们还采用了基于参考的细胞类型注释方法来交叉验证我们基于聚类的注释结果,并去除所有可能被其他细胞类型(例如免疫细胞、成纤维细胞等)污染的基底细胞。


此外,尽管我们使用公开可用的数据库和多个外部数据集对我们的结果进行了广泛的计算机验证,但仍需要功能实验——例如谱系追踪或已识别亚簇内特定TF的扰动——来验证这些TF在调控对照和敲除小鼠的已识别亚簇中的生物学作用在未来的研究中。此外,虽然我们在这项工作中没有广泛表征乳腺干细胞 (MaSC) 或其他免疫细胞群,但这些也将是我们未来研究的重点领域。


通过利用单细胞网络推理技术并通过多种策略验证我们的发现,我们为 P4HA1 在潜在调节炎症和免疫反应以及小鼠乳腺干细胞分化方面的分子机制提供了新的见解。P4HA1 缺陷的 6Ho 小鼠中基底上皮细胞的促炎亚簇的缺失表明 P4HA1 在调节这些细胞的促炎反应中起关键作用,并可能作为三阴性乳腺癌治疗的潜在治疗靶点。


材料和方法

道德声明

小鼠实验(方案编号:2020-3639)已获得肯塔基大学机构动物护理和使用委员会(IACUC)的批准。所有小鼠实验均按照肯塔基大学实验动物资源部指南进行。


用于 scRNA-seq 数据生成的乳腺分离和解离

在这项研究中,我们从两组小鼠中生成了scRNA-seq数据:K14-cre;P4HA1乐浦/+(对照,5Ht)小鼠和K14-cre;P4HA1乐士/乐士(P4HA1-敲除,6Ho)小鼠。对于每组,我们使用了三对 8 周龄的小鼠,每对小鼠都来自同一品种,以尽量减少年龄和发情周期的变化。P4HA1 表达在 6Ho 小鼠的基底乳腺上皮细胞中被特异性沉默。


为了分离乳腺细胞以进行 scRNA-seq,我们解剖了两组的乳腺并机械解离了它们。将切碎的组织转移到由DMEM / F12(Gibco)+ 10 mM HEPES(Gibco)+胶原酶(Roche)+ 200 U ml ⁻ ¹透明质酸酶(Sigma)+庆大霉素(Gibco)组成的消化混合物中,在37°C下3小时,每30分钟涡旋一次。新罕布什尔州红细胞裂解后4Cl,用温热的 0.05% 胰蛋白酶-EDTA (Gibco) 5 mg ml 短暂消化细胞−1分散酶 (Sigma) 和 1 mg ml−1DNase (Sigma),并通过细胞过滤器 (BD Biosciences) 过滤以去除碎片,产生用于测序的单细胞制剂。


碘化丙啶(PI,Sigma)的工作浓度为1μg/ml,通过将储备液稀释为1:1000来检测死细胞。分选后,将细胞旋转并重悬。使用改进的 Neubauer 室手动计数样品,并对细胞浓度进行归一化。每个样品处理相同数量的细胞用于 scRNA 文库制备。


ScRNA-seq 数据生成和初始预处理

使用 10X Genomics Chromium 平台生成了 5Ht 和 6Ho 小鼠的 ScRNA-seq 文库。使用 Cell Ranger (v.6.1.1) 将所得基因表达文库映射到小鼠参考基因组(mm10,10x Genomics 预构建参考 mm10–2020-A)。对于每个 scRNA-seq 文库,我们在 Cell Ranger 过滤基质上应用质量控制 (QC) 过滤器以去除低质量细胞,定义为具有≤ 200 个检测特征或≥ 10% 的读数映射到线粒体基因的细胞。此外,具有 30,000 个唯一分子标识符 (UMI) 计数≥的细胞被鉴定为潜在的双峰,并被排除在进一步分析之外。


QC后,使用Seurat(v.4.4.0)软件包[23]中描述的推荐顺序程序和功能对过滤后的数据集进行集成。使用 SCTransform() 函数对原始基因表达矩阵进行归一化。接下来,使用 SelectIntegrationFeatures() 选择集成特征,然后将其传递给 PrepSCTIntegration() 以准备用于数据集成的对象。使用 FindIntegrationAnchors() 识别积分锚点,并使用 IntegrateData() 函数合并数据集。经过质量控制和数据整合,集成数据集包括 12,472 个细胞和 19,140 个基因。


细胞类型注释

基于聚类的单元类型注释。

然后,根据PCA计算的前30个主成分(PC),使用UMAP算法对集成数据集进行聚类和可视化。我们使用 FindNeighbors() 函数识别了 20 个最近邻,并使用 FindClusters() 执行聚类,分辨率为 0.5。然后通过使用 FindMarkers(test.use = “wilcox”,min.pct = 0.1,logfc.threshold = 0.25,only.pos = TRUE)将该簇中的细胞与同一小鼠中的所有其他细胞进行比较来识别每个簇的标记基因和Wilcoxon秩和检验。只有 Bonferroni 调整的 p 值< 0.05 的基因才被认为是显着的。


通过检查簇特异性差异表达基因和经典标记基因的表达来进行细胞类型注释。细胞首先分为四大类:免疫细胞(Ptprc)、上皮细胞(Epcam、Krt18和Krt19)、内皮细胞(Pecam1)和胶原蛋白生成细胞(Col1a2)。使用迭代细化方法将每个主要群体进一步细分为不同的子集群,其中每个广泛类别中的细胞按照上述整合和聚类程序进行子集、再处理和重新聚类。


上皮细胞进一步分为基底上皮细胞(以Krt14和Krt5的额外表达为特征)和管腔上皮细胞(以Krt8的额外表达为标志)。将免疫细胞进一步分为单核细胞(Plac8、Lyz2和Ifitm3)、巨噬细胞(Adgre1和Cd14)、中性粒细胞(S100a8和S100a9)、肥大细胞(Mcpt4和Cma1)、自然杀伤(NK)细胞(Nkg7、Klrb1c和Gzmb)、B细胞(Cd79a、Cd19和Ms4a1)和T细胞(Cd3d、Cd3e和Cd3g)。表达 S100a4、Areg、Il7r、Rgcc、Ramp1、Rora、Gata3、Fgl2、Gadd45b 和 Ccl1 的免疫细胞的一个不同子集被归类为 2 型先天淋巴细胞 (ILC2)。树突状细胞 (DC) 包括经典 DC1(cDC1,由 Clec9a、Xcr1 和 Batf3 鉴定)、经典 DC2(cDC2,由 Cd209a 和 Napsa 定义)、成熟树突状细胞(mDC,表达 Fscn1、Ccr7 和 Il12b)和浆细胞样树突状细胞(pDC,以 Ly6d、Bst2、Ccr9 和 Cox6a2 标记)。


基于引用的单元格类型注释。

为了提高细胞类型鉴定的鲁棒性,并确保准确选择基底上皮细胞而不污染其他细胞类型(如免疫细胞、成纤维细胞等),我们使用Seurat中实施的基于参考的标记转移方法交叉验证了基于聚类的注释[46]。带有注释细胞类型的参考数据集来自已发表的小鼠乳腺 scRNA-seq 研究 [28]。


具体来说,我们首先为参考数据集和集成数据集创建了 Seurat 对象,作为查询数据集。然后,我们执行过滤以保留引用和查询数据集中的高质量单元格(nFeature_RNA > 300、nFeature_RNA < 5000 和 percent.mt ≤ 10),并使用 NormalizeData() 对它们进行归一化。使用 FindVariableFeatures() 独立识别两个数据集中高度可变的基因。


然后使用 SelectIntegrationFeatures() 选择一组包含 2,000 个积分特征的共享功能,然后进行独立缩放和主成分分析 (PCA)。然后,我们利用 FindIntegrationAnchors() 和 IntegrateData() 来对齐和集成两个数据集,并消除由于不同数据源而可能产生的任何批处理效应。


对于标签传输,FindTransferAnchors() 用于识别引用单元和查询单元格之间的定位点,TransferData() 将引用单元格类型标签投影到查询单元格上,为查询单元生成单元格类型注释。


仅选择通过基于聚类的细胞注释方法和基于参考的标记转移方法鉴定的基底上皮细胞,并将其用于网络分析以及下游亚型鉴定和表征。


下游分析的数据预处理

我们使用Scanpy(v.1.9.4)[47]及其预处理模块进一步处理了带注释的集成数据集,用于下游分析。首先,我们使用 filter_genes() 和 filter_cells() 函数过滤了数据集中的细胞和基因。我们保留了表达 300 多个和 5000 个基因的细胞;保留至少 5 个细胞中表达的基因以供后续分析。然后,我们使用 normalize_total() 将总计数归一化为每个细胞 10,000,并对数据进行自然对数转换以获得归一化的 scRNA-seq 数据集。


网络分析

网络分析的数据准备。

我们从归一化的 scRNA-seq 数据集中删除了带有“Rik”后缀的基因(例如,5730419F03Rik)和以“Gm”开头的基因(例如,Gm31812),以便将我们的分析重点放在注释良好的基因上。经过这些预处理步骤后,该数据集包含 12,274 个细胞和 15321 个基因。


由于我们的分析侧重于基底上皮细胞,因此我们在执行任何后续处理之前对这些细胞的数据集进行子集化,以创建组合的基础数据集。为了消除免疫细胞(特别是巨噬细胞)污染的任何来源,我们从组合的基础数据集中删除了所有表达 Ptprc 或 Adgre1 的单细胞。消除这些细胞后,数据集包含 1510 个细胞和 15321 个基因。为了进一步确保数据中不存在污染细胞,我们利用基于参考的方法(有关详细信息,请参阅上面的“基于参考的细胞类型注释”部分)使用参考数据集预测数据中基底细胞的标签。使用这种方法,我们过滤了 18 个 5Ht 和 4 个 6Ho 基底细胞,这些基底细胞被预测为其他细胞类型。应用这些过滤步骤创建了包含 1488 个细胞和 15321 个基因的过滤组合基础数据集。然后,我们将数据按小鼠组拆分,得到过滤后的5Ht基础数据集和过滤后的6Ho基础数据集,然后进行后续处理。


然后,我们分别对过滤后的5Ht、6Ho和组合的基础数据集执行了后续处理步骤。我们使用 highly_variable_genes() 函数鉴定了高度可变的基因 (HVG),并保留了 HVG,最小平均表达量为 0.0125,最大平均表达量为 3.5,最小分散度为 0.45,用于后续分析。


为了便于比较分析,我们采用了 5Ht、6Ho 和组合基础数据集中保留的 HVG 的并集,创建了一组 4885 个基因。然后,我们对过滤后的组合基础数据集进行子集化以保留这些 HVG,产生包含 1488 个细胞和 4885 个基因的预处理组合基础数据集。然后对每个基因的计数进行缩放,使其具有单位方差和零均值。


最后,通过对5Ht细胞的预处理组合基础数据集进行子集化得到的预处理的5Ht基础数据集包含972个细胞和4885个基因,而通过对6Ho细胞的预处理组合基础数据集进行子集化得到的预处理的6Ho基础数据集包含516个细胞和4885个基因。然后将这些数据集用于网络分析。


使用 SCENIC 进行网络分析。

使用Python中的SCENIC (v.0.12.1)管道进行网络分析,分别应用于5Ht和6Ho小鼠基底上皮细胞的scRNA-seq数据。SCENIC 工作流程涉及三个主要步骤:网络推理、基序富集和调节子的细胞富集。


网络推理:SCENIC 利用随机梯度提升机算法 GRNBoost2 [48] 根据 TF 及其靶基因的共表达推断基因调控网络。分别使用从cisTarget资源数据库(https://resources.aertslab.org/cistarget)和预处理的5Ht和6Ho基础数据集中获得的1860个TF作为GRNBoost2的输入。在这 1860 个 TF 中,有 485 个 TF 存在于预处理的数据集中,是我们网络分析的基础。该算法的输出是一个边缘列表,将 TF 映射到其靶基因,并从回归模型中获得相关重要性分数。


为了解释GRNBoost2的随机变异性,我们对每个小鼠组运行了20次算法,确保已鉴定的TF与其靶基因之间的关联稳定且可重复。对于每次运行算法的结果,我们执行了基序富集,如下所述。


基序富集:通过评估已鉴定靶基因调控区域的基序富集,对上述推断的网络进行了细化。这一步涉及生成模块和调节器。模块是使用 modules_from_adjacencies() 函数生成的已识别 TF 及其靶基因的集合。该函数根据从基于树的回归模型获得的重要性得分,为每个已识别的 TF 选择排名靠前的靶基因来过滤 TF 及其靶基因。然后使用这些模块使用 prune2df() 和 df2regulons() 通过基序富集来生成调节子。


对每个已鉴定的调节子的靶基因进行排名:我们通过计算每个调节子检测到的靶基因的汇总统计,包括靶基因频率、重要性得分以及基因表达水平的平均值、中位数和标准差,总结了所有 20 次运行的结果。计算每个小鼠组的基底上皮细胞的表达值。在 20 次 SCENIC 分析中,根据每个基因在调节子中出现的频率对目标基因进行排名,频率越高表示排名越高。然后在每个法规中按等级对它们进行排序。


调节子的细胞富集:通过联合作对每个小鼠组汇总所有 20 次运行中检测到的调节器,并通过使用 AUCell() 函数获得的 AUC 分数估计其细胞富集。此步骤的输出是一个 AUC 矩阵,其中单元格在行中,检测到的调节子在列中。较高的AUC评分表明调节子的靶基因活跃表达,反映了TF在调节该特定细胞内基因表达方面的活性。


验证已识别的调节子

MGI 数据库是专业策划的信息和资源的集合,集成了小鼠基因组数据库 (MGD) 和基因表达数据库 (GXD),以支持实验室小鼠基因组的实验和计算研究。我们使用 MGI 数据库 (v.6.23) 生成一组在小鼠乳腺细胞中活跃的 TF。为了获得这组,我们首先确定了小鼠乳腺细胞中活跃的所有基因组特征,从而产生了一组 23,754 个特征。然后,我们过滤了该集,仅包括具有 DNA 结合转录因子活性的蛋白质编码基因。这导致了我们用于验证的一组 1032 个转录因子。


聚类分析和子聚类对齐

为了识别5Ht和6Ho小鼠中基底上皮细胞的亚簇,我们首先标准化了AUC矩阵,以便每列(代表调节子)的平均值为0,标准差为1。然后,我们对标准化的AUC矩阵应用聚集性、平均连锁分层聚类,根据调节子的细胞活性将调节子和细胞划分为不同的组。相关性用于衡量变量(调节子或细胞)之间的相似性。分层聚类算法是使用 Cluster 3.0 (v.1.59) 实现的。


具体来说,首先对5Ht小鼠的基底上皮细胞和调节子进行聚类。为了促进 5Ht 和 6Ho 小鼠中亚簇的比对,我们重新排序了 6Ho 小鼠中的调节子,以匹配簇状 5Ht 调节子的顺序。然后,我们在6Ho小鼠的基底上皮细胞上进行聚类,而不对调节子进行聚类。该策略通过保持相同的调节顺序促进了两个小鼠组之间的比较。


然后根据可辨别的模式对两个小鼠组中的子簇进行对齐,如聚类 AUC 矩阵的热图所示。这些子簇被分类为“相似”(在两个小鼠组中表现出可比的模式)或“唯一”(显示仅针对一组的模式)。


可视化

UMAP 图是使用 Seurat 中的 DimPlot() 函数生成的,以说明已识别子聚类在二维 (2D) 空间中的空间分布。FeaturePlot()函数用于可视化5Ht或6Ho小鼠所有基底上皮细胞中基因的表达水平。点图是使用 Scanny 的 dotplot() 函数生成的。对于热图,我们利用 TreeView (v.1.2.0) (https://sourceforge.net/projects/jtreeview/files/jtreeview/1.2.0/) 来显示两个小鼠组中 AUC 矩阵的分层聚类。


子聚类的质心分析

首先将 5Ht 和 6Ho 小鼠的 AUC 矩阵组合在一起,以创建包含细胞作为行和调节子作为列的单个矩阵。然后逐列缩放矩阵,使每列的平均值为 0,标准差为 1。然后,我们对缩放矩阵应用主成分 (PC) 分析以选择前 15 个 PC;之后,在R中使用UMAP包(v.0.2.10.0)(n_neighbors = 30,min_dist = 0.3,欧几里得度量)执行UMAP,以获得每个细胞的AUC调节子分数的2D嵌入。然后通过每个小鼠组的子簇(S1-S3,U1_wt)在UMAP图上注释细胞,以说明子簇的跨组比对。


为了定量比较子聚类的距离,我们首先计算每个子聚类的质心作为子聚类内所有细胞的二维UMAP嵌入的平均值,然后计算5Ht和6Ho小鼠子聚类质心之间的成对欧几里得距离,以测量两个小鼠组中子聚类的距离。


差异基因表达分析

我们使用归一化的scRNA-seq数据集进行DGE分析,以鉴定两个小鼠组中鉴定的所有基底上皮亚簇中的DEG。使用 FindMarkers() 函数和 MAST 测试和绝对对数来识别 DEG2倍数变化阈值为 0.585(即原始缩放比例中的倍数变化为 1.5)。我们还将两个比较组之间的检测分数(“min.diff.pct”)的最小差异和“min.pct”分别设置为 0.15。我们使用MAST测试,因为它使用针对scRNA-seq数据量身定制的障碍模型来识别两组细胞之间的DEG[49]。FindMarkers() 使用 Bonferroni 校正来解释多假设检验。


对于“相似”的亚簇(S1-S3),在两个小鼠组中的每个子簇与其对应物之间鉴定了DEG。对于“独特”亚簇(即 5Ht 小鼠的 U1_wt),在“唯一”亚簇和同一小鼠组的所有其他基底上皮细胞之间鉴定了 DEG。


鉴定 5Ht 和 6Ho 小鼠之间显着不同的调节子

对于基底上皮细胞的每个亚簇,我们使用Wilcoxon秩和检验鉴定了两组小鼠之间AUC评分显著不同的调节子,然后使用Benjamini-Hochberg程序进行多次测试校正以控制错误发现率(FDR)[50]。FDR 调整后的 p 值< 0.05 且绝对平均 AUC 分数差异> 0.15 的调节器被认为存在显着差异。对于“相似”亚簇(S1-S3),比较两个小鼠组中相应基底亚簇之间每个调节子的AUC评分。对于“唯一”亚簇(即 5Ht 小鼠的U1_wt),比较每个“唯一”亚簇中的细胞与同一小鼠组的所有其他基底上皮细胞之间的 AUC 分数。


功能富集分析

为了识别DGE分析中的DEG和网络分析中检测到的调节子中的DETG中显着富集的基因功能组,我们使用R中clusterProfiler包中的enrichGO()和enrichKEGG()函数进行了功能富集分析[51].这些函数使用超几何检验估计感兴趣基因中基因本体 (GO) 和 KEGG 通路的过度代表性。DGE分析中使用的18,103个独特基因集作为DEGs富集分析的基因域。将用于网络分析的4885个独特基因集用作DETGs的基因域。如果 GO 项或 KEGG 通路的 Benjamini-Hochberg FDR 调整 p 值< 0.05,则认为它显着富集。


结果的外部验证

为了验证我们从对照小鼠的U1_wt基亚簇获得的结果,我们研究了GEO数据库中的两个公开可用的外部微阵列数据集,GSE65194 [33]和GSE45827 [34],这些数据集是使用Affymetrix U133 Plus 2.0微阵列从同一队列的乳腺癌患者中收集的。具体来说,GSE65194数据集包含来自 41 个 TNBC 样本的 55 个阵列,以及来自同样多的正常组织的 11 个阵列。在55个TNBC阵列中,还生成了14个样品的技术重复。使用自定义的 Affymetrix 芯片定义文件 (CDF) 处理该数据集,以改进 GeneChip 探针组的解释并提高下游分析的准确性。GSE45827数据集包括来自相同 41 个 TNBC 和 11 个正常组织样本的微阵列数据,每个样本都有一个技术重复,使用默认探针组定义进行处理。使用GEO2R工具对两个数据集进行DGE分析,该工具在R中使用利马包[52]进行分位数归一化并拟合基因线性模型,然后进行经验贝叶斯调节以找到41个TNBC和11个正常组织之间的DEG。如果 Benjamini-Hochberg FDR 调整的 p 值< 0.05,绝对 log₂FC > 0.585(即原始标度的倍数变化为 1.5),则认为 DEG 显着。然后我们将这两个 DEG 列表与子聚类分析中确定的基因进行了比较。由于阵列组成、重复结构和 CDF 注释的差异,这两个微阵列数据集产生了不同的 DEG 结果,并且它们一致的 DEG 重叠为我们的发现提供了可靠的交叉验证。


5Ht和6Ho小鼠乳腺的免疫组化分析

为了识别巨噬细胞,使用 F4/80 抗体对乳腺切片进行免疫染色,F4/80 抗体是一种已知标记巨噬细胞的标记物。将切片脱蜡并通过分级酒精系列(100%、95% 和 70%)再水化到磷酸盐缓冲盐水 (PBS) 中,以去除石蜡并将组织恢复到适合染色的水状态。通过与3%H₂O₂孵育20分钟阻断内源性过氧化物酶活性,以防止非特异性背景染色。为了进行抗原修复,将载玻片在柠檬酸钠缓冲液中蒸30分钟,以暴露表位并增强抗体结合。然后用亲和素/生物素封闭试剂盒(Vector Laboratories,SP-2001)和 5% 山羊血清封闭切片,以防止抗体与生物素或其他蛋白质的非特异性结合。


封闭后,将组织与抗 F4/80 一抗在 4°C 下孵育过夜,以允许与巨噬细胞抗原特异性结合。切片用生物素化山羊抗兔IgG抗体(Vector Laboratories,BA-1000)在室温下处理60分钟,然后与链霉亲和素-辣根过氧化物酶(Vector Laboratories,SA-5704)孵育30分钟以扩增染色信号。使用二氨基联苯胺(DAB,Vector Laboratories,SK-4100)开发染色信号,产生深棕色染色以标记巨噬细胞。然后用苏木精复染切片以可视化细胞核,并使用尼康Eclipse 80i显微镜捕获图像。


支持信息

S1 图。 免疫荧光图像显示,6Ho 敲除 (KO) 小鼠中的 P4HA1 表达在 K14 阳性乳腺上皮细胞中被沉默。

https://doi.org/10.1371/journal.pgen.1011505.s001


(TIF)


S2 图。 由(A)5Ht和(B)6Ho小鼠组分割的集成UMAP图。

https://doi.org/10.1371/journal.pgen.1011505.s002


(TIF)


S3 图。 在基底和管腔上皮细胞以及 5Ht 和 6Ho 小鼠中鉴定的巨噬细胞中经典标记基因的表达。

点图显示了上皮基底细胞(Epcam,Krt18,Krt19,Krt14,Krt5),上皮管腔细胞(Epcam,Krt18,Krt19,Krt8),巨噬细胞(Cd14,Adgre1)和免疫细胞(Ptprc)的标记基因在5Ht和6Ho小鼠的三种主要细胞类型中的表达。


https://doi.org/10.1371/journal.pgen.1011505.s003


(TIF)


S4 图。 通过树状图分层聚类揭示的 5Ht 和 6Ho 小鼠的子簇。

热图显示了 (A) 5Ht 小鼠和 (B) 6Ho 小鼠基底上皮亚簇的树状图及其调节模式。单元格以行形式显示;在两个小鼠组中检测到的 245 个常见调节子列中显示。


https://doi.org/10.1371/journal.pgen.1011505.s004


(TIF)


S5 图。 经典标记基因在 5Ht 和 6Ho 小鼠基底上皮亚簇中的表达。

点图显示上皮基底标记物(Epcam,Krt18,Krt19,Krt14,Krt5),上皮管腔标记物(Epcam,Krt18,Krt19,Krt8),巨噬细胞标记物(Cd14,Adgre1)和免疫细胞标记物(Ptprc)在5Ht和6Ho小鼠的所有基底上皮亚簇中的表达。


https://doi.org/10.1371/journal.pgen.1011505.s005


(TIF)


S6 图。 UMAP 图显示了 5Ht 和 6Ho 小鼠中基底上皮细胞的亚簇,这些亚簇基于它们的调节子活性的 AUC 分数。

https://doi.org/10.1371/journal.pgen.1011505.s006


(TIF)


S7 图。 UMAP 图显示了基于 scRNA-seq 表达谱的 5Ht 和 6Ho 小鼠中基底上皮细胞的所有亚簇。

根据 5Ht(左图)和 6Ho(中图)基底上皮细胞中常见调节子的活性来鉴定亚簇。说明来自两个小鼠组的“相似”子聚类的集成图位于右侧面板中。


https://doi.org/10.1371/journal.pgen.1011505.s007


(TIF)


S8 图。 在小鼠衰老图谱研究的肌上皮亚簇 (Epi-C11) 中报告的四个炎症特征基因在 5Ht U1_wt 亚簇中也上调。

点图显示 4 个促炎基因 Cd74、H2-Ab1、H2-Eb1 和 Ccl2 在 5Ht 小鼠的亚簇U1_wt中上调。


https://doi.org/10.1371/journal.pgen.1011505.s008


(TIF)


S1 表。 5Ht 和 6Ho 小鼠中三种主要细胞类型的单细胞数量。

https://doi.org/10.1371/journal.pgen.1011505.s009


(PDF格式)


S2 表。 在 5Ht 和 6Ho 小鼠的乳腺基底上皮细胞中检测到的转录因子 (TF)。

使用MGI数据库验证了(A)5Ht和(B)6Ho小鼠中的这些TF。


https://doi.org/10.1371/journal.pgen.1011505.s010


(PDF格式)


S3 表。 5Ht 和 6Ho 小鼠基底上皮亚簇中单细胞、差异表达基因 (DEG) 和显着差异调节子的数量。

https://doi.org/10.1371/journal.pgen.1011505.s011


(PDF格式)


S4 表。 5Ht 和 6Ho 小鼠基底上皮亚簇质心之间的成对距离。

https://doi.org/10.1371/journal.pgen.1011505.s012


(PDF格式)


S5 表。 5Ht 和 6Ho 小鼠“相似”亚簇之间 DEG 中基因功能组的富集。

https://doi.org/10.1371/journal.pgen.1011505.s013


(PDF格式)


S6 表。 5Ht 小鼠亚簇U1_wt中 DEG 中基因功能群的富集。

https://doi.org/10.1371/journal.pgen.1011505.s014


(PDF格式)


S7 表。 5Ht和6Ho小鼠S3亚簇中DETGs的调节子及其富集功能组差异显著。

https://doi.org/10.1371/journal.pgen.1011505.s015


(PDF格式)


S8 表。 5Ht 小鼠亚簇 U1_wt 中参与胶原代谢过程和干细胞分化的基因调节子和富集功能组显着不同。

https://doi.org/10.1371/journal.pgen.1011505.s016


(PDF格式)


S9 表。 5Ht小鼠亚簇U1_wt中DETGs的调节子及其富集功能组差异显著。

https://doi.org/10.1371/journal.pgen.1011505.s017


(PDF格式)


S10 表。 在最近的一项小鼠衰老图谱研究中,5Ht 亚簇U1_wt中显着不同的调节子 TF 显示出开放的染色质峰并在 3M 小鼠中表达。

https://doi.org/10.1371/journal.pgen.1011505.s018


(XLSX)


S11 表。 在最近的一项小鼠衰老图谱研究中,5Ht 亚簇 U1_wt 中的 DEG 显示出开放的染色质峰,在 3M 小鼠中表达,并且也是亚簇 Epi-C11 中的 DEG。

https://doi.org/10.1371/journal.pgen.1011505.s019


(XLSX)


S12 表。 5Ht 小鼠亚簇 U1_wt 中显着不同的调节子 TF 和 DEG 在人 TNBC 和来自外部微阵列数据集的正常样本之间存在差异表达。

https://doi.org/10.1371/journal.pgen.1011505.s020


(XLSX)


引用

1.Rappu P、Salo AM、Myllyharju J、Heino J. 脯氨酰羟基化在胶原蛋白分子相互作用中的作用。论文生物化学。2019;63(3):325–35.PMID:31350381

查看文章考研/NCBI谷歌学术

2.Xu R. P4HA1 是乳腺癌中 HIF-1 通路的新调节因子。细胞应激。2019;3(1):27–8.PMID:31225497

查看文章考研/NCBI谷歌学术

3.Xu Y, Xia D, Huang K, Liang M. 缺氧诱导的 P4HA1 过表达通过下调 FBP1 增强内皮糖酵解来促进缺血后血管生成。J Transl Med. 2024;22(1):74.PMID:38238754

查看文章考研/NCBI谷歌学术

4.Li M, Wu F, Zheng Q, Wu Y, Wu Y. 确定 p4HA1 表达在肺癌、乳腺癌和头颈癌中的潜在诊断和预后价值。DNA 细胞生物学 2020 年;39(5):909–17.PMID:32150689

查看文章考研/NCBI谷歌学术

5.熊 G、斯图尔特 RL、陈 J、高 T、斯科特 TL、萨马约亚 LM 等。胶原蛋白脯氨酰 4-羟化酶 1 对于 HIF-1α 稳定和 TNBC 化疗耐药至关重要。纳特公社。2018;9(1):4456.PMID:30367042

查看文章考研/NCBI谷歌学术

6.普拉特医学博士、佩蒂特 V、阿拉斯代尔·拉塞尔 I、吉拉迪 RR、谢哈塔 M、梅农 S 等。乳腺干细胞具有肌上皮细胞特性。Nat Cell Biol. 2014;16(10):942–50, 1–7.PMID:25173976

查看文章考研/NCBI谷歌学术

7.西尔卡 OK,沙米尔 ER,埃瓦尔德 AJ。肌上皮细胞是上皮播散的动态屏障。细胞生物学杂志 2018;217(10):3368–81.PMID:30061105

查看文章考研/NCBI谷歌学术

8.McCalla SG, Fotuhi Siahpirani A, Li J, Pyne S, Stone M, Periyasamy V. 确定从单细胞 RNA-seq 数据进行计算网络推理的方法的优缺点。G3:基因、基因组、遗传学。2023;13(3):jkad004。

查看文章谷歌学术

9.Blencowe M, Arneson D, Ding J, Chen Y-W, Saleem Z, Yang X. 单细胞组学数据的网络建模:挑战、机遇和进展。Emerg Top Life Sci. 2019;3(4):379–98.PMID:32270049

查看文章考研/NCBI谷歌学术

10.Zhang R、任 Z、Chen W. SILGGM:用于大规模基因网络中高效统计推理的广泛 R 包。公共科学图书馆计算生物学 2018 年;14(8):e1006369。PMID:30102702

查看文章考研/NCBI谷歌学术

11.Yi H, Zhang Q, Lin C, 马 S. 基因表达数据的信息合并高斯图形模型。生物测定学。2022;78(2):512–23.PMID:33527365

查看文章考研/NCBI谷歌学术

12.Chan TE、Stumpf MPH、Babtie AC. 使用多变量信息测量从单细胞数据推断基因调控网络。细胞系统 2017;5(3):251-267.e3。PMID:28957658

查看文章考研/NCBI谷歌学术

13.van Dijk D、Sharma R、Nainys J、Yim K、Kathail P、Carr AJ 等人使用数据扩散从单细胞数据中恢复基因相互作用。细胞。2018;174(3):716-729.e27。PMID:29961576

查看文章考研/NCBI谷歌学术

14.Lim CY, Wang H, Woodhouse S, Piterman N, Wernisch L, Fisher J, et al. BTR:使用单细胞表达数据训练异步布尔模型。BMC生物信息学。2016;17(1):355.PMID:27600248

查看文章考研/NCBI谷歌学术

15.张 S、派恩 S、彼得扎克 S、哈尔伯格 S、麦卡拉 SG、西亚皮拉尼 AF 等。从单细胞组学数据集中推断细胞谱系上的细胞类型特异性基因调控网络。纳特公社。2023;14(1):3064.PMID:37244909

查看文章考研/NCBI谷歌学术

16.Aibar S、González-Blas CB、Moerman T、Huynh-Thu VA、Imrichova H、Hulselmans G 等。SCENIC:单细胞调控网络推理和聚类。Nat 方法。2017;14(11):1083–6.PMID:28991892

查看文章考研/NCBI谷歌学术

17.Pal B、Chen Y、Vaillant F、Jamieson P、Gordon L、Rios AC 等。通过单细胞RNA谱构建小鼠乳腺发育谱系关系。纳特公社。2017;8(1):1627.

查看文章谷歌学术

18.Pal B、Chen Y、Milevskiy MJG、Vaillant F、Prokopuk L、Dawson CA 等。小鼠乳腺上皮细胞发育过程中的单细胞转录组图谱。乳腺癌研究 2021;23(1):69.PMID:34187545

查看文章考研/NCBI谷歌学术

19.Yu L, Cao Y, Yang JYH, Yang P. 从单细胞 RNA 测序数据估计细胞类型数量的基准聚类算法。基因组生物学 2022;23(1):49.PMID:35135612

查看文章考研/NCBI谷歌学术

20.奈克 S、拉森 SB、考利 CJ、福克斯 E.探戈二:免疫与干细胞在健康和疾病中的对话。细胞。2018;175(4):908–20.PMID:30388451

查看文章考研/NCBI谷歌学术

21.Wu B, Shi X, 江 M, Liu H. 癌症干细胞和免疫细胞之间的串扰:肿瘤免疫微环境中的潜在治疗靶点。摩尔癌症。2023;22(1):38.PMID:36810098

查看文章考研/NCBI谷歌学术

22.巴伊克 D,拉西亚 JD。肿瘤进展中的癌症干细胞-免疫细胞串扰。Nat Rev 癌症。2021;21(8):526–36.PMID:34103704

查看文章考研/NCBI谷歌学术

23.Satija R、Farrell JA、Gennert D、Schier AF、Regev A. 单细胞基因表达数据的空间重建。国家生物技术。2015;33(5):495–502.PMID:25867923

查看文章考研/NCBI谷歌学术

24.McInnes L、Healy J、Saul N、Großberger L. UMAP:均匀流形近似和投影。乔斯。2018;3(29):861.

查看文章谷歌学术

25.巴赫 K、彭萨 S、格泽拉克 M、哈德菲尔德 J、亚当斯 DJ、马里奥尼 JC 等。单细胞RNA测序揭示的乳腺上皮细胞的分化动力学。自然通讯。2017;8(1):1–11.

查看文章谷歌学术

26.Zeisel A、Muñoz-Manchado AB、Codeluppi S、Lönnerberg P、La Manno G、Juréus A 等人。通过单细胞 RNA-seq 揭示小鼠皮层和海马体中的细胞类型。科学。2015;347(6226):1138–42.PMID:25700174

查看文章考研/NCBI谷歌学术

27.Baldarelli RM、Smith CL、Ringwald M、Richardson JE、Bult CJ、小鼠基因组信息学组。小鼠基因组信息学:实验室小鼠的集成知识库系统。遗传学。2024;227(1):iyae031。PMID:38531069

查看文章考研/NCBI谷歌学术

28.安加罗拉 BL、夏尔马 S、卡蒂亚尔 N、康 HG、内哈尔-贝莱德 D、帕克 S 等。健康乳腺组织的综合单细胞衰老图谱揭示了衰老和癌症的共同表观基因组和转录组学特征。国家老化。2025;5(1):122–43.PMID:39587369

查看文章考研/NCBI谷歌学术

29.Truong AH,本-大卫 Y.Fli-1 在正常细胞功能和恶性转化中的作用。基因。2000;19(55):6482–9.PMID:11175364

查看文章考研/NCBI谷歌学术

30.李 Y, 罗 H, 刘 T, 扎克森豪斯 E, 本-大卫 Y.ets 转录因子 Fli-1 在发育、癌症和疾病中。基因。2015;34(16):2022–31.PMID:24909161

查看文章考研/NCBI谷歌学术

31.Zeng G, Wang T, Zhang J, Kang YJ, Feng L. FLI1介导缺氧诱导因子1靶基因在缺氧条件下内皮细胞中选择性表达。FEBS Open Bio. 2021 年;11(8):2174–85.PMID:34102031

查看文章考研/NCBI谷歌学术

32.樱井 T、近藤 N、荒井 M、滨田 J、山田 T、木原根岸 F 等。Fli-1(Ets 转录因子家族的成员)在人类乳腺恶性肿瘤中的功能作用。癌症科学 2007 年;98(11):1775–84.PMID:17727680

查看文章考研/NCBI谷歌学术

33.Maire V、Baldeyron C、Richardson M、Tesson B、Vincent-Salomon A、Gravier E 等。TTK/hMPS1 是三阴性乳腺癌的有吸引力的治疗靶点。公共科学图书馆一号。2013;8(5):e63712。PMID:23700430

查看文章考研/NCBI谷歌学术

34.Gruosso T、Mieulet V、Cardon M、Bourachot B、Kieffer Y、Devun F 等。慢性氧化应激促进乳腺癌患者的 H2AX 蛋白降解并增强化学敏感性。EMBO Mol Med. 2016;8(5):527–49.PMID:27006338

查看文章考研/NCBI谷歌学术

35.卡伦 EC、霍姆拉 S、罗森伯格 J、科菲尔特 SB、基特雷尔 F、张 Y 等。巨噬细胞促进癌前乳腺病变进展为浸润性癌症。肿瘤靶标。2017;8(31):50731–46.PMID:28881599

查看文章考研/NCBI谷歌学术

36.Dos Anjos Cassado A. F4/80 作为主要巨噬细胞标志物:腹膜和脾脏的病例。结果 probl 细胞不同。2017;62:161–79.PMID:28455709

查看文章考研/NCBI谷歌学术

37.Wilson NK、Foster SD、Wang X、Knezevic K、Schütte J、Kaimakis P 等。造血干细胞/祖细胞中的组合转录控制:对十种主要转录调节因子进行全基因组分析。细胞干细胞。2010;7(4):532–44.PMID:20887958

查看文章考研/NCBI谷歌学术

38.Pham TH、Minderjahn J、Schmidl C、Hoffmeister H、Schmidhofer S、Chen W 等。造血主转录因子PU.1体内结合位点选择机制.核酸研究 2013;41(13):6391–402.PMID:23658224

查看文章考研/NCBI谷歌学术

39.李 A、林 J、林 JS。MITF 作为免疫力关键调节剂的新兴作用。Exp Mol Med. 2024 年;56(2):311–8.PMID:38351314

查看文章考研/NCBI谷歌学术

40.Sharma SM、Bronisz A、胡 R、帕特尔 K、曼斯基 KC、Sif S. MITF 和 PU.1 在破骨细胞分化过程中招募 p38 MAPK 和 NFATc1 作为靶基因。生物化学杂志。2007;282(21):15921–9.

查看文章谷歌学术

41.Carey HA、Hildreth BE 3rd、Samuvel DJ、Thies KA、Rosol TJ、Toribio RE 等。Eomes 与 PU.1 和 MITF 合作,调节对破骨细胞分化至关重要的转录因子。iScience。2019;11:238–45.PMID:30634169

查看文章考研/NCBI谷歌学术

42.Islam Z、Ali AM、Naik A、Eldaw M、Decock J、Kolatkar PR。转录因子:细胞发育和致癌之间的支点。前肿瘤。2021;11:681377.PMID:34195082

查看文章考研/NCBI谷歌学术

43.贾J、朱F、马X、曹Z、曹ZW、李Y等。药物组合的机制:相互作用和网络视角。Nat Rev 药物 Discov。2009;8(2):111–28.PMID:19180105

查看文章考研/NCBI谷歌学术

44.丹羽 H.控制干细胞中转录因子网络功能的原理。发展。2018;145(6):d ev157420。PMID:29540464

查看文章考研/NCBI谷歌学术

45.Kartikasari AER、Huertas CS、Mitchell A、Plebanski M. 肿瘤诱导的炎症细胞因子和用于癌症检测和预后的新兴诊断设备。前肿瘤。2021;11:692142.PMID:34307156

查看文章考研/NCBI谷歌学术

46.斯图尔特 T、巴特勒 A、霍夫曼 P、哈费迈斯特 C、帕帕莱克西 E、莫克 WM。2019;177(7):1888-902 第 21 页。

查看文章谷歌学术

47.沃尔夫 FA、安格勒 P、泰斯 FJ。SCANPY:大规模单细胞基因表达数据分析。基因组生物学 2018 年;19(1):15.PMID:29409532

查看文章考研/NCBI谷歌学术

48.Moerman T、Aibar Santos S、Bravo González-Blas C、Simm J、Moreau Y、Aerts J 等人GRNBoost2 和 Arboreto:基因调控网络的高效且可扩展的推理。生物信息学。2019;35(12):2159–61.PMID:30445495

查看文章考研/NCBI谷歌学术

49.Finak G、McDavid A、Yajima M、邓 J、Gersuk V、Shalek AK 等人MAST:用于评估单细胞 RNA 测序数据中转录变化和表征异质性的灵活统计框架。基因组生物学 2015;16:278。PMID:26653891

查看文章考研/NCBI谷歌学术

50.Benjamini Y, Hochberg Y. 控制错误发现率:一种实用且强大的多重测试方法。英国皇家统计学会杂志 B 系列:统计方法。1995;57(1):289–300.

查看文章谷歌学术

51.吴 T、胡 E、徐 S、陈 M、郭 P、戴 Z 等 clusterProfiler 4.0:用于解释组学数据的通用富集工具。创新 (Camb)。2021;2(3):100141.PMID:34557778

查看文章考研/NCBI谷歌学术

52.Ritchie ME、Phipson B、Wu D、胡 Y、Law CW、Shi W 等人为 RNA 测序和微阵列研究的差异表达分析提供动力。核酸研究 2015;43(7):e47。PMID:25605792

查看文章考研/NCBI谷歌学术


阅读3
分享
写下您的评论吧