空间转录组数据挖掘?做第一个吃螃蟹的人!南京医科大肿瘤医院1区7+:“单细胞”和“肿瘤微环境” 王炸组合相当给力!






空间转录组数据挖掘?做第一个吃螃蟹的人!南京医科大肿瘤医院1区7+:“单细胞”和“肿瘤微环境” 王炸组合相当给力!

小途  生信果  2024-03-10 19:00:30

没有足够临床样本又对高额的测序费用望尘莫及到底怎么破?你是否也面临着同样的困境?今天路博给大家带来的文章为大家提供了一个解决这个世纪难题的超绝思路,用公共数据库进行数据挖掘就发了7分+的1区期刊!紧紧抓住“单细胞”和“空间转录组”两个热点,王炸组合相当给力!白嫖公共数据库里自己需要的数据,再加上巧妙但简单的思路,发篇一区就是妥妥的!对这个感兴趣的朋友们千万不要错过哟!具体怎么做的接下来就跟着路博一起看看吧~

这篇文章聚焦肿瘤微环境(TME)子宫内膜癌(EC),旨在评估 EC 的 TME 中的细胞群,这篇文章为什么能搞到7+呢?路博来解密一下吧!
1.现在的数据挖掘大多数还停留在RNA-seq上,空间转录组技术更加进步,在提供单细胞基因表达的基础上,还具有细胞空间定位的能力,对于探究细胞间相互作用关系意义重大。从公共数据库同时挖掘单细胞和空间转录组的文章还比较少,双重热点buff相当给力。作者从GEO下载了EC的单细胞RNA-seq(scRNA-seq)和空间转录组(ST)数据集,从TCGA下载了TCGA-UCEC项目的RNA-Seq(FPKM)和临床数据,分析EC的细胞群体;文章还用ST数据分析了空间邻居之间的通信,并证实了MDL-NCL在细胞间通信中的发现。
2.单细胞和空间转录组数据整合分析,不仅创新性高,而且都是从GEO和TCGA中获取的数据,不用担心样本和测序,0实验成本轻轻松松就得到了结果,直接拿下Q1期刊!,这么简单的可复制思路快行动起来!别只会眼巴巴的看别人发高分文章啦(ps:不知道怎么创新的小伙伴可以来找路博!这里有新鲜出炉的生信热点方向,还有一大波的可复现的创新思路,感兴趣的直接来公众号后台找我噢!)。    

题目:整合单细胞 RNA-seq 和空间转录组学揭示子宫内膜癌中 MDK-NCL 依赖的免疫抑制环境
杂志:Frontiers in Immunology
影响因子:IF=7.3
发表时间:2023年4月
研究背景
肿瘤具有广泛的异质性,对肿瘤的进展和治疗反应至关重要。肿瘤微环境(TME)由不同功能表型和空间分布模式的恶性细胞和基质细胞组成,呈现出遗传多样性和克隆选择导致的异质性。子宫内膜癌(EC)是发达国家最常见的女性生殖系统恶性肿瘤,包括不同类型,具有不同的危险因素、预后和转移模式。肿瘤异质性可能对诊断、预后和治疗决策产生重要影响。ScRNA-seq技术可以揭示细胞水平的异质性,为探索EC的TME提供了新途径。研究者使用GEO的scRNA-seq数据研究了EC,并整合了scRNA-seq和空间转录组(ST)来揭示EC的组织结构。              
数据来源
数据集/队列
数据库
数据类型
详细信息
GSE173682
GEO
scRNA-seq数据
5例EC
GSM6177623
GEO
ST数据
1例EC
GSE120490
GEO
RNA-seq数据
145例EC
TCGA-UCEC
TCGA
RNA-seq数据
EC:553例,
正常:35
          
研究思路
本文章的研究聚焦子宫内膜癌(EC)的肿瘤微环境(TME),通过整合单细胞RNA测序(scRNA-seq)和空间转录组学(ST)来评估EC的TME中的细胞群体。作者从GEO下载了EC的scRNA-seq和ST数据集,并使用R软件进行数据分析,具体使用软件包包括Seurat、SingleR、GSVA、clusterProfiler、CellChat和msigdbr等。作者保留33,162个细胞和33,408个基因进行进一步分析,并将细胞分类为9个簇。基因组变异分析使用msigdbr软件包,揭示了上皮细胞和内皮细胞的亚簇中富集的通路显著不同,这表明EC的异质性较大。进一步分析发现,上皮细胞1和2的亚簇表现出更恶性的表型,这可能通过MDL-NCL信号通过MK通路赋予内皮细胞0的亚簇恶性表型。作者还用ST数据分析了空间邻居之间的通信,并证实了MDL-NCL在细胞间通信中的发现。TCGA和GEO分析表明,NCL的表达水平与ImmuneScore呈负相关。                 
          
主要结果
1.EC的scRNA-seq和细胞分型
接受scRNA-seq检查的5个组织均来自子宫内膜样癌患者。经过高质量过滤后,在33,162个细胞中总共检测到20亿个UMI和33,408个基因(图1A)。使用 CCA 校正了批次效应,将得到的9个簇分配到已知的细胞谱系,包括成纤维细胞、上皮细胞、内皮细胞、T细胞、NK细胞、巨噬细胞、纤毛细胞、肥大细胞和B细胞(图1A)。图1B显示每种细胞类型代表性标记基因的表达水平。根据MUC16/CA125的表达,EC细胞来源于上皮细胞和纤毛细胞,癌细胞的转录本比其他细胞多(图 1A、C)。    
图1:子宫内膜样癌的 33,162 个单细胞概述
2.内皮细胞亚簇的鉴定及基因表达分析
总共检测到3,736个内皮细胞并重新聚类成3个簇(图2A)。簇0和1被鉴定为血液内皮细胞,簇2被鉴定为淋巴内皮细胞(图2B)。进一步的分析表明,与血管生成相关的选定基因在簇0和1中高度表达(图2C)。通路分析显示,3个聚类间具有显著的表型多样性,且聚类0参与的通路多于其他2个通路(图2D)。分析TCGA中标记基因的表达,发现0簇的标记基因在SCC和EAC中的表达水平高于EM中的表达水平,而1和2簇的标记基因表现出相反的趋势(图2E)。标记基因的存活分析显示,HSPA1B、TFF3和LAMA4与EC存活率相关(图2F)。    
图2:内皮细胞簇的鉴定及基因表达分析
3.上皮细胞亚簇的鉴定及基因表达分析
总共检测到 5,586 个上皮细胞并重新聚类成 5 个簇 (图3A)。这些簇的标记基因列于表S6中,代表性标记基因显示在图3B。比较了通路活动。集群 0 与其他四个集群有很大不同。第 1 组和第 2 组以及第 3 组和第 4 组相似(图3C)。标记基因在TCGA中的平均表达表现在图3D。除第4簇外,所有簇的标记基因均显示EAC与EM或SCC与EM之间存在显著相关性。标记基因的存活分析显示在图3E,6个基因与EC存活率相关(图3E)。    
图3:上皮细胞簇的鉴定及基因表达分析
4.scRNA-seq数据中细胞间的细胞间通讯
使用 CellChat 和 scRNA-seq 数据分析了 9 个细胞簇之间的通信,发现这些细胞通过 27 条通路相互作用(图 4A、B),图 4A、B按强度排序(从左到右),最上面的一条通路是MK通路。上皮细胞发出的信号最强(图 4A、C、D, S1 );内皮细胞比其他细胞接收到更多的信号(图 4B、D)。细胞主要通过MK信号通路中MDK-NCL的配体受体(L-R)对接触(图4E,S2 )。MK信号通路中的信号显示在图4F,MK通路中配体和受体的表达水平显示在图4G.Midkine(MK,MDK)主要在上皮细胞和纤毛细胞中表达,核仁素(NCL)在所有9种细胞中均有表达。   
 
图4:细胞间通讯
5.上皮细胞与内皮细胞之间的相互作用
进一步分析了上皮细胞亚簇和内皮细胞之间的通讯。我们发现上皮细胞的簇 1(Ep. 1)发出的信号最强,内皮细胞的簇0(En. 0)比其他簇接收到更多的信号(图 S3A–C)。MK也是参与上皮细胞和内皮细胞之间交流的首要途径。MDK – NCL 仍然是 L-R 对中排名靠前的一对(图S3D)。    
图S3:子宫内膜癌中 MDK-NCL 依赖的免疫抑制环境
6.细胞生态位相互作用
使用带有ST数据的NICHES分析了空间邻居之间的通信,在 1,351 个点检测到 660 万个 UMI 和 33,538 个基因。我们分析了ST数据并将其与scRNA-seq数据集整合,并将scRNA-seq中检测到的7种细胞定位到EC组织切片(图 5A、B)。我们使用空间散点饼图来显示 7 种细胞类型 (图 5A),上皮细胞为主要细胞,使用NICHES研究了细胞生态位,它估计了ST数据中的局部微环境。从UMAP图中可以看出图5C,8个簇的微环境之间存在一些明显的重叠,这些重叠暗示了它们之间存在相互作用。计算了“NeighborhoodToCell”测定中所L-R对的行总和,然后对总和进行递减排序,前 20个L-R对列在图S4中。我们发现MDK出现在前 20个LR对中的5个中,包括 MDK-NCL。我们进一步绘制了MDK,NCL以及MDK-NCL与组织区域(图5D)。    
图5:子宫内膜癌组织切片上的细胞类型图谱
7.MDK – NCL 通路诱导的免疫抑制环境
为了探究MK通路在EC中的作用,我们利用TCGA的数据分析了该通路中配体和受体的表达水平。所有配体和受体在 SCC和EM之间或 EAC 和 EM 之间均有差异表达 (图6A)。MDK在SCC和EAC中的表达水平高于EM。NCL 在SCC和EM之间只有细微的区别。在我们的队列中,MDK 和 NCL 在 EC 组织中的表达水平均高于正常组织 (图6B)。我们使用TCGA队列的估计包计算了ImmuneScore、StromalScore和ESTIMATEScore,并评估了它们与MK通路基因的关系。显著的关联显示在图6C,大多数基因与分数(图6C)和NCL与所有三个分数(图 6D).经过分析GSE120490,我们进一步证实了TCGA数据集中的发现(图S5),因此EC细胞可能通过MDK-NCL信号传导通过MK通路抑制TME中的免疫细胞反应。    
图6:MK信号网络涉及的8个基因的表达
文章小结
这篇文章可谓是紧跟当前研究潮流,在热点RNA-seq的基础上,创新性地结合空间转录组技术,这种进步的技术对于探究细胞间相互作用关系意义重大。虽然作者使用了单细胞和空间转录组数据,但都是从GEO和TCGA中获取的数据,这就给我们提供了一个很好的思路,现在的数据挖掘大多数还停留在RNA-seq上,从公共数据库挖掘单细胞和空间转录组的文章还比较少。想在这个方向做点新东西的小伙伴,不要错过这个好思路,还在观望的朋友们留给你们的时间不多了哟,趁着类似的文章少早上车早发表,后面文章大爆发发文的难度就会增大!有需要的小伙伴可以来找小途做设计哟~  

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果


往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!