妈妈再也不担心我的单细胞分析了,点击就送的逆天外挂!天津医科大学杨扬团队两个月接收到发表,玩出深度学习新高度!






妈妈再也不担心我的单细胞分析了,点击就送的逆天外挂!天津医科大学杨扬团队两个月接收到发表,玩出深度学习新高度!

小途  生信果  2024-04-03 19:00:30

单细胞转录组测序(scRNA-seq)在肿瘤研究的运用发挥了巨大的作用。无论是申请课题基金,还是我们做生信挖掘,两者一直都是临床医生和科研人的“重点照顾对象”!单细胞数据的分析姿势你学会了多少呀?~~~
新文献里能把单细胞数据搓出新火花的工具大家可一定要试一试!今天小途送上一个SCI外挂CellNetdb
(http://www.bioailab.com:3838/CellNetdb),肿瘤微环境细胞分型、基因表达、细胞通路样样精通不说,重建肿瘤/免疫细胞互作网络简直是不可多得的杀招呀!干货太多,马上开讲:
1.收集44种肿瘤的scRNA-seq数据进行无监督聚类,使用SCINET重建特定细胞类型的互作网络
2.开发出CellNetdb,可提供基于单细胞转录组的细胞分类概述、可视化基因表达水平和信号通路、探究不同细胞间的互作网络
3.使用SCINET引入的拓扑特异性(topS),测量特定细胞类型内观察到的基因总体互作强度与从随机模型中获得的预期强度之间的偏差    
4.疾病相关基因集反卷积到单个细胞类型中,通过网络连通性分析确定与预后相关的细胞类型
5.在不同实体肿瘤的恶性细胞检测特异性网络,应用网络群落检测方法Infomap识别了肿瘤相关的核心子网络
6.在RWR、GenePanda、Node2Vec和DIAMOnD四种方法中评估出RWR在利用生物网络对风险基因进行优先排序表现更好。还可针对不同免疫细胞亚群的互作组网络来确定风险基因的优先级。
只是看了这几条总结小途已经心潮澎湃了耶!工具顺手,谁用着不香啊!想中高分期刊,为自己的小论文锦上添花的同学们快来试试吧!对数据挖掘和深度学习感兴趣但技术受限的,或是对生信数据统计分析迷茫的宝子们,快来扫码联系小途复现吧!~

l题目:跨越44种人类肿瘤类型的细胞类型特异性互作组网络图谱
l期刊:Genome Medicine
l影响因子:IF=12.3
l发表时间:2024年2

研究背景
基因互作网络的破坏可能损害细胞功能,导致人类肿瘤等疾病。人们投入了大量的精力来构建参考交互组网络。然而精确的基因互作网络可能在时空背景下被重塑。    
肿瘤是由不同类型的细胞组成的异质性混合物。scRNA-seq已被广泛用于解决肿瘤微环境的细胞异质性。利用人类恶性肿瘤积累的scRNA-seq数据来检测细胞异质性中的基因互作网络,可以补充基于表达的方法来阐明潜在的分子机制。
数据来源
数据集/队列
数据库
数据类型
详细信息
GSE137804
GEO
scRNA-seq
通过10X Genomics平台生成来自16名神经母细胞瘤患者的16个原发性肿瘤、来自6个流产胎儿的4个肾上腺组织和2个胚胎的单细胞mRNA谱
GSE148673
GEO
scRNA-seq
21个肿瘤的46,501个单细胞
GSE168652
GEO
scRNA-seq
宫颈癌患者的癌组织和正常邻近组织进行了单细胞RNA测序
(因篇幅有限,如需查看完整数据集请领取全文查看)
研究思路
作者收集44种不同肿瘤类型的563例患者的单细胞RNA-seq数据。确定了肿瘤中的各种细胞类型,通过协调跨肿瘤类型的细胞类型注释,构建了肿瘤免疫微环境(TIMEs)中不同免疫细胞亚群的泛肿瘤图谱。创建了一个数据门户,CellNetdb (http://www.bioai lab.com:3838/CellNetdb),可浏览、查询和可视化细胞类型特定的交互组网络。体细胞突变谱被映射到互作组网络。对网络进行了功能分析和标注。生存分析被纳入揭示与网络有关的基因的预后相关性。通过对不同细胞类型特异性网络的连通性分析,可将预后特征反卷积到细胞类型中,并发现ITGB1的预后作用与CAF介导的肿瘤进展有关。应用SCINET方法重建了针对不同细胞类型和免疫细胞亚群的互作组网络。此外,还鉴定了网络中与预后相关的基因。我们还研究了细胞间通讯,以研究基因互作如何调节细胞间互作。此外,我们发现这些细胞类型特异性互作组网络能够区分拓扑特异性基因,其总体互作强度是高度细胞类型特异性的。    
图1  设计流程
主要结果
1. 44种肿瘤类型的大规模单细胞图谱
作者收集处理了44种不同肿瘤类型的scRNA-seq数据,包括36种实体肿瘤和8种血液恶性肿瘤(图2)。对每种肿瘤整合了不同样本的scRNA-seq数据,进行无监督聚类。在实体瘤中总共注释了35种不同的细胞类型,在血液恶性肿瘤中注释了14种不同的细胞类型。    
将不同实体瘤的注释CD4+ T细胞、CD8+ T细胞、B细胞和髓样细胞与批量效应校正相结合,定义不同实体瘤类型的TIME景观,建立了422,761个免疫细胞的大规模泛肿瘤图谱。随后进行无监督的基于图的聚类,识别每种免疫细胞类型的各种细胞子集。
   
2  CellNetdb各功能模块的原理图特征
          
2.  跨越不同肿瘤类型的细胞类型特异性互作组网络图谱
使用SCINET(一种从单细胞转录组数据推断基因互作的参考指导方法)重建特定细胞类型的互作网络。采用的参考交互组网络包括STRING、ConsensusPathDB、HumanNet和Reactome。Reactome的节点数和边数都比其他网络少,引导网络的规模低于其他网络。
此外作者比较了由各种参考网络引导的细胞类型特异性网络。性能由基因集恢复任务的真实AUPRC相对于来自程度匹配的零网络的AUPRC背景的稳健z分数决定。性能增益计算为给定网络的AUPRC与其空网络的中值AUPRC之间的差,除以其空网络的中值AUPRC。以恶性细胞特异性网络为例,性能和性能增益之间存在很强的相关性,由STRING引导的细胞类型特异性网络表现出最佳的整体性能。
          
3.  CellNetdb访问
作者开发出CellNetdb。“Taxonomy”页面提供了基于单细胞转录组的细胞分类概述(图1),还包括泛肿瘤免疫细胞亚群的细胞分类信息。使用统一流形近似和投影(UMAP)允许用户可视化不同细胞类型的二维表示和标记基因的表达水平。圆形图用于可视化基于聚合信号通路的细胞间通信。每种单元格类型的单元格数量显示在汇总表中,可通过“summary”面板访问。
“CellNet”页面旨在研究具有多方面功能模块的细胞类型特异性互作组网络(图1)。作者以LUAD的MDK基因为例。MDK在各种人类肿瘤中经常上调,通过选择肺腺癌和上皮细胞,可输入MDK,可视化MDK的局部网络(图2B)。发现MDK与ERBB2和ERBB3有很强的联系。此外,“表达”和“突变”面板分别提供了MDK及其邻近基因的基因表达谱和体细胞突变谱(图2B,C)。“GO”面板显示,在查询的局部网络中,与细胞粘附、生长和ERBB2信号通路相关的GO通路显著富集(图2D)。局部网络显示与疾病恶化、恶性肿瘤和癌症显著相关(图2E)。“生存”面板中,邻近基因SLC2A1与LUAD患者的总生存相关(图2F)。“通信”面板允许用户调查本地网络如何影响不同细胞类型之间的细胞-细胞互作。发现髓系细胞通过MDK与其受体LRP1的互作对恶性上皮细胞做出反应(图2G)。此外发现MDK-LRP1对参与成纤维细胞对恶性上皮细胞的反应。   
          
4.  细胞类型特异性网络揭示了具有优先细胞类型影响的拓扑特异性基因
作者使用SCINET引入的一种称为拓扑特异性(topS)的指标,测量特定细胞类型内观察到的基因总体互作强度与从随机模型中获得的预期强度之间的偏差,在重新排列细胞类型特定互作强度的同时保留了网络拓扑结构。
以泛肿瘤的骨髓细胞为例说明细胞类型特异性网络在理解基因的上下文特异性作用中的应用。首先研究了已知的典型细胞型特征基因是否在网络中发挥着独特的作用,结果表明这些标志性基因在相应的细胞亚群中表现出显著更高的topS值,即推断的局部互作拓扑结构有效捕捉了与环境相关的生物学作用(图3A)。此外根据每个细胞子集的top和tranS分数分别确定了前500个基因,即使在转录特异性和拓扑特异性全局相关的情况下,topS和tranS鉴定的候选基因之间也存在适度的一致性(图3B),表明细胞类型特异性网络可以补充传统的表达分析。
作者还发现了几组在每个细胞亚群中表现出高topS得分但低tranS得分的基因(图3C),在多个细胞亚群中表达,但在不同细胞类型特异性网络中具有不同的拓扑作用。总的来说,细胞类型特异性网络使我们能够研究在细胞类型网络中具有优先影响作用的基因,这些基因不能单独用它们的表达模式来解释。    
图3  泛肿瘤骨髓细胞中具有细胞类型特异性影响的拓扑特异性基因
          
5.  通过网络连通性分析确定与预后相关的细胞类型
作者通过评估疾病基因在细胞类型特异性网络中的拓扑特性,将疾病相关基因集反卷积到单个细胞类型中。采用排列检验方法,从网络中反复随机抽样相同数量的基因产生零分布。根据TCGA临床数据的表达水平确定了前500个预后基因。使用log-rank检验的调整p值对这些基因进行排序。通过对不同细胞类型特异性网络的连通性分析,我们发现预后基因在非癌细胞(包括基质细胞和免疫细胞)中具有很强的网络连通性(图4A),表明一些预后基因可能在肿瘤微环境的非癌细胞中起作用。   
接下来作者重点研究胃癌成纤维细胞特异性互作组网络中预后基因的强连通性。在成纤维细胞特异性网络中鉴定了128个顶级预后基因,其中78个基因彼此紧密相连,有几个与肿瘤转移扩散相关,且在成纤维细胞特异性网络中表现出高度的中心性(图4B)。检查了与其直接相连的顶部枢纽基因(图4C),发现前30个直接邻近基因在雌激素信号通路和局灶粘附中富集(图4D)。与ITGB1直接相连的几个枢纽基因EGFR、FN1和COL1A1,在成纤维细胞特异性网络的预后基因中具有最高的中心性(图4E)。此外,在TCGA-STAD样本中观察到的中位数表达证实了ITGB1与不良生存率的关联(图4F)。因此,我们提出ITGB1的预后影响与CAF介导的肿瘤进展有关。
图4 肿瘤预后基因特征的细胞型反卷积
          
6.  细胞类型特异性互作组网络在不同肿瘤类型中的共性和差异    
作者对不同实体瘤类型的不同细胞类型的特异性网络进行比较。结果表明,特定于相同细胞类型的网络始终聚集在一起,甚至跨越不同的肿瘤类型,这表明细胞环境主要塑造细胞类型特异性互作组网络。
作者检索并比较了不同实体肿瘤类型的恶性细胞特异性网络,揭示与已知恶性肿瘤生理条件一致的相关块(图5A)。恶性上皮肿瘤被发现聚集在一起,不同肿瘤类型之间出现了显著的相关块,应用网络群落检测方法Infomap识别了富含糖酵解、代谢过程、蛋白质磷酸化、MAPK信号通路、细胞粘附和炎症反应相关功能术语的核心子网络(图5B-E)。总的来说,从恶性细胞特有的共享互作组中确定的核心子网络可以提供对候选肿瘤基因的见解,并产生可测试的假设。
   
图5 不同肿瘤恶性细胞特异性互作组网络的比较分析
          
7.  风险基因排序的应用
作者进行基准分析,评估四种代表性方法rwr、GenePanda、Node2Vec和DIAMOnD的性能。利用癌症基因普查(CGC)中注释的基因作为种子基因,用来自6种不同肿瘤类型的恶性细胞特异性网络对风险基因进行优先排序。以NCG 6.0数据库为基准,评估各方法的性能。结果表明,RWR在利用生物网络对风险基因进行优先排序方面优于其他方法。因此在CellNetdb中RWR方法在特定细胞类型的互作组网络中对风险基因进行优先排序。葡萄膜黑色素瘤和急性髓系白血病的案例研究证明了该平台的实用性,揭示了高比例的候选基因被注释为癌症驱动因素(图6A,B)。    
此外,用户可以使用针对不同免疫细胞亚群的互作组网络来确定风险基因的优先级。例如输入与T细胞耗竭相关的基因列表作为种子基因,将返回使用CD8+耗竭T细胞特异性网络优先排序的候选基因列表(图6C)。为了验证其他排名最高的候选基因,我们收集了6个ICB治疗相关的队列,对比分析显示基于患者对ICB治疗的反应,几个排名靠前的基因的表达水平在患者之间存在差异(图6D-F)。例如未反应组预处理患者的KLRD1基因明显下调;在无进展生存期(PFS)和总生存期(OS)方面,KLRD1、CD27和LAGLAS9的高表达组明显优于低表达组(图6G-L),表明优先级分析中排名靠前的基因可能与T细胞衰竭有关,可能影响ICB治疗的有效性。综上不同免疫细胞亚群特异性的互作组网络可能是确定参与癌症免疫的重要基因优先级的宝贵资源。
   
图6 在CellNetdb中对风险基因进行优先排序
                    
文章小结
怪不得两个月就能获得评审的青睐,数据在手用上CellNetdb简直是版本T0了呀!这样的外挂还是公共平台,心动就赶紧用起来吧。小途为大家推荐的工具或平台若是助你SCI功成,可要来和小途报喜哟!说不定小途下一篇就要向大家推送你的文章哦!不了解生信挖掘可用的算法?或是对测序数据分析感到迷茫?就来咨询小途复现吧!
如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对单细胞分析、多组学联合分析等方向感兴趣的小伙伴快来联系小途吧!
小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!

定制生信分析

服务器租赁

扫码咨询小果



往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!