肿瘤分型纯生信还能发7分+?哈医大李霞教授团队:独特『肿瘤生态』视角和6000+样本量玩出生信新高度!

肿瘤相关生信一直是生信分析领域的先行者,也正因为是先行者,肿瘤常规预后、分型套路已经被玩的透透的了,然而这两大类分析也是肿瘤生信绕不开的话题,那如何老树开新花呢?

小云这次就带小伙伴们从生信领域大佬团队——哈尔滨医科大学李霞教授团队的最新发文中看看怎么利用老框架发新文章!李霞教授在生信圈里的名头应该是无人不知了吧,她是我国生物信息学学科和专业建设的奠基者、开拓者和领军人才,所带领团队近日发表了一篇肿瘤分型的7分+纯生信文章,大佬团队一出手就知有没有,这篇文章的思路虽然还套着“肿瘤分型”的壳子,但里面的内容是真的新颖,下面咱们来一探究竟:

1)选题新:开创性的从“肿瘤生态系统”视角着手,避开了肿瘤微环境中的常见选题角度,新颖性立马就出现了;

2)分析手段新:应用三步聚类法进行分型分析,并基于配对基因构建单样本分类器,这些高创新的分型分析方法也把整个文章的分析水准提升到一个新level;

3)大数据量:应用肝癌的65个公共数据集的6000+样本,收集68个肿瘤生态系统基因集(包含2831个基因)。不论是基因集的量还是样本量都是相当大的,这样分析出来的结果证据性更强,也更接近临床。

有了这3重提分buff,7分+的纯生信那还不是轻松到手!这样的好思路,小伙伴们也要赶紧学起来,用它突破生信内卷可是再好不过了,高分在向你招手啦!想复现这样的思路也可以call小云哦~

  • 题目:肿瘤生物学、免疫浸润和肝功能定义了与不同驱动因素、存活率和药物反应相关的七种肝细胞癌亚型
  • 杂志:Computers in Biology and Medicine
  • 影响因子:IF=7.7
  • 发表时间:2023年10月

研究背景

肝细胞癌是一种高度异质性的疾病,研究人员通过分析转录组或多组学数据在HCC分子亚型方面做出了巨大努力,然而这些亚类还没有被转化为生物标志物来指导临床实践中的HCC管理。肿瘤异质性由肿瘤生态系统(TES)的成分共同决定,包括肿瘤细胞、免疫细胞、基质细胞和非细胞成分。该研究旨在利用TES相关基因识别亚型,并确定肝细胞癌(HCC)的亚型特异性驱动因素和治疗方法。

数据来源

数据集/队列 数据库 数据类型 样本信息
65个HCC数据集 GEO、TCGA、ICGC等数据库 RNA测序数据+临床信息 6193个HCC肿瘤样本
CHCC-HBV发现队列 RNA-seq数据+临床信息+多组学数据 159个HCC患者肿瘤样本和配对样本
肿瘤生态系统相关基因集 文献、CancerSEA、MsigDB 基因集 68个描述肿瘤生态系统的基因集,共2831个基因

研究流程

作者首先基于2831个描述TES的基因在CHCC-HBV发现队列中进行三步聚类分析,得到7个TES亚型。随后分析亚型间的生存差异,鉴定各亚型的特异性高表达基因并分析其在肿瘤和非肿瘤之间的调控模式。基于HCC肿瘤生态系统基因和CHCC-HBV队列基因之间的2818个重叠基因,在CHCC-HBV发现队列中通过配对基因开发了单样本分类器(sscpgsTES),并在所有HCC数据集中验证7种TES亚型。利用解卷积工具或算法在12个数据集中分析7个亚型的肿瘤生态系统景观。使用带有基因组数据的13个数据集鉴定每种TES亚型的基因组改变驱动因素。基于TACE和ICI治疗队列以及GDSC2和CTRPv2数据库分析7种亚型与药物反应的关系。最后将TES亚型与以前的HCC亚型系统进行比较,评估其预测性能(流程图见图1A)。

主要结果

1. 基于三步聚类方法的亚型分析

作者首先基于2831个描述HCC TES的基因在CHCC-HBV发现队列中进行三步聚类分析,确定了7个TES亚型(图1A)。KM曲线分析亚型间的OS和PFS差异发现,7种TES亚型显示出显著不同的OS和RFS(图1B)。进一步分析7种亚型与多个临床变量的相关性(图1C),并比较7种亚型间血清和组织中AFP(HCC诊断标记物)水平差异(图1D, E)。

图1 7种TES亚型的鉴定和表征

2. 亚型特异性高表达基因的鉴定和调控模式分析

作者首先为每种亚型定义了亚型特异性高表达基因(SShighE基因),即这些基因在该亚型的肿瘤样品中的表达水平显著高于其他六种亚型。7个亚型总共得到862个基因,使用DEseq2进一步检测了这些高表达基因在肿瘤及其配对的非肿瘤组织中的差异表达(图2A)。结果显示,与非肿瘤相比,TES-1和TES-3的大多数高表达基因(比如CCNB2)在肿瘤中上调,并且不限于TES-1和TES-3亚型,表明所有亚型可以共享这种失调/机制,但程度不同。然而,在预后良好的6/7亚型中这种上调的高表达基因较少,并且大多数在肿瘤中没有差异或下调(图2B-H)。

图2 亚型特异性高表达基因的鉴定和调控模式分析

3. 单样本分类器的开发和验证

作者基于HCC TES基因和CHCC-HBV队列基因之间的2818个重叠基因,在CHCC-HBV发现队列中通过配对基因开发了单样本分类器(sscpgsTES),并在所有HCC数据集中验证7种TES亚型,7种预测的亚型在数据集之间有明显不同的分布(图3A)。KM曲线分析显示不同数据集中亚型间的OS差异(图3B, C),并且TES亚型与体内肿瘤倍增事件也高度相关(图3D)。对TES和荟萃队列中每个临床变量与可用数据之间的OS预后C指数进行比较分析,显示TES在预测OS方面具有与BCLC阶段、TNM阶段和MVI相似的表现,同时显著优于其他变量(图3E)。以BCLC分期或TNM分期为协变量进行多变量Cox回归分析显示,TES仍与OS显著相关(图3F–G)。

图3 单样本分类器的开发和验证

4. 亚型间的肿瘤生态系统特征分析

作者使用解卷积工具或算法在12个数据集中分析7个亚型的肿瘤生态系统。结果显示TES-7和TES-2表现出明显更高的免疫和基质评分,而TES-3具有最高的肿瘤纯度(图4A)。同时还分析了7个亚型的肿瘤特性(图4B)、生理功能(图4C),以及微环境(图4D)。随后基于不同基因集计算ssGSEA得分(图4E),比较不同亚型间13种共抑制分子的表达水平(图4F)。

图4 亚型间的肿瘤生态系统特征分析

5. 鉴定每种TES亚型的基因组改变驱动因素

作者使用带有基因组数据的13个数据集以及234个精选的HCC驱动因子基因,鉴定了9个亚型特异性驱动突变基因,并注释了它们的功能(图5A)。基于使用全基因组测序或全外显子组测序的7个数据集,比较亚型之间的TMB差异,显示TMB在不同亚型间具有显著差异(图5B),并且与野生型肿瘤相比,CTNNB1突变型肿瘤具有更高的TMB (图5C)。

图5 7种亚型与基因组改变的关系

6. 亚型间药物反应分析

作者在TACE治疗和ICI治疗队列中分析7种亚型与治疗反应的关系,结果显示7种亚型对TACE的反应有显著差异,TES-4最高,TES-1最低(图6A)。ICI治疗反应显示,PFS最短的是TES-3和TES-4(图6B),但样本量较小在七个亚型之间没有观察到显著的反应模式差异 (图6C)。随后作者利用GDSC和CTRPv2鉴定了亚型特异性高灵敏度化合物,得到6种亚型特异性高敏感性化合物(图6F)。

图6 7种亚型与药物反应的关系

7. TES亚型与以前的HCC亚型系统比较

作者将TES亚型与10个以前的分类系统进行了比较,显示TES亚型与它们显著相关(图7A)。在各队列中比较TES亚型与其他分型系统的OS相关C指数,结果显示,TES亚型在OS、中间终点和体内肿瘤倍增事件中具有最强的预后相关性(图7B)。

图7 TES亚型与以前的HCC亚型系统的比较

文章小结

看完文章,小云真是不得不感叹大佬团队的硬实力!文章从“肿瘤生态系统”的选题方向就抓住了审稿人的眼球,再利用高创新高水平的分析方法和大样本量+大数据量的组合拳,直接拿下了7分+纯生信,简直是把肿瘤分型这个方向玩出了新高度!各位小伙伴们,大佬团队已经给指明了老框架的创新方向,赶快学起来吧!想要复现/设计思路或定制生信分析的朋友欢迎直接联系小云,风里雨里一直在等你~

小云有话说

想了解更多生信思路请持续关注小云公众号哦,想定制创新性思路欢迎直接call小云。另外,还有我们的精品培训课程《肿瘤微环境和免疫治疗课题思路介绍及热点方向分析专题会议》,有意向的小伙伴也欢迎咨询小云哦!

1. 汕头大学医学院附属肿瘤医院马长春团队:4张图拿下7分+,CAR细胞治疗打赢肿瘤免疫突围战!

2. 13分+纯生信只需5张图!DNA甲基化搭上流行病学,原来TCGA+GEO数据库还能这么玩!

3. 0实验也能发27分BMJ顶刊!大规模孟德尔随机化分析强势来袭!蛋白组学+热点疾病buff叠满!

4. 华西医院李响团队送你个10分+创新思路:生信和病理分析联姻,携手搞定皮质激素-免疫串扰难题!

5. 复旦大学&中疾控团队:1区11分+纯生信,71万大队列流行病学分析,环境方向大有可为!