【oncoEnrichR】癌症分析利器






【oncoEnrichR】癌症分析利器

小果  生信果  2023-12-12 19:01:02

今天小果给大家介绍一个简单好用的生信分析工具箱— —oncoEnrichR(2023年8月 发表 于International Journal of Cancer (IJC))功能非常强大!

oncoEnrichR 是一个 R 软件包,用于在癌症背景下对人类基因列表进行功能检测。该软件   包利用大量的先验分子知识,从系统层面和单个基因层面进行多维度的生物学解释。主要用 于对来自高通量癌症生物学实验(如 CRISPR 筛选、蛋白质近似标记或基因表达谱分析)的 基因列表(此处称为查询集)进行探索性分析和优先排序。该工具可查询大量高质量的数据 资源,以便在交互式报告中汇总癌症相关注释和分析。

值得注意oncoEnrichR 还有在线工具:https://oncotools.elixir.no

一 、安装

下面小果来教你怎么进行安装

要求:

oncoEnrichR requires R (>= version 4.1)

安装命令

install.packages('remotes')remotes::install_github('sigven/oncoEnrichR', ref = "v1.4.2") library(oncoEnrichR)]()

二 、运行

oncoEnrichR 通过以下三个函数执行其操作:

1、oncoEnrichR::load_db()

加载 oncoEnrichR 的底层注释数据存储库,并将其保存到本地缓存目录。使用 googledrive R 软件包

2、oncoEnrichR::oncoo_enrich():

包括两个主要处理步骤

(1)将人类基因/蛋白质标识符(如 UniProt 编号、 RefSeq/Ensembl 转录本标识符等)的 输入/查询列表作为输入,并进行统一的标识符转换;

(2)根据人类基因的癌症相关属性及其相互关系的基础数据源,对查询集进行广泛的注 释、富集和成员分析。

从技术上讲,该方法返回一个包含所有分析内容的列表对象。具体参数/选项和默认值概述 如下:

onco_enrich(query = NULL,oeDB = NULL,query_id_type = "symbol",ignore_id_err = TRUE,html_floating_toc = T,html_report_theme = "default",project_title = "_Project title_",project_owner = "_Project owner_",project_description = "_Project description_",bgset = NULL,bgset_id_type = "symbol",bgset_description = "All protein-coding genes",enrichment p value_cutoff = 0.05,enrichment p value_adj = "BH",enrichment q value_cutoff = 0.2,enrichment_min_geneset_size = 10,enrichment_max_geneset_size = 500,enrichment_plot_num_terms = 20,enrichment_simplify_go = TRUE,subcellcomp_min_confidence = 3,subcellcomp_min_channels = 1,subcellcomp_show_cytosol = FALSE,



regulatory_min_confidence = "D",fitness_max_score = -2,ppi_add_nodes = 30,ppi_string_min_score = 0.9,ppi_string_network_type = "functional",ppi_biogrid_min_evidence = 3,ppi_node_shadow = TRUE,ppi_show_drugs = TRUE,ppi_show_isolated_nodes = FALSE,show_ppi = TRUE,show_disease = TRUE,show_top_diseases_only = TRUE,show_cancer_hallmarks = TRUE,show_drug = TRUE,show_enrichment = TRUE,show_aberration = TRUE,show_coexpression = TRUE,show_cell_tissue = FALSE,show_ligand_receptor = TRUE,show_regulatory = TRUE,show_unknown_function = TRUE,show_prognostic = TRUE,show_subcell_comp = TRUE,show_synleth = TRUE,show_fitness = TRUE,show_complex = TRUE,show_domain = TRUE)

3、oncoEnrichR::write()

包括两个主要处理步骤:

(1)将 oncoEnrichR::oncoo_enrich() 返回的原始分析结果转换为各种可视化和交互式表 格

(2)通过以下方式组装和生成最终分析报告

A) 结构化交互式 oncoEnrichR HTML 报告

B) 多表 Excel 工作簿

三 、输出说明

使用 oncoEnrichR 进行分析的输出结果以两种不同的格式提供:

(1)交互式 HTML 报告

(2)多表 Excel 工作簿

1、HTML 报告

在这里,我们展示了来自 OncoEnricHR 交互式 HTML 报告的结果,下面是可以使用该工具 回答的各种类型的问题。

查询验证

所有的基因/查询标识符都被正确识别了吗?某些查询标识符是否已过时, 并且不 再被视为主标识符?

特征未知基因

·  查询集的哪些成员具有特征不明显/未知的功能?

癌症联系

·  哪些肿瘤类型与 QuerySet 中的基因相关?到什么程度?哪些基因被归类为肿瘤抑 制基因、原癌基因或潜在的癌症驱动基因?       

癌症标志性证据

·  哪些基因被认为是癌症的特征?

药物联系

·  是否有适用于查询集成员的靶向癌症药物?对于哪些癌症适应症,有针对查询集成 员的已批准药物?所有查询集成员的目标可跟踪性是什么?

合成致死率

·  预测哪些基因参与合成致死性相互作用?

基因适合度得分

·  考虑到癌细胞系的大规模全基因组 CRISPR–Cas9 脱落筛选数据,查询集中的哪些 成员对细胞适合度有显著影响?

蛋白质复合物

·  查询集的成员是否与癌症相关的蛋白质复合物有关?

蛋白质结构域

·  哪些蛋白质结构域在查询集的成员中最常见?


蛋白质相互作用网络

·  如何在查询集中表示蛋白质-蛋白质相互作用?哪些蛋白质是相互作用网络中的枢 纽?查询集的哪些成员形成网络中的社区结构?



调节相互作用

·  查询集中是否存在转录调控相互作用?是否同时存在 TF/调控因子和靶标?存在哪 些其他 TF 的调控靶标?其他目标的调控因子是什么?

亚细胞区室

·  如何在查询集中表示亚细胞隔室?



功能和途径富集

·  查询集中富集了哪些生物途径/过程、分子功能或癌症基因标记?

组织和细胞类型富集

·  正常/健康组织中查询基因的组织和细胞类型特异性表达模式是什么?


肿瘤畸变频率

·  通过拷贝数改变或点突变/INDEL,查询集中的基因在肿瘤样本中的突变程度如 何?


肿瘤共表达

·  在肿瘤样本中,查询集的成员是否与其他癌症基因共表达?

预后关联

·  考虑到肿瘤样本中查询基因的表达或甲基化水平或突变状态,哪些基因与癌症患者 的生存有关?

Excel 工作簿

·  Excel 工作簿包含所进行的各种分析的所有结果,这些结果被组织到多个工作表中 (如下面屏幕截图中的红色圆圈所示)

四 、示例代码

library(oncoEnrichR)myc_interact_targets <-read.csv(system.file("extdata","myc_data.csv", package = "oncoEnrichR"), stringsAsFactors = F)oeDB <- oncoEnrichR::load_db(cache_dir = "LOCAL_FOLDER") myc_report <- oncoEnrichR::onco_enrich(query =myc_interact_targets$symbol, oeDB = oeDB, show_cell_tissue = T, project_title = "cMYC_BioID_screen", project_owner = "Raught et al.")oncoEnrichR::write(report = myc_report, oeDB = oeDB, file ="LOCAL_FOLDER/myc_report_oncoenrichr.html", format = "html") oncoEnrichR::write(report = myc_report, oeDB = oeDB, file ="LOCAL_FOLDER/myc_report_oncoenrichr.xlsx", format = "excel")

今天小果给大家带来了oncoEnrichR,不知道小伙伴们有没有收获呢?快运行代码亲自体会 吧~

五 、参考文献

Sigve Nakken, Sveinung Gundersen, Fabian L. M. Bernal, Dimitris Polychronopoulos,  Eivind Hovig, and Jørgen Wesche. Comprehensive interrogation of gene lists from genome-scale cancer screens with oncoEnrichR (2023). Int J Cancer.

doi:10.1002/ijc.34666

往期推荐

1.搭建生信分析流水线,如工厂一样24小时运转Snakemake——进阶命令
2.比blast还优秀的序列比对工具?HMMER来了
3.对单细胞分析毫无头绪?让popsicleR领你入门
4.小果带你绘制ROC曲线评估生存预测能力
5.软件包安装、打怪快又好,1024G存储的生信服务器;还有比这更省钱的嘛!!!