然而,“信息共享”既是科研领域也是互联网领域的一大特征。所以,利用网络中公开的“临床公共数据库”,从中筛选出大量的可用数据,进行数据的整合分析则是初始团队的首选研究途径。
小云之前给大家分享过 “NHANES”数据库,今天,小云再推荐一个“SEER”数据库挖掘文章(ps:还没有看到小云前面推荐的“临床公共数据库”挖掘文章的朋友,小云真诚建议之前没看到的朋友可以点击文末链接查看一下,千万不要错过这个发文好途径~)。
这篇文章是北京协和医院王锡山研究团队基于国外的SEER数据库以及国内的患者数据,着力于研究淋巴结清扫数量对于肠癌肝转移患者的预后价值,仅靠生存分析拿下15分+的高分文章,这种好文,要赶快分享给小伙伴们,希望下一个快速发高分文章的就是小云的粉丝朋友~
题目:淋巴结清扫数对结直肠癌肝转移患者的预后影响:基于美国数据库和中国数据库人群的回顾性研究
杂志:International Journal of Surgery.
影响因子:IF=15.1
发表时间:2023年7月
公众号后台回复123,即可获取原文
患有同步性肝转移(LM)的CRC患者的数据来自2010年1月至2017年12月期间美国SEER数据库和2个中国地区登记中心。原发肿瘤部位分为三个亚部位:近端结肠、远端结肠和直肠。通过影像学或组织病理学检查来识别同步LM。同步性LM是指原发性CRC诊断后6个月内发现的肝脏病变。
主要结果是癌症特异性生存率(CSS),即从同步LM诊断到癌症特异性死亡或中国登记处随访结束的时间间隔。
主要自变量是LNY数量。此外,患者的人口统计学和临床信息(年龄、性别)、淋巴结比率(LNR)、阳性淋巴结数量除以总LNY、肿瘤(原发肿瘤部位、肿瘤分级、组织学类型、TNM分期和术前癌胚抗原(CEA))、手术策略(仅原发部位切除、原发部位和转移灶切除)和结果变量(随访时间和生存状态)。肿瘤病理分期按照第七版AJCC TNM分期系统进行表征。
本研究使用了2个队列包括SEER中患有同步性肝转移(LM)的CRC患者临床试验和2个中国地区登记中心的肠癌患者数据。按照建议的淋巴结数量 12 对患者进行分组。使用卡方检验比较分类变量。使用 Kaplan-Meier 方法进行生存分析,并使用对数秩检验评估组间差异。使用 Cox 比例风险回归模型进行多变量分析,计算风险比 (HR) 及其 95% CI。
表1.本研究2个队列的纳入人群特征
对于LNY计数而言,SEER数据库和中国登记系统中手术标本中LNY中位数分别为17(IQR:12-23)和18(IQR:13-26)。大多数患者至少检索到12个LNY(SEER,86.7%;中国队列,83.6%)。此外,不同肿瘤部位的LNY≥12的比例表明,两个队列中近端结肠均高于远端结肠和直肠(表2)。LNY的平均值和中位数也观察到类似的结果。
表2. LNY数与临床特征的相关性分析
在 SEER 队列中,与LNY <12 的患者相比,LNY ≥12 的患者与有更好的 CSS(P <0.001)。当仅将 M1a 或 M1b 阶段的患者纳入分析时,观察到一致的趋势(图 1)。
图1,LNY ≥12的患者有更高的生存期
LNY、LNR、年龄、性别、原发肿瘤部位、分级、组织学类型、M分期、术前CEA和转移灶切除术是CSS的潜在预后因素(均P<0.05)(表3)。将单变量分析中趋于显着(P<0.05)的变量纳入多变量Cox比例风险回归模型中。控制其他预后因素后,LNY≥12的患者仍与较好的CSS相关(HR=0.38;95%CI,0.33–0.44;P<0.001),LNR较高的患者仍与较差的CSS相关(HR=2.26);95%CI,1.80–2.84;P<0.001)。
表3.临床因素与患者预后的相关性
对中国队列患者进行生存分析,发现与LNY<12的患者相比,LNY≥12的患者与更好的CSS显着相关(P<0.001)。当仅将M1a或M1b分期的患者纳入分析时,观察到相同的关系(图2)。单变量Cox回归模型提示LNY、LNR、分级、组织学类型、M分期、术前CEA和转移灶切除均与CSS相关(均P<0.05)。在控制其他预后因素后,多变量分析进一步证明,LNY≥12的患者仍与较好的CSS相关(HR=0.61;95%CI,0.45-0.82;P=0.001),LNR较高的患者仍与较好的CSS相关。较差的CSS(HR=4.02;95%CI,2.11–7.66;P<0.001)和接受转移切除的患者仍与相对死亡风险降低相关(HR=0.44;95%CI,0.33–0.58;P<0.001)。
图2,中国队列患者群体中,LNY ≥12的患者有更高的生存期
在SEER队列中的大多数亚组中观察到LNY≥12患者的CSS获益(图3)。然而,具有粘液/印戒组织学特征的患者和T1-T2阶段的患者没有明显的获益。
图3.SEER队列中的亚组生存分析
在中国队列中的大多数亚组中,LNY≥12患者的CSS优于LNY<12患者,但粘液性/印戒组织学患者、女性和T1-T2亚组患者除外(图4)
图4.中国患者队列的亚组生存分析
这篇文章利用美国临床数据库SEER联合国内的2组肠癌数据,着力于研究淋巴结清扫数量对于肠癌肝转移患者的预后价值。正所谓“中西结合”,既利用了SEER数据库患者数量多、信息完整的优势,同时结合了国内数据的本土化特征,对国内的临床治疗更具有指导意义,如此思路,粉丝们该快点学习,如果你想在临床数据挖掘方向发高分文章,快来尝试一下这个思路吧~
如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对单细胞分析、多组学联合分析等方向感兴趣的小伙伴快来联系小云吧!
小云公众号持续为大家带来最新生信思路,更多创新分析思路请点击链接。需要复现或定制分析思路的朋友欢迎call小云,风里雨里小云公众号等你!
1. 2个月发表9分+纯数据挖掘文章!都来看看NHANES临床公共数据库分析的硬实力!快速发文红利期,错过后悔1年
2. 4张图拿下10分+Nature子刊!SEER数据库挖掘+机器学习算法分类系统构建+TCGA数据库验证,这创新性绝了,速来围观!
3. 川大华西医院陈永平团队:1区Top 11分“孟德尔随机化”新鲜出炉,纯数据挖掘,高性价比发文途径快上车!
4. Q1区12分+影像组学!机器学习算法构建放射组学模型+免疫治疗作用评估,高分文章也没那么难嘛,心动快行动哦!
5. 3张图发到12分+文章你敢信?大队列病理分析联合公共数据做生信验证就能办到!超简单的免疫检查点预后模型构建,速度冲!
原文始发于微信公众号(云生信学生物信息学):北京协和医院王锡山团队:1区Top 15分“SEER”数据结合国内患者数据的整合分析,高性价比发文途径快上车!