机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?

本文转载自”生信鲸“公众号,点击名片加关注,生信热点不迷路!

哈喽小伙伴们!最近过得如何?有没有在某一个瞬间回想起童年的一些经历?那些记忆或许是温馨的,或许是酸楚的。然而那些不好的经历却可能在不经意间播下影响我们晚年健康的种子。
这篇发表在China CDC Weekly上的SCI给我们解释了这一现象的具体原因,并且作者仅用机器学习这一种分析方法拿下一区纯生信文章,简直太让人羡慕了!下面和阿鲸一起来仔细瞧瞧吧~
1. 跨文化比较研究:基于中国CHARLS数据库美国HRS数据库,将中国和美国的老年人群作为研究对象,提供了一个跨文化的视角来探讨童年环境对老年健康的影响,这在以往的研究中较为少见。
2. 机器学习的应用:利用条件推断树森林等机器学习模型来分析数据,这种方法相较于传统的统计方法,能更有效地处理复杂的非线性关系和变量交互作用。
3. 综合评估童年多种环境因素:研究不仅考虑了单一的童年环境因素,而是综合评估了包括健康、财务状况和地区差异等多个维度的影响,提供了一个更全面的分析框架来理解老年健康的决定因素。
ps:想了解更多生信分析选题以及思路的同学,赶快找阿鲸,更多创新思路等着你来学习~)    
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?

题目:应用机器学习方法探索童年环境和老年自评健康——中国和美国,2020-2021

杂志:China CDC Weekly

影响因子:IF=4.7

发表时间:2024年4月

友情提示:文末可获取文献的DOI号哦~

或者关注阿鲸,回复“123”直接后台领取!

文献编号:20240527

研究背景
随着全球人口迅速老龄化和老年人健康负担加重,研究童年环境对晚年健康影响尤为重要。因此,本研究基于美国健康退休研究(HRS)和中国健康退休纵向研究(CHARLS)数据,分析2434名美国人和5612名中国人童年环境与老年身体健康的关联,旨在识别影响健康公平的关键童年因素,并强调早期干预的重要性,以促进老年人口健康。
数据来源
本研究采用2020 – 2021年HRS数据和2020年CHARLS数据,两者都与生活史调查相匹配。最终的样本包括2434名美国人和5612名60岁及以上的中国人。采用自评健康(SRH)作为健康结果的衡量标准,在两项调查中以从优秀(=1)到差(=5)的等级进行评估。    
研究思路
本研究首先利用美国健康退休研究(HRS)和中国健康退休纵向研究(CHARLS)数据,收集美国和中国60岁及以上老年人的信息。然后,采用条件推断树和森林方法评估童年环境对自评健康的影响。通过比较传统参数Roemer方法和机器学习方法,发现童年健康、财务状况和地区差异是老年健康的关键决定因素。最后,强调了早期干预对促进健康公平的重要性,并展示了机器学习在识别影响老年健康因素方面的潜力。
主要结果
1. 方法估计的相关性
作者使用基尼系数来衡量反事实分布中的IOP,基尼系数表明,与中国相比,美国在自我评估健康方面的不平等程度更高。图1显示,传统的参数Roemer方法获得的IOP估计值最高,其次是条件推理林方法和条件推理树方法    
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?
图1 方法估计的相关性
2. 自评健康状况的条件推断树
图2A显示了中国使用具有五个终端节点的树状图显示的自定义健康的IOP结构。这棵树由儿童健康、出生地区和儿童家庭经济状况等因素构成。最有利的类型(终端节点5)包括童年健康状况良好、家庭经济状况良好、出生在华东地区的人。另一方面,自评健康状况最差的一组(终端节点6)的儿童健康状况通常较差。在美国,如图2B所示,童年健康状况较差的个体属于不利环境类型(终端节点7)。相比之下,拥有一定有利条件的个体,如家里有更多的书,童年健康,白人,通常在晚年健康状况较好(终端节点6)。    
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?
图2 自评健康状况的条件推断树。(A)中国;(B)美国
3. 童年环境对自评健康重要性条件的推理森林
图3A显示,在中国,使用条件推理林,影响自评价健康的关键因素是童年健康和出生在中国东部,这证实了条件推理树的发现(图2A)。此外,父母的健康状况(长时间卧床)和与父母的关系对老年人的自评健康也有很大的影响。同样,图3B表明,在美国,儿童健康、10岁时家里的书籍数量和种族/民族是重要因素,这在很大程度上与通过条件推理树获得的结果一致(图2B)。    
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?
图3 童年环境对自评健康重要性条件的推理森林。(A)中国;(B)美国。
4. 模型测试误差比较
如前所述,所有测试模型的设计都是为了最小化均方误差(MSE)。将随机森林模型的MSE标准化为1,以便比较不同模型的预测性能(MSE大于1表示样本外拟合较差)。就自定义运行状况而言,条件推理树和参数Roemer方法的性能都不如条件推理林,如图4A-B所示。平均而言,与传统的参数Roemer方法相比,条件推理树显示出更低的测试错误率    
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?
图4 模型测试误差比较。(A)参数方法vs.随机森林;(B)条件推理树vs.随机森林
文章小结

看完这篇文章,小伙伴是不是又信心满满啦!CHARLS+HRS中西合璧的效果就是这么牛!分析并不复杂,单纯靠机器学习和好的选题思路打造出一篇一区的纯生信文章!阿鲸这里也希望这篇文章不仅能让大家重新拾起发表文章的信心,也能学到更高效的分析方法。结合研究热点,利用纯生信的方法,既可以省一定的经费,又可以轻轻松松发SCI!感兴趣的小伙伴,可以顺着这个路子,开始整活啦!有意向的小伙伴欢迎扫码咨询阿鲸哦!阿鲸有新鲜出炉的生信热点方向,还有一大波的易复现的创新思路,等你来拿哦~

文献信息:PMID: 38532746

DOI: 10.46234/ccdcw2024.043
机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?

定制生信分析

云服务器租赁

扫码咨询阿鲸

往期推荐

1

IF=29!Cell子刊最新发现:轻断食,减脂又健康!蛋白组+转录组+代谢组学联合上大分!

2

超强阵容!巨噬细胞联合“单细胞和空间组学测序技术”太卷了!0实验高段位思维,还不快来学!

3

CHARLS数据库绝了!凭借3张表拿下9.8分!中国医科大学刘洋团队成果:使用固体燃料烹饪可导致心血管疾病

4

同样是中药复方,这篇网络药理学怎么就发了IF=7+SCI期刊?秘籍终于让我找到了!

原文始发于微信公众号(云生信学生物信息学):机器学习揭示童年境遇与晚年健康的关系!“国人CHARLS+美国HRS数据库”的完美结合,中西合璧的魅力,你心动了吗?