都快2024年了,还有人不知道影像组学?影像组学入门-Pyradiomics提取影像特征!
最近几年,生信分析的热度越来越高,其不用耗费大量的时间在实验室,不需要花费大量的资金,甚至仅仅通过公开数据库,只要你的想法新颖,同样可以做出满意的结果,发表不错的文章!但随着其热度的上涨,越来越多的研究者涌入此领域,生信分析逐渐呈现出较为饱和的状态,所以今天小果给大家带来的教程是刚刚兴起没多久的生信新蓝海–影像组学!
“影像组学”,我们把它们拆成“影像”和“组学”两个词来说。这里的“影像”通常指的就是放射影像,是这种方法研究的对象,目前大家选择最多的是CT、MR等影像。组学,英文为Omics,想必作为生信人的大家一点都不陌生吧,是目前生物和医药前沿研究领域最流行的后缀了,是高通量数据的代名词。所以,影像组学的研究对象是医学影像,研究方法是将影像中的所有信息提取出来再进行系统化分析,确切来说,影像组学是采用自动化算法从影像的感兴趣区(ROI)内提取出大量的特征信息作为研究对象,并进一步采用多样化的统计分析和数据挖掘方法,从大批量信息中提取和剥离出真正起作用的关键信息,最终用于疾病的辅助诊断、分类或分级。
听到这里,大家是不是有些熟悉呢,没错,其实从医学影像中提取出来的数据形式和我们的单细胞数据十分的类似,一张影像可能对应着上千条特征,所以所谓“组学”,真的名副其实。今天给大家手把手教学如何从医学影像中提取影像特征,感兴趣的小伙伴快来跟我一起实战练习吧。特别提示,本次操作需要通过Python进行,并且对电脑配置有一定需求,建议大家使用服务器运行,如果没有自己的服务器欢迎联系我们来租赁服务器哦~
公众号后台回复“111”领取本篇代码、基因集或示例数据等文件;
文件编号:231226
果粉福利:生信人必备神器——服务器
平时生信分析学习中有要的小伙伴可以联系小果租赁,粉丝福利都是市场超低价格,赶快找小果领取免费的试用账号吧!
#安装软件包,命令行模式下,任意位置输入:pip install SimpleITKpip install tqdmpip install pyradiomics#加载软件包import osimport SimpleITK as sitkfrom tqdm import tqdmfrom pandas.core.frame import DataFrameimport timeimport pandas as pdimport radiomicsfrom radiomics import featureextractor
#遍历包含患者DICOM图像的文件
path1 = os.listdir('pic/')
#利用读取器得到目录下所包含的序列ID
reader = sitk.ImageSeriesReader()
series_IDs = reader.GetGDCMSeriesIDs(dir_path)
#加载pyradiomics库
from radiomics import featureextractor
#设置提取器
extractor = featureextractor.RadiomicsFeatureExtractor(para)
往期推荐