生信分析中不可忽视的GTEx数据库






生信分析中不可忽视的GTEx数据库

小果  生信果  2023-01-09 19:00:17

小伙伴们,大家好呀,很高兴和大家见面,最近看到有果粉提问关于TCGA数据没有正常组数据的问题,大部分的癌症数据的分组均是完整的即均有肿瘤与正常组对于有些特殊的疾病它仅保存了肿瘤分组数据这时就需要用到另一个数据库GTEx今天呢我们来聊聊小伙伴们关于TCGAGTEx数据库的疑惑走神的小伙伴还没有准备好的小伙伴此时可千万不能打瞌睡说不定你的几秒钟的专注一不小心就能解决你心中的疑惑快快来看这吧




疑惑一:什么是GTEx数据库?

GTEx全称是Genotype-Tissue Expression称为基因型组织表达GTEx首次出现是2013年在Nature Genetics杂志上发表的文章The Genotype-Tissue Expression (GTEx) project该文中首次介绍了Genotype-Tissue Expression并成立了Genotype-Tissue Expression Consortium2015年发表在Science上标题为The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humans文章中。为了检查个体内组织之间的遗传表达如何变化,基因型组织表达(GTEx)联盟收集了1641个尸检样本,涵盖了175个个体的54个体位点。2017年在Nature上发表了4篇文章其中标题为Landscape of X chromosome inactivation across human tissues的文章指出GTEx整合来自449个个体的5500多个转录组,29个组织的940个单细胞转录组,并结合基因组序列数据。我们可以使用该数据库进行查询几乎所有转录基因的基因表达数据





疑惑二:什么时候用到GTEx数据库?


在使用TCGA数据库的时候,有些癌症的项目收纳的正常组织数据是非常少的,换句话说就是有很多病人,但是这些病人的正常组织的转录组测序结果没有比如说卵巢癌乳腺癌这些疾病的正常组样本非常少此时我们就要去想办法从其他数据库着手找到正常组织的样本数据,此时GTEx数据库就是不错的选择这样在与TCGA数据整合到一起样本量就比较多一些了。

至此今天的答疑就结束了小伙伴们有疑问可以给小果留言小果期待与各位伙伴的交流

推荐阅读


关注小果,小果将会持续为你带来更多生信干货哦。