巧用小工具,深挖TCGA数据库。
TCGA对于研究肿瘤的同学来说是个大宝藏,基于TCGA数据产生的生物信息学文章也是不计其数,上可发表在CNS这类顶级期刊上,下可灌水发表在一两分的SCI期刊。
相关数据的分析工具在酸谈的公众号里介绍过GEPIA、TCIA、StarBase、TIMER。今天再来给大家介绍一个研究TCGA的DNA甲基化与表达数据的工具——MEXPRESS,网址:https://mexpress.be/
DNA甲基化一般发生在CpG位点,经DNA甲基转移酶催化胞嘧啶转化为5-甲基胞嘧啶,在人类基因中, 大约80%-90%的CpG位点已被甲基化;而DNA的甲基化与转录活性成反比,也会影响基因组的稳定性。癌基因的DNA甲基化水平降低或者抑癌基因的DNA甲基化水平增高都可能会导致肿瘤的发生。
工具的使用只需输入基因名+选择要研究的肿瘤即可,就这么简单粗暴!
以TP53在乳腺癌中的情况为例进行分析,先看各因素(包括组织类型、肿瘤亚型、分子分型、甲基化)与表达的关系:可以看到有3个位置的甲基化与表达呈显著负相关(用的是Pearson检验),而其他如her2 status等等临床因素与基因表达之间没有显著的关系。
然后我们看看其他因素(不同的肿瘤统计分析了不同的因素)。以“her2 status”为例,her2阳性的患者容易转移复发,预后生存较差,点击“her2 status”(三角箭头指着谁,就分析包括表达、甲基化在内的其他所有因素与该因素之间的关系)。
可以发现结果展示发生了变化:数据根据her2 status进行了重排,然后根据不同的her2 status进行了统计检验,发现有一些其他临床因素与her2 status存在相关性,也有一些甲基化位点的甲基化水平在不同的her2 status中存在差异。
因为相比于基因编码区的甲基化,启动子区的甲基化对基因表达活性的影响更大。点击highlight promoter probes会高亮启动子区的探针结果,大家可以自行点击看一下颜色变化。
然后点击探针号时,会显示该探针对应的位置和性质,当我们在工具上发现一个位置的甲基化与某个因素显著相关时,通过了解该位置的特征和信息可以帮助我们设计下一步的研究。
关于网站的使用,就介绍到这里了,总结一下,这个在线工具可以用来探索、挖掘样本因素(分子分型、样本类型等等)、基因甲基化、基因表达之间的关系,大家可以根据自己的研究目的来在线工具上寻找一些潜在的机制。祝大家文章顺利发表。