经常有客户问小编,在拿到lncRNA芯片结果后,如何获取想要的lncRNA的序列信息进行后续研究呢?今天小编就来给大家细细地聊聊如何查找lncRNA芯片结果里面的lncRNA序列信息。
通常我们在拿到lncRNA结果数据后,需要对芯片结果进行qPCR定量验证,这个时候就需要获取lncRNA的序列信息用于引物设计,与此同时,后续在对感兴趣的lncRNA进行深入的研究时,同样需要先获取lncRNA的序列信息。我们发现部分客户对于lncRNA序列信息的获取存在一定的疑虑,大家可能没有注意到其实我们在芯片结果里面已经为大家清晰的标出了各lncRNA的数据库来源以及相应的索引号(下图蓝色框标注的信息:Source,Accession),下面我们以人的lncRNA芯片结果里面的lncRNA序列信息的查找为例:
首先我们可以看到,在芯片结果里除了会列出各实验样本的表达信号值外,还详细地列出每个探针对应的lncRNA信息,如下图所示是芯片结果里对每个探针所检测的lncRNA的详细描述:
各表头对应的信息:
ProbeName:lncRNA探针名
ControlType:探针属性
ProbeSeq:探针序列
GeneSymbol:基因名称
Description:对lncRNA的描述
Accession:lncRNA在相应数据库的索引号
Source:lncRNA的数据库来源
Chromosome:lncRNA的染色体来源
Start:lncRNA在染色体上的起始位置
End:lncRNA在染色体上的终止位置
那么获取了这些信息后,我们如何在实际中进行lncRNA序列信息的查找呢,不急,且容小编细细讲来:
ENSEMBLE_GENCODE来源的lncRNA:
打开Ensemble数据库 http://asia.ensembl.org/index.html:
如上图所示,可以有两种方式进行lncRNA序列查找:
a. 在1的位置选择物种后,输入该lncRNA的Accession号:ENST00000421648,点击Go
b.在2的位置直接输入该lncRNA的Accession号,点击搜索图标
跳转到搜索结果页面:
如上图所示,检索结果的第一个即为我们要找的lncRNA:ENST00000421648,点击“cDNA seq”,即可进入到该lncRNA详细的序列信息界面:
这个界面即是lncRNA:ENST00000421648在Ensemble里面的序列信息,点击“Download sequence”:
选择“cDNA(transcripts)”,点击“Download”即可获得包含该lncRNA的转录本序列信息文档。
RefSeq来源的lncRNA
打开NCBI数据库https://www.ncbi.nlm.nih.gov/:
选择“Nucleotide”,输入lncRNA的Accession号:NR_110454,点击“Search”:
获得该lncRNA的信息,点击“FASTA”获取该lncRNA fasta格式的序列信息:
NONCODE来源的lncRNA:
打开NONCODE数据库http://www.noncode.org/:
输入lncRNA的Accession号:NONHSAT016087,点击“Search”,即可获得该lncRNA的序列信息:
LNCipedia来源的lncRNA:
打开LNCipedia数据库 https://lncipedia.org/:
输入lncRNA的Accession号:lnc-SSX2-2:1,点击搜索图表,即跳转到结果页面,下拉获得结果信息:
点击上图中的lncRNA Accession号即可获得更详细的lncRNA信息:
看了上面的介绍,是不是发现lncRNA的序列查找其实很简单,只要根据lncRNA的Accession号在相应的数据库里面进行查找就可以了。当然这种简单是建立在我们升级版后的lncRNA芯片基础上的,那么对于升级前的lncRNA芯片,部分lncRNA序列信息的查找仍然是有一定难度的,这主要归因于目前对lncRNA研究尚不完善,各lncRNA数据库的更新速度非常之快(LNCipedia在17年和18年两年间就更新了四次),很多之前被认为是lncRNA的序列在后续的研究中发现其实根本不是lncRNA或者之前对其的信息描述存在一定的错误,因此这些lncRNA在数据库更新过程中就会被剔除或者更正,而芯片作为商业化的产品,其更新换代的速度势必赶不上lncRNA信息的更新速度,那么就会存在部分芯片中的lncRNA信息在相应的数据库中无法查询到的情况。
对于这种情况,那么可以先看看是不是该lncRNA的名字已经更新了,如LNCipedia来源的lncRNA在目前的版本LNCipedia V5.2中查找不到相关的信息,可以看看该lncRNA是否换名字了,首页里面的“ID history converter”可以根据旧版本lncRNA索引号进行相关序列信息的查找,此外 LNCipedia数据库提供了各版本间Accession号的对应表供查询,从对应表里找到新的Accession号,然后在LNCipedia V5.2进行序列信息查找。如果在对应表里也没有查找到该lncRNA,那么可以通过染色体的位置信息在UCSC上进行查找。如果这些方法都试了,还是找不到该lncRNA的信息,那么可以考虑这个lncRNA已经被证实并非真的为lncRNA,已经被数据库剔除掉了,对于这种情况,我们建议重新选择lncRNA进行研究。
好了,芯片结果里lncRNA的序列信息查找就介绍到这了,不知道您是否对于lncRNA序列信息的查找阔然开朗,持续关注豪哥出品专栏,更多技能与您分享。