寻找基因的CDS, 5'UTR,3'UTR 及Promoter 区等 By Jiao Rui 由于实验需要,最近看了很多这方面的资料,这里做个汇总
首先看下摘自WIKI 的这张图有个大概的了解
一、CDS,5'UTR 和 3'UTR 的寻找 由上图可知,5'UTR 和 3'UTR 虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单
如我现在要寻找human LDLR(人源低密度脂蛋白受体)这个基因的5’UTR 及3'UTR,我直接在NCBI 的GENE 里面输入 LDLR,然后找human 的这个GENE,显示如下: 看到这个页面后,下拉寻找LDLR 的mRNA 序列信息 点击下图的NM_000527
4,便可得到LDLR的mRNA 全序列
看到Homo sapiens low density lipoprotein receptor (LDLR), transcript variant 1, mRNA 后,往下拉菜单,会发现CDS 的信息,直接点击CDS,下方的CDS 序列则被深红标出,而CDS 前面180 多bp 则为LDLR 的5’UTR,而CDS 后面2000 多bp 的则为LDLR 的3‘UTR: 二、promoter 区域 promoter 怎么找
这个比较复杂,目前没找到一个软件或者网站可以精准的找到一个基因的promoter 区
但是 promoter 本身其实就是转录起始点前的一段序列,也可以说是 5’UTR上游的可以几百bp,也可以上千bp,但一般不会超过上游2000bp,有几个网站可以帮助寻找
http://www
mybioinfo
info/ 这个网站极简单,但搜索范围也很大,可以找到5’上游10KB,甚至 100KB
只有填入基因的缩写名称和