应用UCSC/Ensembl 查找基因启动子(promoter)、内含子、外显子序列 启动子的甲基化,转录因子与启动子的结合调控基因的表达等研究领域一直较为热门
本文图文形式讲解了启动子的概念,利用UCSC 如何查找一个基因的启动子序列,以及外显子和内含子序列的显示
有很多关于此方面的文章由于写作在早期,近年来查询数据库网站的改版使得这些文章有些落伍,使用起来也不方便
本文是最新的关于查询启动子方法的文章,创作于2009/10/14,大家可以完全按此操作
在讲述某个基因的启动子查询之间,我们有必要对基础知识进行一下复习和总结
先看一下中心法则: 启动子是在DNA 转录为RNA 这一步过程中发挥作用的,在此要与DNA自身复制起始点(称作复制子)和由mRNA 翻译为蛋白质时的翻译起始点(以起始密码子ATG 为标志)区别开来
定义:启动子是参与特定基因转录及其调控的DNA 序列
包含核心启动子区域和调控区域
核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节
启动子是RNA 聚合酶特异性识别和结合的部位
启动子方向性,位于转录起始点上游,本身并不被转录
DNA 链上与RNA 链的第一个核苷酸对应的碱基标记为+1(如下图),由此碱基向上游(5’端)数的碱基顺序数为负(-1, -2,……),向下游(3’端)数的碱基为正(+2,+3,……) 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围
总结起来,也就是说启动子约在与mRNA 所对应的DNA 序列之前约2000个左右的碱基
明白了启动子的含义之后,我们以大鼠(rattus norvegicus)的结缔组织生长因子( CTGF) 为例,应用UCSC 基因组浏览器开始查找该基因的启动子序列