刘小丰_好大夫在线
微信扫码

微信扫码关注医生

有问题随时问

收藏收藏

方法学

如何查找一个基因的启动子序列

发表者:刘小丰 人已读

刘小丰 收集整理

定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。
区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。
这项搜寻要从UCSC基因组浏览器开始,网址为http://genome.ucsc.edu/cgi-bin/hgGateway。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。
进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。
然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。
对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。
起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。
Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。
Acembly Gene Predictions With Alt-splicing路径是利用Acembly程序将人类mRNA和EST序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的更多信息可以在NCBI的网站找到(http://www.ncbi.nih.gov/IEB/Research/Acembly/)。
Ensembl Gene Predictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,ab initio基因预测使用GENSCAN和基因预测HMMs。 http://www.ebi.ac.uk/ensembl/ Fgenesh++ Gene Predictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一种动态的程序算法推定编码区域和推定外显子5′端和3′端的内含子区域;这个方法也考虑到蛋白质相似性的资料。
Genscan Gene Predictions路径由GENSCAN方法衍生而来,通过这个方法,可以确定内含子、外显子、启动子区域和poly(A)信号。此时,这个方法并不期望查询的序列只出现1个基因,因此可以对部分基因或被基因之间的DNA分隔的多个基因进行准确的预测。
Human mRNAs from Genbank路径显示基因库的人类mRNAs与基因组序列的比对排列。
Spliced ESTs和Human EST路径显示来自GenBank的ESTs序列与基因组的序列对齐比较。由于ESTs通常代表了转录基因的片断,一个EST很有可能对应于某个外显子区。
最后,Repeating Elements by RepeatMasker这个路径显示的是重复元件,例如散在的或长或短的核元素(SINEs和LINEs),长末端重复序列(LTRs)和低复杂性区域(http://repeatmasker.genome.washington.edu/cgi-bin/RepeatMasker)。一般来说,在将基因预测方法应用于核苷酸序列之前,需要去掉或掩饰这些成分。
回到视图显示的例子,可以看到大多数路径返回了几乎同样的基因预测结果。作为一个规则,通过多种方法预测的外显子提高了预测的正确率而不会出现“假阳性”结果。多数方法显示3′端非翻译区,以左侧大而短的块状表示。Acembly路径显示除了全长序列产物(如这个部分第3条线所示)之外还有3个可能的选择性剪接,其它大多数路径显示与此预测结果相符。Genscan路径从左、右方向往远处延伸:GENSCAN可以被用于预测多个基因。
尽管这些图解概要很有用,然而研究者更需要与这些垂直线或块状相对应的序列。以此为例,用Fgenesh++预测作为获得原始序列数据的基础,但不管选择哪个路径其步骤都是一样的。点击标有Fgenesh++ Gene Predictions的路径,出现的是一个描述预测的概要页面。
序列的区域与pendrin基因相似(从这个例子一开始就已经知道了)。给出了序列的大小及序列开始和结束的预测,并显示预测是以负链为基础的。想要获得序列,点击Genomic Sequence。使用者将被带到一个标题为Get Genomic Sequence Near Gene的查询页面,在这个页面上,可以获得转录物、编码区、启动子或转录物加启动子的序列。
点击Transcript返回的页面显示完整的转录子,外显子以大写字母表示。
点击Coding Region Only得到的是编码区,外显子以大写字母表示。
点击Transcript + Promoter,返回的页面显示的是在上述选择Transcript所获序列的5′端添加了启动子序列,以大写字母表示外显子。启动子的长度显示在文本框内。

点击Promoter返回的页面正好是启动子区

2 基因启动子序列的预测分析
真核细胞的基因表达调节虽然是多个水平的调节,但主要是转录水平的调节. 转录水平的调节基础就是转录因子蛋白与启动子DNA序列之间的结合和激活. 转录因子蛋白的结构可以分成结合域(BD,binding domain)以及激活域(AD,activation domain). 作为基因启动子DNA的序列也具有特征性的结构. 但是相比较而言,目前基因启动子以及转录因子蛋白结合的种类,积累的资料还十分有限,数据库容量偏小,计算技术相对滞后,其预测结果仅供参考,还必须结合其他的分子生物学技术进行证实.
一般情况下,确定了一种新基因的编码区序列之后,通过与htgs数据库的同源性比对,可以很方便地确定其相应的基因组DNA序列. 在确定编码基因的起始密码子之后,指导基因表达的启动子序列一般位于其上游基因序列300-3 000 nt之间,鲜有例外. 可以从翻译起始密码子上有的基因组DNA序列,选取3 000 nt左右的核苷酸序列进行生物信息学分析. 例如可以应用在线软件分析技术,或自行研发的启动子序列分析技术等软件分析,如:http://www.cbs.dtu.dk/services/promoter/、http://www.fruitfly.org/cgi-bin/seq_tools/promoter.pl,http://bimas.dcrt.nih.gov/molbio/proscan/等. 根据这些软件分析的结果,首先确定进行缺失突变体构建时应该采用的引物序列,如果一段序列的缺失导致报告基因表达水平的升高,那么说明这一段基因序列存在着启动子的静息子(silencer)的序列,对于基因的表达水平具有负调节作用. 通过逐步缺失的策略,最终确定启动子DNA的核心序列. 报告基因表达载体的构建以及细胞转染技术,仍然是目前研究基因启动子序列活性最为基本的方法.
研究转录因子蛋白的结合及其对基因表达水平的调节作用和性质有许多技术,但是利用生物信息学技术预测的启动子DNA序列的结合的转录因子蛋白结果只有部分参考的意义. 凝胶迟滞(gel shift)试验、超级迁移实验(super shift)、竞争性结合实验、酵母单杂交技术(yeast one hybrid)、噬菌体展示技术(phage display)等在转录因子蛋白与启动子DNA序列结合的研究中具有重要应用前景.

干擾素γ增強GH3細胞中人生長激素基因表達機制

干擾素γ,生長激素基因啟動子,GH3細胞,熒光素酶報告基因interferon-γ,hGH gene promoter,GH3 cell line,luciferase reporter gene

為了研究干擾素γ(IFN-r)對大鼠垂體GH3細胞中人生長激素(hGH)基因啟動子活性的影響及其可能的作用機制,採用熒光素酶報告基因方法,將含hGH基因啟動子(-484~2bp)和熒光素酶報告基因的表達質粒pGL3-484-Luc單獨轉染或與垂體特異性核轉錄因子Pit-1蛋白表達質粒(pcDNA-Pit-1-cDNA)或Pit-1反義寡核苷酸(Pit-1 OND)共轉染於大鼠垂體GH3細胞中,觀察加入IFNγ及細胞內信號轉導途徑的抑制劑後GH3細胞中熒光素酶表達的變化,反映其對hGH啟動子活性的影響;將含不同長度hGH基因啟動子序列的熒光素酶表達質粒pGL3-380-Luc(-380~2bp)、pGL3-250-Luc(-250~2bp)、pGL3-132-Luc(-132~2bp)和pGL3-66-Luc(-66~2bp)分別轉染GH3細胞,觀察它們對IFN-γ的反應,以尋找IFN-γ影響hGH基因啟動子活性的關鍵序列。結果表明,IFN-γ(10^5u/L, 10^6u/L)均能促進大鼠垂體GH3細胞中熒光素酶的表達,最高達對照組的131%(P<0.001);在胞內信號轉導抑制劑中,只有絲裂原活化蛋白激酶(MAPK)信號轉導途徑抑制劑PD98059(40μmol/L),能完全阻斷IFN-γ的促進作用;Pit-1蛋白過表達和表達被抑制對IFNγ的促進作用沒有影響;含不同長度hGH基因啟動子序列質粒中,只有pGL3-380-Luc和pGL3-250-Luc仍具有對IFN-γ的反應性。這說明IFN-γ能增強大鼠垂體GH3細胞中hGH基因的啟動子的活性,此作用可能是通過激活細胞內依賴MAPK的途徑完成的,並與hGH基因上游-250~-132bp啟動子序列密切相關,但與垂體特異性核轉錄因子Pit-1蛋白關係不大。

The method of luciferase reporter gene was used to investigate the effect of interferon-γ (IFN-γ) on the activity of human growth hormone (hGH) gene promoter in rat pituitary GH3 cells, to elucidate the post-receptor signal transduction pathway and the key promoter sequence which mediated the action of IFN-γ. The luciferase expression plasmid pGL3-484-Luc containing hGH gene promoter (-484-2bp) and luciferase reporter gene were transfected alone or cotransfected with pituitary-specific transcription factor Pit-1 expression plasmid (PcDNA-Pit-1-cDNA) or Pit-1 antisense oligonucleotide (Pit-1 OND) into rat GH3 cells. The changes of luciferase expression in the GH3 cells were determined, after treatment with IFN-γ or IFN-γ plus inhibitors of intracellular signaling pathways, to observe the effect of IFN-γ and these inhibitors on the activity of hGH gene promoter. The various deletion constructs of Luc-reporter: pGL3-380-Luc, pGL3-250-Luc, pGL3-132-Luc and pGL3-66-Luc, which contained the -380-2bp, -250-2bp, -132-2bp and -66-2bp sequences of hGH gene promoter, respectively, were transfected into GH3 cells, then the changes of luciferase expression in the GH3 cells were assayed, after treatment with IFN-γ, to find out the key sequence which mediated the action of IFN-γ. Our results showed that IFN-7 (10^5u/L, 10^6u/L) could increase luciferase expression in GH3 cells transfected with pGL3-484-Luc alone, the maximal action being 131% of the control (P<0.001). Among the inhibitors of intracellular signaling transduction pathways, only mitogen-activated protein kinases (MAPK) inhibitor PD98059 (40μmol/L) could completely blocked the stimulatory effect of IFN-γ on hGH gene promoter activity. Pit- overexpression or inhibited Pit-1 expression, both had no effect on IFN-7-induced hGH gene promoter activity. When various deletion constructs of Luc-reporter were transfected into GH3 cells, only pGL3-380-Luc and pGL3-250-Luc still responded to IFN-γ. In conclusion, IFN-γ could increase the activity of hGH gene promoter in rat pituitary GH3 cells. This stimulatory effect of IFN-γ may be associated with the intracellular MAPK signaling pathway and with -252--132bp sequence in hGH gene promoter, but had no relationship with pituitary-specific transcription factor Pit-1.

与DNA结合蛋白相作用的启动子序列的鉴定

信息来源:本站原创 更新时间:2004-3-24 14:35:00

将细胞核置于冰上解冻,精确测定核悬浮液的体积。

番茄子叶细胞核的分离提取为例子进行实验

步骤2~7须在4℃下使用高压灭菌过的设备进行。

1.将番茄种子种在灭菌的水饱和滤纸上,置于小盆内,用薄膜封口后,培养7天。用刀片切下番茄子叶后收集备用。

2.将40~50g新鲜组织放入300ml匀浆缓冲液,用韦林氏搅切器先1×4秒而后6×1秒。

3.过滤匀浆混合液,使其透过漏斗上的4层厚纱布及纱布下按孔径递减次序放置的3层Nitex尼龙筛网(300μm,100μm,52μm),汇入大烧杯中。全部匀浆物均滤完后把纱布集中在一起,将纱布上的滤液压入尼龙网,并使其经漏斗流入烧杯中。切勿将滤液压出尼龙网,亦不可使用抽滤,让滤液靠重力作用下流。

4.将每批滤出的匀浆倒入500ml离心瓶中,用Sorvall GS-3转头5000r/min(4225g),4℃离心20分钟。

5.吸去上清,然后将核粗提沉淀物用大口径塑料巴斯德吸管温和地反复吹吸,使沉淀悬浮于匀浆缓冲液中。将重悬起的沉淀转入50ml离心管中,用匀浆缓冲液调节体积至约40ml。

6.4℃用Sorvall SS-34转头4000r/min(1912g)离心10分钟,再次沉淀细胞核。重复步骤5和6三次,分别在3500r/min离心10分钟,8分钟和6分钟。最后一次离心后,尽可能洗净匀浆缓冲液。

7.将核悬浮于核悬浮缓冲液中,按每50g植物组织加0.5ml核悬浮缓冲液。用液氮冷冻,保存于-80℃。若核蛋白抽提即将进行,可不必将核冷冻起来。

核抽提物的制备

2.加入核裂解缓冲液,使NaCl终浓度为0.47 mol/L(即,每毫升核悬浮加入182μl核裂解液)。

3.将核悬浮液置于摇床上,4℃温和摇动30分钟。

4.4℃微量离心20分钟沉淀染色质。

5.小心移出上清,避免搅起胶状的含DNA的沉淀,以使抽提液中避免含有此类杂质。

6.4℃透析上清3~4小时,中间换几次透析液。

7.将透析液用液氮冷冻,再置于冰上解冻,4℃微量离心或用Sorvall SS-34转头10 000r/min(12 000g)离心15分钟,弃沉淀,保留上清。此步骤是为了将其余可能在浓缩步骤中阻塞微量浓缩器的蛋白质沉淀除去。

8.用CENTRICONTM10微量浓缩器浓缩上清,以使提取液中蛋白质的终浓度为1~3mg/ml。可以溶菌酶为标准物用Bio-Rad Bradford-based蛋白质分析试剂盒来测定蛋白质浓度。经验表明,要达到上述浓度,至少需要浓缩2~3次。

9.留出待作迁移分析的核抽提物,将剩余部分用液氮或干冰冷冻,贮于-80℃备用。

DNA片段的标记

l 聚丙烯酰胺凝胶的制备

1.安装凝胶装置并洗净玻璃板。

2.配制4%丙稀酰胺凝胶液,将以下成分混合:

丙稀酰胺/双丙稀酰胺(29:1) 4ml

TBE(10×) 3ml

APS(10%) 200

nbsp; 200μl

TEMED40μl

制备厚1mm的凝胶,并保证上样孔可容纳25μl样品。凝胶聚合约需1小时,制好后,使用前可于室温放置1天。

l 探针的标记

1.按下表顺序将下列试剂加入1.5ml微量离心管中:

EcoR I酶解的质粒DNA(1μg或约800fmol末端) 2.5μl

Sequerase®缓冲液(5 2.0μl

[α-32P]dATP(6000 Ci/mmol) 3.0μl

二硫苏糖醇(0.1mol/L)

双蒸去离子水(ddH2O) 0.5μl

Sequerase®酶(用4倍Sequerase®稀释缓冲液稀释) 1.0μl

总体积: 10μl

2.室温放置15分钟。

3.加入0.5μl dNTP混合物,充分混匀。

4.室温放置15

μl 0.35mol/L的乙酸钠并充分吹吸混匀以终止反应。

l 测定掺入的放射性活度

1.取5μl标记反应混合物移至一新管中。将2μl此混合物点加到DE81滤膜上,再将该滤膜浸入盛有约20ml 0.5mol/L磷酸钠(pH7.0)的烧杯中。再取第二张滤膜重复上述操作。

2.将烧杯置于平面振荡器上,使溶液温和振荡5分钟,将缓冲液倒入放射性废弃物中。

3.用新缓冲液重复两次清洗步骤。

4.用双蒸水漂洗滤膜5分钟,再用双蒸水重复漂洗两次。

5.用95%乙醇洗滤膜5分钟。

6.使滤膜完全干燥,再将每一张滤膜移入闪烁计数管,加入闪烁混合物,计数。

7.计算理论掺入的最大比率。计算方法如下:1)每个反应可标记400fmol质粒DNA。2)标记反应在EcoR I酶切的质粒DNA两端进行,每个末端可掺入两个脱氧腺苷磷酸残基。3)因此,每400fmol质粒DNA可结合1600fmol标记核苷酸。4)标记核苷酸的比活性是6000 Ci/mmol,即13 000cpm/fmol。5)因此,理论最大掺入值为每400fmol质粒DNA 13 000cpm×1600fmol=2.08×107cpm或每400fmol片段1.04×107cpm。注意,仅掺入量的一半包含在待测片段中。随后的酶解反应会释放出一端标记的待测DNA片段和一端标记的载体DNA。

l 标记探针的分离

1.加95μl酚/氯仿/异戊醇(25:24

:1)于剩余的95μl标记混合物中。充分混匀。

2.室温离心3~5分钟以分离酚相与水相。

3.小心取85μl上层水相于另一干净离心管中,将盛有酚相的离心管弃入放射性废弃物中。加入200μl 95%乙醇于水相中,旋紧管盖后,涡旋混匀。

4.将离心管于碎干冰上放置15~20分钟,然后离心20分钟。

5.用移液器,小心将含乙醇的上清弃于放射性废弃物中。加入600μl 80%乙醇洗涤沉淀,离心1~2分钟,用移液器弃去乙醇。

6.用真空离心蒸发浓缩器干燥沉淀2~3分钟。

7.将沉淀用20μl 1×Sequenase®缓冲液重悬,再加入0.5μl 10units/μl的Pst I将标记的DNA片段从载体DNA上切下。37℃温育30~60分钟。

8.加入2.5μl高EDTA 10×凝胶染液于酶解混合物中。向先制好4%丙稀酰胺凝胶中上样,然后用1×TBE缓冲液在大约10V/cm电压下电泳约2.5小时。电泳时间取决于标记片段的大小。目的是为了很好地分离标记片段与质粒载体,但切勿使目的片段跑出胶外。

9.电泳后,小心地把凝胶用保险膜包裹好,对X光片曝光5~10分钟。使用Sharpie®或其他防水标记物标记胶片及凝胶边缘,以便胶片显像之后可根据标记使凝胶与胶片重合。

10. 切下凝胶上对应地标记DNA的条带,置于1.5ml离心管中。4℃下用300μl洗脱缓冲液温育凝胶薄片过夜,以洗脱DNA

将洗缓冲液移取至另一干净的离心管中。再向凝胶管中加入250μl洗脱缓冲液。-80℃冷冻再解冻,然后将洗脱缓冲液取出与前一次洗脱的溶液合并。将合并后的洗脱液离心10分钟以沉淀聚丙稀酰胺的小碎片。移取上清至另一干净离心管中,用2倍体积的95%乙醇沉淀DNA,碎干冰上放置20分钟,然后离心20分钟。弃上清,用约500μl 80%乙醇洗沉淀。用真空离心蒸发浓缩器干燥沉淀2~3分钟。

11. 将纯化的DNA片段重悬于20μl片段重悬缓冲液中。取一小等份计数测定回收的片段fmol数。一般情况下,大约可以回收原初标记量的50%。从凝胶中洗脱的效率大约为80%,但是收率会因DNA片段的大小而异。纯化的DNA片段可在4℃最多可以保存2个星期。

迁移率变动分析法

l 聚丙烯酰胺凝胶的制备

1.组装电泳装置并洗净玻璃板。

2.按下表配制4%非变性丙稀酰按凝胶溶液:

丙稀酰按/双丙稀酰按(29:1) 4ml

TBE(10×) 3ml

APS(10%) 200μl

TEMED 40μl

可灌制成1~1.5mm厚的凝胶。凝胶聚合约需1小时,使用前可于室温下保存1天。

l DNA-蛋白质结合反应

1.将10mg/ml

的poly(dI-dC)•poly(dI-dC)贮液用无菌双蒸馏水稀释成终浓度6μg/μl。将6μg/μl的poly(dI-dC)•poly(dI-dC)溶液与32mmol/L(pH8.0)的EDTA等体积混合,配制成工作溶液。用片段重悬缓冲液将32P标记的DNA片段稀释至终浓度2fmol/μl。

2.对于标准DNA-蛋白质结合反应,按下表顺序将下列试剂加入1.5ml微量离心管:

32P-标记DNA片段(2fmol/μl) 0.5μl

poly(dI-dC)•poly(dI-dC)+EDTA工作溶液 0.5μl

核抽提液和/或透析缓冲液 9μl

总体积 10μl

吹吸混匀。

3.室温温育45分钟,此时可将凝胶在100V预电泳10~15分钟。

4.温育结束后,可不加染液直接将样品加在凝胶上。在一个小样孔中单独加入10μl含0.05%二甲苯青和0.05%溴酚蓝的透析缓冲液用来跟踪电泳进程。

5.用1×TBE缓冲液在约10V/cm条件下电泳约2小时。具体时间取决于所使用的DNA片段的大小。

6.小心地把凝胶转移到Whatman 3MM

滤纸上并用保鲜膜覆盖在凝胶上。80℃用凝胶干燥器干燥凝胶约1小时。

7.室温下把干燥凝胶对X光片曝光过夜。

DNase I足迹分析法

l 聚丙烯酰胺凝胶的制备

1.组装制作测序胶所需装置并洗净玻璃板。

2.按下表配制4%非变性丙稀酰按凝胶溶液:

丙稀酰按/双丙稀酰按(38:2) 11.3ml

尿素 31.5g

TBE(10×) 3.75ml

APS(10%) 300μl

TEMED 30μl

灌制凝胶。此凝胶聚合约需2小时。使用前可在室温下存放1天。

l DNA-蛋白质结合反应

1.将10mg/ml的poly(dI-dC)•poly(dI-dC)贮液用水稀释成6μg/μl,等体积混合6μg/μl poly(dI-dC)•poly(dI-dC)和32mmol/L EDTA(pH8.0),配制成poly(dI-dC)+EDTA工作溶液。将32P标记的DNA片段用片段重悬缓冲液稀释成2fmol/μl。

2.对于标准结合反应,将以下试剂按下表顺序逐个加入1.5ml微量离心管:

32P标记DNA片段(2fmol;通常约20 000cpm) 1μl

poly(dI-dC)•poly(dI-dC)+EDTA工作溶液 1μl

核抽提液和/或透析缓冲液 18μl

(含20~50μg蛋白质,具体用量取决于抽提物中DNA结合蛋白的活性)

总体积 20μl

吹吸混匀。

3.室温温育30分钟。温育过程中,用DNase I稀释缓冲液稀释DNase I。(对于标准结合反应,稀释后的DNase I的浓度为20μg/ml)

4.每管结合反应混合液中加2μl稀释的DNase I 溶液,吹吸混匀(标准结合反应中,DNase I的终浓度为2μg/ml)。室温温育10分钟,从第一次加样入结合反应混合液终起开始计时。

5.加入80μl DNase I终止液和100μl酚/氯仿/异戊醇(25:24:1)以终止酶解反应。

6.振荡每管样品数秒,注意微量离心管管口应旋紧。室温离心3~5分钟。

7.每管移取85μl上层水相至另一新管,将含酚相的离心管作为放射性废弃物丢弃。向每管水相中加入200

μl 95%乙醇,略作振荡后,将管置于碎干冰上放置15~20分钟。

8.离心20分钟,小心弃上清。向每管沉淀加入500μl 85%乙醇。离心2~3分钟,小心弃去上清,干燥沉淀。

9.将沉淀在真空离心蒸发浓缩器中干燥约5分钟(确保沉淀干燥彻底)。每管中加入3μl甲酰按染液,用Eppendorf振荡器或涡旋混匀。

10. 煮样品3分钟后,立即置于冰上冷却。稍作离心,使样品汇集于管底,再放回冰上。上样于6%测序胶,然后用1×测序TBE缓冲液,在45~50℃ 3000~4000V下电泳,直至溴酚蓝走到凝胶底部。电泳过程中,为保持凝胶温度在45~50℃,可能需要加大电压。

11. 甲醇/乙酸/H2O(5:5:90)固定凝胶15分钟后,将胶移至Whatman 3MM滤纸上用凝胶干燥器干燥。

12. 把干燥凝胶对X光片在-80℃曝光过夜,需使用增感屏。

启动子克隆方法研究进展

作者: 来源: 时间: 2007-03-07 字体: [ ]


随着基因工程的发展,常常需要构建一种能高水平表达异源蛋白质的表达载体。启动子对外源基因的表达水平影响很大,是基因工程表达载体的重要元件。因此研究启动子的克隆方法,对研究基因表达调控和构建表达载体至关重要。

迄今为止,国外尚未见到有关启动子克隆方法的综述性报道,国内仅孙晓红等曾就启动子的结构、分类、克隆方法和食用菌中已经分离到的启动子作过综述。而近年来又有许多改进的克隆启动子的方法获得了多方面的成功,本文就近年来改进的启动子克隆方法作一综述,以期促进对启动子分离技术的应用。

1 启动子克隆的几种方法

1.1 利用启动子探针载体筛选启动子

启动子探针型载体是一种有效、经济、快速分离基因启动子的工具型载体,包含2个基本部分:转化单元和检测单元。其中,转化单元含复制起点和抗生素抗性基因,用于选择被转化的细胞;检测单元则包括1个已失去转录功能且易于检测的遗传标记基因以及克隆位点。

利用启动子探针载体筛选启动子的过程为,先选用1种适当的限制性核酸内切酶消化切割染色体DNA,然后将切割产生的DNA限制片段群体与无启动子的探针质粒载体重组,并按照设计的要求使克隆的片段恰好插在紧邻报告基因的上游位置;随后再把重组混合物转化给寄主细胞,构建质粒载体基因文库,并检测报告基因的表达活性。

当插入段同时满足(1)具有基因启动子序列(2)具有翻译启始区;(3)具有启始密码子;(4)插入方向正确;(5)插入片段3'端编码区序列抗性基因编码区读码框一致,则有可能形成有功能的抗性融合基因,从而启动抗性基因的表达。

最早由Rachael等在大肠杆菌中以四环素抗性基因作为报告基因构建了启动子探针质粒pBRH3B,并克隆了一些原核和真核启动子片段。其后Donna等以氯霉素抗性基因作为报告基因,Fodor等以大肠杆菌LacZ为报告基因,构建了酵母启动子探针质粒并克隆了一些启动子片段。构建启动子探针型载体,较为常见的检测标记基因有β-半乳糖苷酶基因(lacZ)、氯霉素乙酰转移酶基因(cat)、四环素抗性基因(Tet')和卡那霉素抗性基因(Kan')。近年来,人们渐渐较多地使用潮霉素B磷酸转移酶(hph)基因作为检测标记基因。李维等曾构建了含有hph抗性基因的启动子探针型载体pSUPV8,直接在大肠杆菌中分离黄孢原毛平革菌基因的启动子。先用Sau3AI酶切黄孢原毛平革菌基因总DNA,再与用BamHI酶切后的pSUPV8相连,转化大肠杆菌,用间接筛选法从氨苄青霉素和潮霉素抗性平板上筛选重组子,得到6个双抗重组子(pCH1pCH6),电泳检测插入片段分别命名为CHlCH6;再用原生质体转化法将重组子分别转化黄孢原毛平革菌,对获得的转化子进行复筛,仅pCH6的转化平板上有稳定生长的菌落,说明了CH6片段在黄孢原毛平革菌中具有启动基因表达的功能。该方法不需要知道具体基因的序列,可随机筛选启动子,避免了引物设计,能获得大量的启动子片段。

1.2 利用PCR技术克隆启动子

即根据发表的基因序列,设计引物,克隆基因的启动子,由于PCR法简便快捷,近年来人们较多采用此方法克隆基因启动子。

苏宁等根据已报道的水稻叶绿体16SrRNA启动子基因序列设计5'启动子序列的引物,以水稻叶绿体DNA为模板,PCR扩增出16SrRNA基因5'启动子区的片段,酶切克隆到pSKSacISphI位点,构建测序载体质粒pZ16S,进行序列测定,结果表明所克隆的片段长为144bp,含有SD序列。同源比较结果表明,所克隆的片段与水稻叶绿体16SrRNA启动子序列具有100%的同源性。

上述的PCR方法简便、快捷、操作简单,是人们较为广泛使用的技术。

1.3 环状PCR

环状PCR包括I-PCR(Inverse-PCR)P-PCR(Panhandle-PCR)。这2PCR都是根据一端已知序列设计的嵌套式引物进行PCR

1.3.1 I-PCR I-PCR1988年由Triglia最早提出的一种基于PCR的改进的染色体步行方法。

I-PCR的实验程序包括,基因组DNA经酶切后用T4DNA连接酶进行自连接,产生环状DNA片段;以环化产物为底物,用根据已知片段设计的反向引物进行PCR扩增,从而得到含有未知片段的扩增产物(流程如图1所示)

韩志勇等以I-PCR技术为基础克隆了转基因水稻的外源基因旁侧序列。先用小量法提取转基因水稻的总DNA,总DNA10倍过量的限制内切酶进行过夜酶切,酶切片段进行自连接,然后根据工程质粒的T-DNA区设计2对反向引物,进行套式PCR扩增旁侧序列。建立了适合于处理大量材料的克隆转基因水稻中外源基因旁侧序列的技术体系。在1周内克隆了35个转基因水稻株系中外源基因的旁侧序列,长度在300750bp之间。I-PCR法快速、高效、稳定,操作相对简单,花费少,PCR引物设计比较方便。

1.3.2 P-PCR P-PCR是由Jones等提出的利用末端反向重复序列与已知序列互补配对形成环状单链模板,有效增强了引物与模板结合的特异性。反应需要3个根据已知序列设计的引物,3个引物在已知序列内呈线性排列,其中第3个引物可作为接头使用,可与已知序列互补配对形成锅柄状单链模板。其过程为,首先酶切基因组DNA,产生5'3'粘末端,然后连接上合适的接头(primer 3),连接好后最好用核酸外切酶I除去多余的接头,由于连接上的接头与已知序列是反向重复序列,变性后的DNA单链可退火形成锅柄状单链模板,之后分别用3个单引物进行3PCR扩增,能有效地扩增29kbp的大片段未知序列(流程如图2所示)

黄君健等成功地应用P-PCR技术从正常的人外周血单核细胞基因组DNA中扩增端粒催化亚基hTERT基因5'端上游旁侧序列,获得了hTERT基因翻译启始位点上游2090bp的基因组DNA序列。首先用酶切消化基因组DNA,得到带有GATC5'突出端的DNA片段。然后利用已知的hTERTcDNA序列设计PCR引物,用常规的PCR方法扩增出1条大约900bp的基因组特异片段,序列分析为hTERT的基因组DNA片段。根据得到的基因组DNA序列的信息,确定P-PCR的引物退火区,并合成了5'磷酸化的连接寡核苷酸和4条基因特异性引物,其中连接寡核苷酸5'端的4个碱基CTAG与上述核酸内切酶消化产生的5'突出端GATC互补,然后将连接寡核苷酸与基因组酶切产物连接,以连接产物为反应模板,进行PCR,使模板自身进行退 -延伸反应,以形成Panhandle结构。最后以单链Panhandle为模板,4条基因特异序列为引物进行嵌套式PCR,最终获得了1条约2kb的含hTERT基因启动子的DNA片段。Jones等利用改进的P-PCR,在形成panhandle结构之前3'末端连上ddCTP,使引物错配的机率减少,特异性增加。他们从人类基因组DNA已知位点侧翼扩增了49kb的大片段未知序列。P-PCR是目前能够扩增距已知序列最远的未知DNA序列的方法,有很高的特异性。

1.4 利用载体或接头的染色体步行技术克隆基因启动子

这类方法的第一步都是酶切基因组DNA,连接载体或接头,既可以用pUCl8等质粒载体,也可以使用λDNA等噬菌体载体,只要选用的载体带有合适的酶切位点;同样根据实验需要,接头既可以是双链也可以是单链,然后根据基因组DNA序列设计的特异引物和载体的通用引物或接头序列进行扩增。

1.4.1 利用载体的PCR Shyamala等利用的单特异性引物PCR(SSP-PCR)对以小鼠伤寒杆菌组氨酸转运操纵子为起点进行连续步行。以M13mpl8RF DNA为载体。用PstIAraI酶切基因组DNAPstIXmaI酶切载体DNA,然后连接基因组片段和载体片段,用根据基因组DNA序列设计的特异引物和载体的通用引物进行扩增,由于非特异片段没有单特异引物结合的位点,即使有载体连到非特异片段,也无法得到大量扩增,而使特异片段得到有效扩增。

1.4.2 利用接头的PCR王新国等利用衔接头的方法,设计了位于单链DNA两端互补的颠倒末端重复序列,增加了反应的特异性,在胡萝卜II型转化酶基因启动子的克隆方面取得了新的进展。首先将胡萝卜基因组DNA分别用PvuISmaIDraIEcoRV酶切,并设计了1个衔接头长链序列和1个衔接头短链序列,并在衔接头短链的3'末端带有1个氨基的衔接头,能够阻止聚合酶催化的衔接头短链的延伸,同时衔接头的长链和短链之间是反向重复序列。将酶切片段与此衔接头连接,取连接产物做模板,以衔接头引物和基因特异引物做PCR,在首轮PCR中只有限定的远端基因特异引物有结合位点,当基因特异引物延伸产生的DNA链通过衔接头时,才能产生衔接头引物的结合位点,PCR才能以衔接头引物和基因特异引物进行指数扩增。而另一方面,如果非特异合成产生了DNA两端都有双链衔接头序列的PCR产物时,这种PCR产物在每次变性后,单链DNA末端的衔接头反向重复序列将形成锅柄结构,此结构比引物-模板杂交更稳定,能抑制非特异序列的指数增长。最后得到主要的PCR产物为3.4kb1.3kb0.6kb0.4kb。将EcoR V-衔接头体系的PCR产物克隆、测序、同源性比较,得到1个新的胡萝卜II型转化酶基因启动子序列,它含有类似于TATA boxCAAT box的元件,在启动子的远上游区域含多个AT富含区,该启动子的发现对于研究植物中的糖代谢具有重要的意义。接头引物的相对位置如图3所示。

这种方法具有便于操作、实验线路简单的优点,但是特异性较差,产物需进一步杂交验证。

1.5 YADE

Prashar等在扩增cDNA3'端时采用“Y”形接头,以减少接头引物的单引物扩增。

其原理是接头引物处于“Y”接头的2个分叉单链上,序列与接头一样,只有与特异引物引导合成了接头的互补序列后,接头引物才能退火参与扩增,流程如图4

方卫国等尝试将YADE法引入到昆虫病原真菌的分子生物学研究,并取得了成功,建立了适合于球孢白僵菌和金龟子绿僵菌YADE体系。在已克隆的类球孢白僵菌类枯草杆菌蛋白酶基因CDEP-1的基础上,利用YADE法,克隆到该基因的启动子CDEPP

先酶切球孢白僵菌基因组DNA,然后与“Y”形接头相连,取连接产物做模板,先以基因特异引物1做线性扩增,再以线性扩增产物为模板,以接头引物和基因特异引物2做指数扩增,只有当线性扩增时合成了含有接头引物的互补单链,接头引物才能与其发生退火,参与指数扩增,从而有效防止了接头引物的单引物扩增。最后得PCR产物,进行序列分析确定为CDEP-1的上游启动子序列。

在应用YADE法时,内切酶的选择至关重要。好的内切酶产生适合PCR扩增的片段,太大太小都不行。为了得到合适的内切酶,需要从众多的内切酶中筛选。研究表明,不同的物种有自己合适的内切酶。YADE法延伸的起始片段可以是基因组 DNA片段,也可以是cDNA片段,在延伸cDNA片段时,设计的引物需要避开内含子和外显子的边界,在内含子的位置未知的情况下,可考虑多合成12条特异引物,以提高扩增未知片段的机率。该方法假阳性低、效率高,理论上能扩出所有目的片段。

1.6 TAlL-PCR

很早就有用随机引物的PCR,但由于无法有效地控制由随机引物引发的非特异产物的产生,所以一直未能广泛应用。近年来由IJiu等设计的TAIL-PCR(Termal Asymmetric Interlaced PCR)又叫热不对称交错PCR,则解决了这个问题,后来有研究表明,经改良过的TAIL-PCR成功地从突变体中克隆到外源插入基因的旁侧序列,从而为启动子的克隆提供了有效的新方法。

在利用特异引物和随机引物进行PCR中一般有3种产物生成:(1)由特异性引物和简并引物扩增出的产物;(2)由同一特异性弓l物扩增出的产物;(3)由同一简并引物扩增出的产物。在TAIL-PCR反应中,其中后2种目标产物可以通过以嵌套的特异性引物进行的后续反应来消除。

TAIL-PCR的基本原理是利用目标序列旁的已知序列设计3个嵌套的特异性引物(specialprimer,简称sp1sp2sp3,约20bp),用它们分别和1个具有低Tm值的短的随机简并引物(Arbitrarydegenerate primeAD,约14bp)相组合,以基因组DNA为模板.

根据引物的长短和特异性的差异设计不对称的温度循环,通过分级反应来扩增特异引物(流程如图5所示)

TAIL-PCR共分3次反应。第一次反应包括5次高特异性、1次低特异、10次较低特异性反应和12个热不对称的超级循环。5次高特异性反应,使sp1与已知的序列退火并延伸,增加了目标序列的浓度;1次低特异性的反应使简并引物结合到较多的目标序列上;10次较低特异性反应使2种引物均与模板退火,随后进行12次超级循环。

经上述反应得到了不同浓度的3种类型产物:特异性产物(I)型和非特异性产物(Ⅰ型和Ⅲ型)。第二次反应则将第一级反应的产物稀释1000倍作为模板,通过10次热不对称的超级循环,使特异性产物被选择地扩增,而非特异产物含量极低。第三次反应又将第二次反应的产物稀释作模板,再设置普通的PCR反应或热不对称超级循环,通过上述3PCR反应可获得与已知序列邻近的目标序列。

Gento等曾用构建的含有潮霉素抗性基因(hph)的双元表达载体pBIG2RHPH2转化真菌,然后利用TAIL-PCR法克隆得到的真菌转化子基因组DNAT-DNA插入区的旁侧序列并取得了成功。根据T-DNA区的HPH基因设计了扩增右边界的3个引物HS1HS3,以及扩增左边界的引物HAS2HAS4,另外又根据不同的转化子分别设计了简并引物ADlAD3(引物位置如图6所示)

在首轮PCR中,以AD/HS1为引物扩增右边界(AD/HAS2扩增左边界),然后取首轮PCR产物为模板,以AD/HS2(AD/HAS3)进行二次PCR,再以二次PCR产物为模板,AD/HS3(AD/HAS4)为模板进行第三轮PCR,将3轮的PCR产物进行电泳分析结果表明,采用TAIL-PCR的方法成功地从突变体中获得了带有T-DNA左右边界的旁侧序列,从而证明了TAIL-PCR法是有效地扩增基因旁侧序列的方法,为启动子的克隆又增添了1种可行的方法。

TAIL-PCR不需要PCR前的任何DNA操作,避免了环化和连接,速度快,特异性强,效率高,灵敏,在分子生物学研究的各个领域都有广泛的应用。

2 讨论

以上介绍的几种方法基本代表了现有的启动子克隆方法,它们分别具有不同的特点和适用范围。

利用启动子探针载体筛选启动子时,不需要知道具体的基因序列,避免了引物设计,并能获得大量的启动子片段;其缺点是需要构建1个穿梭质粒,建库、转化、筛选,工作量大,费时费力,而且克隆、亚克隆的过程繁琐。因此在基因的遗传背景不是很清楚时,往往通过探针载体随机筛选启动子。

PCR法的主要优点是简便、快捷、操作简单;其缺点是只能扩增两端已知序列间的DNA区,且扩增的特异性较低。其适用条件是建立在对基因序列十分清楚的基础上,只有知道基因的全序列,才可根据已知序列设计引物,扩增出该基因的启动子。因此,在基因序列清楚的情况下.我们首先想到的就是PCR法。

I-PCR法操作简单,克服了文库筛选、克隆、亚克隆的繁琐步骤,对实验条件要求不高,花费少,在PCR法的基础上,增加了DNA的环化过程,从而可以扩增只有一端序列已知的DNA,由于不需要设计和合成大量昂贵的核苷酸接头,因此避免了引物设计和有接头而产生的非特异性产物的麻烦;然而由于直接克隆已知序列外的未知DNA区域依赖于DNA的环化性,而环化连接过程中常常产生多联体,成为副产物甚至是主要产物,导致非特异扩增,造成了闭环双链的DNAPCR扩增效率差,经常得不到满意的结果,同时酶切片段太长也会使扩增效率下降。其适用于寻找只有一端序列已知的DNA,对未知DNA片段进行扩增。

相对于I-PCRP-PCR经过设计形成的是锅柄状单链DNA模板,从而有效增加了引物与模板结合的特异性,p-PCR能够完成全部嵌套式扩增,因而产物有非常高的特异性;其缺点是也存在DNA环化、连接的弊端,但与I-PCR相比,其PCR产物的特异性已大大增加。目前,P-PCR可以扩增位于已知位点侧翼的大于3.0kb的人基因组DNA的启动子,是目前为止能扩增距离已知序列最远的DNA序列的方法.因而常用于扩增大片段的未知序列。

利用载体的PCR克隆启动子有实验设计简便的优点,在基因组DNA中加入含合适酶切位点的载体,是基于PCR法的又一创新之处;然而其实验操作较为繁琐,特异性差,即使用套式PCR,仍然有几条电泳条带,因而特异性产物需杂交进一步确定。

利用接头的PCR克隆启动子的优点是避免了DNA环化,改进的接头可以通过形成锅柄结构有效抑制非特异性序列的扩增,但设计和合成大量的核苷酸接头,价格昂贵;此外用常规的加接头的方法来克隆启动子时往往有接头非特异产物产生,特异性较低,特异产物需杂交确定。由于利用接头的PCR法不需要DNA环化,通常适用于寻找已知cDNA周围未知启动子或其它调控区域。

YADE法在利用接头PCR时,巧妙地设计了“Y”型接头,从而有效地防止接头引物的单引物扩增,延伸时起始片段可以是基因组DNA也可以是cDNA.可用于复杂的基因组的PCR步行,能广泛应用于真核生物;其缺点是成本较高,在应用YADE法时,为了得到合适的内切酶,需要从众多的内切酶中筛选,另外,特殊的接头往往也增加了实验的成本。通常对于较复杂的真核生物基因组可以采用YADE法。

目前理想的启动子克隆方法需要更为广泛的,不需要PCR前的酶切、环化等操作,且特异性较高的PCR技术,TAIL-PCR基本符合这一条件。TAIL-PCR法的有以下优点:(1)方法简单,只要设计好引物,即可用基因组DNA为模板直接进行PCR扩增;(2)特异性高,用简并引物和特异性嵌套引物相组合,通过不对称的温度循环和分级反应,使最终的目的片段占绝对优势;(3)高效灵敏,使用任何一个AD引物,在60%~80%的反应中能产生特异性产物;(4)快速,整个反应可在ld内完成,(5)避免了DNA的环化和连接,反应产物准确可靠,重复性好。TAILPCR的创新之处在于其热不对称的分级反应,有效防止了非特异产物的扩增;但是TAILPCR仍有很多不尽人意的地方:TAILPCR反应需要较多的引物组合;此外,由于随机简并引物存在有限的结合位点,对个别侧翼序列,即使使用不同的简并引物也难以扩增到阳性结果,整个反应需要一系列连续反应,条件设置要求精细;还要求引物和模板有较高的纯度,如果有降解或纯度不够,也很难扩增出特异性条带;此外,TAlLPCR还很有可能扩增的是高度重复序列,因而无法步行。TAILPCR技术适合于分离获得克隆载体上的DNA序列,达到克隆相关基因的启动子的目的,也可用于基因组小的物种,如拟南芥和基因组大的物种,如小麦的已知序列两侧翼的DNA序列的分离。

3 展望

目前,启动子克隆的方法种类繁多,进展迅速。启动子克隆方法绝大多数是建立在PCR的基础上的染色体步行技术,因而利用启动子克隆的方法不仅可以克隆到基因的启动子,同时还可以用于克隆cDNA的全长。分子生物学的一个重要问题是如何利用大量积累的基因部分序列(EST)进一步克隆全长基因及其调控序列,而启动子克隆方法为这一问题提供了简便有效的手段。另外,随着基因工程的发展,出现了越来越多的转基因动植物,启动子克隆的方法也可以应用在转基因生物的研究中,如转基因水稻的TDNA区,通过启动子克隆方法的PCR步行技术,能成功地克隆到TDNA区的旁侧序列,有助于分析突变体中突变区序列。

随着PCR技术的不断进步,一定会有更多、更好的克隆启动子的方法产生,而它们最后也将会是克隆基因全长或突变体(特别是转座子插入突变体)中目的基因的简便高效的新方法。

启动子

启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。启动子(Promoters)就像“开关”,决定基因的活动。既然基因是成序列的核苷酸(nucleotides),那么启动子也应由DNA组成。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶polymerases) 的活动。这种酶制造着基因的RNA复制本。基因的启动子部分发生改变(突变),则导致基因表达的调节障碍。这种变化常见于恶性肿瘤

许多原核生物都含有这两个重要的启动子区:(如图)

启动子是位于结构基因5,端上游的一段DNA序列,能够指导全酶(holoenzyme)同模板正确结合,活化RNA聚合酶,启动基因转录。全酶是指酶蛋白及其辅酶构成的有功能的复合物。RNA,聚合酶的核心酶虽可合成RNA,但不能找到模板DNA上的转录起始位点,只有带σ因子的全酶才能专一地同启动子结合。RNA聚合酶沿着模板前进,直到终止子,转录产生一条RNA链。通常把基因转录起点前面即5’端的序列称为上游(upstream),起点后面即3’端的序列称为下游(downstream)。并把起点的位置记为十1,下游的核苷酸依次记为+2,+3,……,上游方向依次记为—1,—2,—3,……。

RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RAN聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnowbox),这个框的中央位于起点上游10bp处,所以又称—10序列(—10 sequence),后来在—35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于—25~—30 bp处的TATAAAAG,也称TATA框(TATAbox)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptreamactivatingsequence,UAS)。另外在—70~—78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)

原核生物中—10区同—35区之间核苷酸数目的变动会影响基因转录活性的高低,强启动子一般为17±1 bp,当间距小于15 bp或大于20 bp时都会降低启动子的活性。

在真核基因中,有少数基因没有TATA框。没有TATA框的真核基因启动子序列中,有的富集GC,即有GC框;有的则没有GC框。GC框位于—80~—110bp处的GCCACACCC或GGGCGGG序列。

TATA框的主要作用是使转录精确地起始;CAAT框和GC框则主要是控制 转录起始的频率,特别是CAAT框对转录起始频率的作用更大。如在TATA框同相邻的UPE之间插入核苷酸,也会影响转录使之减弱。

为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。

-10序列又称为Pribnow盒(原核生物)。在真核生物中相应的序列位于-35bp处,称为TATA盒,又称为Goldberg-Hognessbox,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:[1]RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;[2]离开共同顺序较远的启动子的活性亦较弱;[3]最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。"

原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。

在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。近年来在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。

启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的"激活蛋白"的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。

本文是刘小丰版权所有,未经授权请勿转载。
本文仅供健康科普使用,不能做为诊断、治疗的依据,请谨慎参阅

收藏
举报
×
分享到微信
打开微信“扫一扫”,即可分享该文章

发表于:2010-07-24