作為后基因組時代出現(xiàn)的新興研究領域之一,蛋白質組學(proteomics)正受到越來越多的關注。蛋白質組學的研究目標是對機體或細胞的所有蛋白質進行鑒定和結構功能分析。蛋白質組學的研究不局限任何特定的方法。高分辨率的蛋白質分離技術如二維凝膠電泳和液相層析,經(jīng)典的蛋白質鑒定方法如氨基酸序列分析等,現(xiàn)代質譜技術,基因組學研究的各種手段,現(xiàn)代計算機信息學和計算機網(wǎng)絡通訊技術等等,任何可用于蛋白質研究的技術手段,蛋白質組學都可能會采用。它體現(xiàn)的是一個開放的思維和研究方式。
蛋白質-蛋白質的相互作用是細胞生命活動的基礎和特征。這種千變萬化的相互作用以及由此形成的紛繁復雜的蛋白質網(wǎng)絡同樣也是蛋白質組學的研究內容,相應的工作也已經(jīng)開展。
酵母雙雜交系統(tǒng)(yeast two-hybrid system)自建立以來已經(jīng)成為分析蛋白質相互作用的強有力的方法之一。該方法在不斷完善,如今它不但可用來在體內檢驗蛋白質間的相互作用,而且還能用來發(fā)現(xiàn)新的作用蛋白質,在對蛋白質組中特定的代謝途徑中蛋白質相互作用關系網(wǎng)絡的認識上發(fā)揮了重要的作用。實驗表明雙雜交技術在蛋白質組學上的應用是成功的。本文將就雙雜交技術的產生、發(fā)展及其在蛋白質組研究方面的初步應用作一介紹。
1 蛋白質組學的產生背景
基因組研究自從開展以來已經(jīng)取得了舉世矚目的成就。在過去幾年中,已經(jīng)陸續(xù)完成了包括大腸桿菌、釀酒酵母等十多種結構比較簡單的生物的基因組DNA的全序列分析。線蟲(C.elegans)的基因組DNA測序工作已基本完成。規(guī)模更為龐大的人類基因組計劃預期在下一世紀的前幾年(2003~2005年)也將完成全部基因組DNA的序列分析。這些進展是非常令人振奮的。但是也隨之產生了新問題。大量涌出的新基因數(shù)據(jù)迫使我們不得不考慮這些基因編碼的蛋白質有什么功能這個問題。不僅如此,在細胞合成蛋白質之后,這些蛋白質往往還要經(jīng)歷翻譯后的加工修飾。也就是說,一個基因對應的不是一種蛋白質而可能是幾種甚至是數(shù)十種。包容了數(shù)千甚至數(shù)萬種蛋白質的細胞是如何運轉的?或者說這些蛋白質在細胞內是怎樣工作、如何相互作用、相互協(xié)調的?這些問題遠不是基因組研究所能回答得了的。正是在此背景下,蛋白質組學(proteomics)應運而生。
蛋白質組(proteome)一詞是馬克.威爾金斯(Marc Wilkins)zui先提出來的,zui早見諸于1995年7月的“Electrophoresis"雜志上,它是指一個有機體的全部蛋白質組成及其活動方式。蛋白質組研究雖然尚處于初始階段,但已經(jīng)取得了一些重要進展。當前蛋白質組學的主要內容是,在建立和發(fā)展蛋白質組研究的技術方法的同時,進行蛋白質組分析。對蛋白質組的分析工作大致有兩個方面。一方面,通過二維凝膠電泳得到正常生理條件下的機體、組織或細胞的全部蛋白質的圖譜,相關數(shù)據(jù)將作為待檢測機體、組織或細胞的二維參考圖譜和數(shù)據(jù)庫。一系列這樣的二維參考圖譜和數(shù)據(jù)庫已經(jīng)建立并且可通過聯(lián)網(wǎng)檢索。二維參考圖譜建立的意義在于為進一步的分析工作提供基礎。蛋白質組分析的另一方面,是比較分析在變化了的生理條件下蛋白質組所發(fā)生的變化。如蛋白質表達量的變化,翻譯后修飾的變化,或者可能的條件下分析蛋白質在亞細胞水平上的定位的改變等。關于蛋白質組學的介紹可參閱文獻。
細胞或組織的蛋白質不是雜亂無章的混合物,蛋白質間的相互作用、相互協(xié)調是細胞進行一切代謝活動的基礎。蛋白質間的相互作用及作用方式同樣也是蛋白質組研究所面臨的問題。研究蛋白質間的相互作用有多種方法,常用的如酵母雙雜交系統(tǒng)、親和層析、免疫沉淀、蛋白質交聯(lián)等。其中,酵母雙雜交系統(tǒng)是當前發(fā)展迅速、應用廣泛的主要方法。
2 酵母雙雜交系統(tǒng)的建立與發(fā)展
雙雜交系統(tǒng)的建立得力于對真核生物調控轉錄起始過程的認識。細胞起始基因轉錄需要有反式轉錄激活因子的參與。80年代的工作表明,轉錄激活因子在結構上是組件式的(modular),即這些因子往往由兩個或兩個以上相互獨立的結構域構成,其中有DNA結合結構域(DNA binding domain,簡稱為DB)和轉錄激活結構域(activation domain,簡稱為AD),它們是轉錄激活因子發(fā)揮功能所必需的。單獨的DB雖然能和啟動子結合,但是不能激活轉錄。而不同轉錄激活因子的DB和AD形成的雜合蛋白仍然具有正常的激活轉錄的功能。如酵母細胞的Gal4蛋白的DB與大腸桿菌的一個酸性激活結構域B42融合得到的雜合蛋白仍然可結合到Gal4結合位點并激活轉錄。
Fields等人的工作標志雙雜交系統(tǒng)的正式建立。他們以與調控SUC2基因有關的兩個蛋白質Snf1和Snf2為模型,將前者與Gal4的DB結構域融合,另外一個與Gal4的AD結構域的酸性區(qū)域融合。由DB和AD形成的融合蛋白現(xiàn)在一般分別稱之為“誘餌"(bait)和“獵物"或靶蛋白(prey or target protein)。如果在Snf1和Snf2之間存在相互作用,那么分別位于這兩個融合蛋白上的DB和AD就能重新形成有活性的轉錄激活因子,從而激活相應基因的轉錄與表達。這個被激活的、能顯示“誘餌"和“獵物"相互作用的基因稱之為報道基因(reporter gene)。通過對報道基因表達產物的檢測,反過來可判別作為“誘餌"和“獵物"的兩個蛋白質之間是否存在相互作用。在此Fields等人采用編碼β-半乳糖苷酶的LacZ作為報道基因,并且在該基因的上游調控區(qū)引入受Gal4蛋白調控的GAL1序列。這個改造過的LacZ基因被整合到酵母染色體URA3位上。而酵母的GAL4基因和GAL80基因(Gal80是Gal4的負調控因子)被缺失,從而排除了細胞內源調控因子的影響。已經(jīng)知道在Snf1和Snf2之間存在相互作用。結果發(fā)現(xiàn)只有同時轉化了Snf1和Snf2融合表達載體的酵母細胞才有β-半乳糖苷酶活性,單獨轉化其中任何一個載體都不能檢測出β-半乳糖苷酶活性。
目前發(fā)展起來的各種雙雜交系統(tǒng)大多是以Fields等人建立的系統(tǒng)為基礎的。這些新系統(tǒng)主要對報道基因、“誘餌"表達載體以及“獵物"表達載體等做了一些改進。其中一個重要改進是引入額外的報道基因,如廣泛采用的HIS3基因。經(jīng)過改造帶有HIS3報道基因的酵母細胞,只有當HIS3被啟動表達才能在缺乏的選擇性培養(yǎng)基上生長。HIS3報道基因的轉錄表達是由“誘餌"和“獵物"的相互作用所啟動的。大多數(shù)雙雜交系統(tǒng)往往同時使用兩個甚至三個報道基因,其中之一是LacZ。這些改造后的基因在啟動子區(qū)有相同的轉錄激活因子結合位點,因此可以被相同的轉錄激活因子(如上述的Gal4蛋白)激活。通過這種雙重或多重選擇既提高了檢測靈敏度又減少了假陽性現(xiàn)象。其他還有針對“誘餌"或“獵物"表達載體等所作的改進,這里不一一詳述。
在雙雜交鑒定過程中要經(jīng)過兩次轉化,這個工作量是相當大的,特別是尋找新的作用蛋白質的時候尤其如此。而且,酵母細胞的轉化效率比細菌要低約4個數(shù)量級。因此轉化步驟就成為雙雜交技術的瓶頸。Bendixen等人通過酵母接合型的引用,避免了兩次轉化操作,同時又提高了雙雜交的效率。在酵母的有性生殖過程中涉及到兩種配合類型: a接合型和α接合型,這兩種單倍體之間接合(mating)能形成二倍體,但a接合型細胞之間或α接合型細胞之間不能接合形成二倍體。根據(jù)酵母有性生殖的這一特點,他們將文庫質粒轉化α接合型酵母細胞,“誘餌"表達載體轉化a接合型細胞。然后分別鋪篩選平板使細胞長成菌苔(lawn),再將兩種菌苔復印到同一個三重篩選平板上,原則上只有誘餌和靶蛋白發(fā)生了相互作用的二倍體細胞才能在此平板上生長。單倍體細胞或雖然是二倍體細胞但DB融合蛋白和AD融合蛋白不相互作用的都被淘汰。長出來的克隆進一步通過β-半乳糖苷酶活力進行鑒定。這項改進不僅簡化了實驗操作,而且也提高了雙雜交的篩選效率。