評論(0

蛋白質組研究

標籤: 暫無標籤

蛋白質組研究本質上指的是在大規模水平上研究蛋白質的特徵,包括蛋白質的表達水平,翻譯后的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質水平上的關於疾病發生,細胞代謝等過程的整體而全面的認識,這個概念最早是在1995年提出的。蛋白質組的研究不僅能為生命活動規律提供物質基礎,也能為眾多種疾病機理的闡明及攻克提供理論根據和解決途徑。

1概念起源

自從人類基因組計劃啟動以來,公共媒體不斷向大眾勾畫著一幅幅美麗的圖景,使人們認為,一旦科學家把各種生物基因組的全部鹼基排列順序測定清楚,生命的遺傳奧秘就會顯露無餘。但是,真實的圖景遠不像普通人想象的那樣簡單。遺傳信息並不直接參与生命活動,而是通過控制蛋白質的形成間接地指導有機體的新陳代謝。也就是說,一個基因所含的遺傳信息,通過一系列複雜的反應,最終導致了相應的蛋白質形成,蛋白質再參與到生命的各種活動中去。所以,要想真正揭開遺傳的奧秘,僅僅了解基因組的鹼基排列順序是很不夠的,還必須認識基因的產物——蛋白質。
蛋白質組

  蛋白質組

與基因組研究的戰略一樣,科學家們已不再局限於對個別蛋白質進行研究,而是對細胞或組織內成千上萬的蛋白質同時進行研究,即蛋白質組學(proteomics)。2001年2月15日,英國《自然》周刊在發布人類基因組框架圖時,同期登載了一條關於人類蛋白質組研究組織(Human Proteome Organization,HUPO)成立的消息,標題就叫「現在是蛋白質組了」。但科學家們也意識到,蛋白質組研究要比基因組研究複雜得多,是剪不斷理還亂的「怪圈」

2蛋白質組學

存在於細胞核里的DNA構成了基因組。基因組作為遺傳信息的載體,最根本的特徵就是穩定不變。對單細胞生物而言,不論在什麼樣的生長條件下,其基因組始終保持不變。對多細胞生物來說,每一個個體的基因組,在構成個體的不同種類的細胞里都是一樣的,知道了個體內某一細胞內的基因組就知道了該個體所有細胞的基因組。然而對於蛋白質組而言,由於蛋白質是生命活動的主要執行者,不同類型的細胞或同一個細胞在不同的活動狀態下,其蛋白質組的蛋白質種類構成卻是很不一樣的。
蛋白質組學研究

  蛋白質組學研究

所以,蛋白質組與基因組的一個重要差別就是蛋白質組具有多樣性。這種差別要求我們對「蛋白質組」的概念要進行仔細的分析。目前蛋白質組比較公認的定義是:一個基因組內所有基因表達的全部蛋白質。這種定義從字面上容易理解,但在實際中卻很成問題。 
任何一種生物的基因組,都是由不編碼蛋白質的核苷酸序列和編碼蛋白質的核苷酸序列(基因)所組成。基因通常只是基因組的一小部分,例如編碼人類蛋白質的核苷酸序列大約佔人類基因組的2%。要想從混雜有大量非編碼核苷酸序列的基因組中找出基因,如同沙裡淘金。基因組研究的結果表明,一個基因組擁有的「基因」數目是由兩部分組成的:通過實驗證明確有蛋白質產物的真實基因、根據起始密碼和終止密碼序列所確定的潛在基因。生物學家們把這兩類基因都稱為「開放閱讀框」(open reading frame,ORF)。因此,一個基因組內的基因數目通常是指ORF的數目。  
當一個基因組的全序列測定之後,確定其含有的ORF就成為了主要任務,稱為基因註釋。目前用於基因註釋的方法還有較高的出錯率,尤其對於那些存在不連續基因(即在一個基因內插有非編碼的核苷酸序列)的複雜基因組,出錯的問題更為突出。此外,這些ORF是否與蛋白質存在一一對應關係也是一個問題。一方面,人們已經發現有許多「假基因」(pseudogene)的存在,這些假基因有和真基因相同的ORF,但卻從不表達。另一方面,由於存在RNA水平上遺傳信息的加工——mRNA編輯(RNA editing),以及蛋白質水平上遺傳信息的加工——蛋白質剪接(protein splicing),許多蛋白質很難找到直接對應的ORF。如果我們不能確定基因組的「所有」基因,我們從何知道蛋白質組的「全部」蛋白質?  
顯然,確定基因數目最可靠的方法是通過研究蛋白質組來進行。據最新統計,人類基因組擁有的基因數目大約是在3萬到4萬個之間。如果能夠把人體252種細胞內的全部蛋白質都給鑒定出來,那麼我們就有可能真正知道人類基因組的所有基因。但是這樣一來,基因組和蛋白質組形成了「循環定義」:蛋白質組是以基因組擁有的所有基因的表達產物來構成,而所有基因的確定又必須通過蛋白質組來給予肯定。
蛋白質組學的研究技術目前還有很多不完善之處,許多新技術正在研發之中。因此,蛋白質組學的發展是受技術限制的,也是受技術推動的。
如果說未知世界是一個無邊無際的海洋,那麼我們的知識就是這海洋里一個小小的島嶼。隨著科學的進步,知識的島嶼會不斷地擴張。但我們同時會發現,環繞著知識島的未知領域也在增長。我們的研究可以逐漸地擴大人類知識的領地,但永遠不能窮盡宇宙的奧秘。基因組也好,蛋白質組也好,都不會是人類認識生命的終點。

3研究意義

2001年的Science雜誌已把蛋白質組學列為六大研究熱點之一,其「熱度」僅次於幹細胞研究,名列第二。蛋白質組學的受關注程度如今已令人刮目相看。
隨著人類基因組計劃的實施和推進,生命科學研究已進入了后基因組時代。在這個時代,生命科學的主要研究對象是功能基因組學,包括結構基因組研究和蛋白質組研究等。儘管現在已有多個物種的基因組被測序,但在這些基因組中通常有一半以上基因的功能是未知的。目前功能基因組中所採用的策略,如基因晶元、基因表達序列分析(Serial  analysis  of  gene  expression,  SAGE)等,都是從細胞中mRNA的角度來考慮的,其前提是細胞中mRNA的水平反映了蛋白質表達的水平。但事實並不完全如此,從DNA  mRNA  蛋白質,存在三個層次的調控,即轉錄水平調控(Transcriptional  control  ),翻譯水平調控(Translational  control),翻譯后水平調控(Post-translational  control  )。從mRNA角度考慮,實際上僅包括了轉錄水平調控,並不能全面代表蛋白質表達水平。實驗也證明,組織中mRNA丰度與蛋白質丰度的相關性並不好,尤其對於低丰度蛋白質來說,相關性更差。更重要的是,蛋白質複雜的翻譯后修飾、蛋白質的亞細胞定位或遷移、蛋白質-蛋白質相互作用等則幾乎無法從mRNA水平來判斷。毋庸置疑,蛋白質是生理功能的執行者,是生命現象的直接體現者,對蛋白質結構和功能的研究將直接闡明生命在生理或病理條件下的變化機制。蛋白質本身的存在形式和活動規律,如翻譯后修飾、蛋白質間相互作用以及蛋白質構象等問題,仍依賴於直接對蛋白質的研究來解決。雖然蛋白質的可變性和多樣性等特殊性質導致了蛋白質研究技術遠遠比核酸技術要複雜和困難得多,但正是這些特性參與和影響著整個生命過程。
人類蛋白質組計劃

  人類蛋白質組計劃

傳統的對單個蛋白質進行研究的方式已無法滿足后基因組時代的要求。這是因為:(1)  生命現象的發生往往是多因素影響的,必然涉及到多個蛋白質。(2)  多個蛋白質的參與是交織成網路的,或平行發生,或呈級聯因果。(3)  在執行生理功能時蛋白質的表現是多樣的、動態的,並不像基因組那樣基本固定不變。因此要對生命的複雜活動有全面和深入的認識,必然要在整體、動態、網路的水平上對蛋白質進行研究。因此在上世紀90年代中期,國際上產生了一門新興學科-蛋白質組學(Proteomics),它是以細胞內全部蛋白質的存在及其活動方式為研究對象。可以說蛋白質組研究的開展不僅是生命科學研究進入后基因組時代的里程碑,也是后基因組時代生命科學研究的核心內容之一。

4發展歷史

雖然第一次提出蛋白質組概念是在1994年,但相關研究可以追溯到上世紀90年代中期甚至更早,尤其是80年代初,在基因組計劃提出之前,就有人提出過類似的蛋白質組計劃,當時稱為Human  Protein  Index計劃,旨在分析細胞內的所有蛋白質。但由於種種原因,這一計劃被擱淺。90年代初期,各種技術已比較成熟,在這樣的背景下,經過各國科學家的討論,才提出蛋白質組這一概念。
國際上蛋白質組研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。相當多種細胞的蛋白質組資料庫已經建立,相應的國際互聯網站也層出不窮。1996年,澳大利亞建立了世界上第一個蛋白質組研究中心:Australia  Proteome  Analysis  Facility  (  APAF  )。丹麥、加拿大、日本也先後成立了蛋白質組研究中心。在美國,各大藥廠和公司在巨大財力的支持下,也紛紛加入蛋白質組的研究陣容。去年在瑞士成立的GeneProt公司,是由以蛋白質組資料庫「SWISSPROT」  著稱的蛋白質組研究人員成立的,以應用蛋白質組技術開發新藥物靶標為目的,建立了配備有上百台質譜儀的高通量技術平台。而當年提出Human  Protein  Index  的美國科學家Normsn  G.  Anderson也成立了類似的蛋白質組學公司,繼續其多年未實現的夢想。2001年4月,在美國成立了國際人類蛋白質組研究組織(Human  Proteome  Organization,  HUPO),隨後歐洲、亞太地區都成立了區域性蛋白質組研究組織,試圖通過合作的方式,融合各方面的力量,完成人類蛋白質組計劃(Human  Proteome  Project)。
蛋白質組學雖然問世時間很短,但已經在研究細胞的增殖、分化、異常轉化、腫瘤形成等方面進行了有力的探索,涉及到白血病、乳腺癌、結腸癌、膀胱癌、前列腺癌、肺癌、腎癌和神經母細胞瘤等,鑒定了一批腫瘤相關蛋白,為腫瘤的早期診斷、葯靶的發現、療效判斷和預后提供了重要依據。
鑒於蛋白質組學發展前景的重要性和技術的先進性,西方各主要發達國家紛紛投巨資全面啟動蛋白質組的研究。如美國國立衛生研究院,美國能源部、歐共體等均啟動了不同生物蛋白質組的研究並取得明顯進展,一批高質量的研究論文相繼在國際著名學術刊物發表。由於蛋白質組學研究比基因組學研究更接近實用,有著巨大的市場前景,企業與製藥公司也紛紛斥巨資開展蛋白質組研究。獨立完成人類基因組測序的Celera公司已宣布投資上億美元於此領域;日內瓦蛋白質組公司與布魯克質譜儀製造公司聯合成立了國際上最大的蛋白質組研究中心。為了促進國家與地區性的蛋白質組的發展、合作與交流,成立了國際人類蛋白質組組織 (HUPO),在法國召開了首屆國際蛋白質組大會,並迅即在北美、歐洲、韓國、日本成立了相應的分支機構。蛋白質組學已成為西方各主要發達國家、各跨國製藥集團競相投入的「熱點」。

5研究難度

要找出一個生物體基因組的所有基因和相應的全部蛋白質,是一項非常困難的任務。
四維尺度下的研究
DNA作為遺傳信息的載體,以雙螺旋的形式存在於細胞核內,在細胞一代代的繁衍過程中其鹼基序列始終保持不變,因此在測定基因組的DNA序列時不需要考慮時空的影響。而在蛋白質組的研究中,時間和空間的影響都是不可忽略的。  
首先,在個體發育的不同階段或細胞的不同活動時期,細胞內產生的蛋白質種類是不一樣的。此外,不同蛋白質的壽命也不一樣。有些蛋白質在合成后成為細胞的結構成分,相當穩定;而有些蛋白質在產生后被用來進行某種細胞活動,比如基因轉錄的調控,工作一旦完成就被迅速降解。因此,在分析蛋白質組的蛋白質成分時,需要把時間作為一個重要的參數。對於在不同時間過程中蛋白質組的組成成分的比較分析——差異蛋白質組研究,已成為當前蛋白質組學的主要內容。 
蛋白質的另一個重要特徵是,不同的蛋白質通常分佈在細胞的不同部位,它們的功能與其空間定位密切相關。要想真正了解蛋白質的功能,通常還需要知道蛋白質所處的空間位置。更為重要的是,許多蛋白質在細胞里不是靜止不動的,它們在細胞里常常通過在不同亞細胞環境里的運動發揮作用。例如細胞周期的調控過程、細胞的信號轉導和轉錄調控,都依賴於蛋白質空間位置的變化和運動。因此,蛋白質組學中又派生了一個與空間緊密相關的新研究領域——亞細胞蛋白質組學。這種亞細胞蛋白質組可能是細胞器蛋白質組,如高爾基體蛋白質組;也可能是比細胞器還要小的組分,如核膜的蛋白質組。
技術局限的煩惱
基因組的物質基礎是DNA,它由兩條螺旋狀生物大分子鏈組成,其中每一條鏈都由成千上萬的核苷酸連接而成,這些核苷酸僅含有四種類型的鹼基。基因組研究的核心任務,就是要測定DNA鏈上四種鹼基的排列順序。因此,DNA測序技術是基因組研究中一個最基本和最主要的工具,這樣一種單一的技術就能勝任基因組的研究工作。但是,在蛋白質組研究中,需要的研究技術遠遠不止一種,並且技術的難度也要大於基因組研究技術。  
首先,由於蛋白質是由20種化學性質各異的氨基酸所組成,因此不同蛋白質的物理化學性質差別很大。例如,有些蛋白質易溶於極性溶劑,有些蛋白質則難溶於極性溶劑;有些蛋白質較穩定,有些蛋白質則易降解。此外,蛋白質的各種修飾和相互作用更增加了蛋白質的複雜性。僅僅通過一兩種技術,顯然不可能完成對蛋白質組內成千上萬種不同性質的蛋白質的檢測。
其次,不同種類的蛋白質的量在細胞內有著很大的差別。例如在酵母細胞里,有些細胞周期調控蛋白不到100個分子,而糖基酶則可能有200萬個分子。據估計,蛋白質之間量的差別,竟可達106數量級。蛋白質組研究的特點是要同時分析各種各樣的蛋白質,因此需要排除巨量的蛋白質類型的干擾,把微量的蛋白質類型從蛋白質混合物中鑒定出來。現有的蛋白質組研究技術,尚不能令人滿意地完成這一任務。
簡而言之,蛋白質組研究對技術的依賴性和要求遠遠超過

6研究內容

早期蛋白質組學的研究範圍主要是指蛋白質的表達模式(Expression  profile),隨著學科的發展,蛋白質組學的研究範圍也在不斷完善和擴充。蛋白質翻譯后修飾研究已成為蛋白質組研究中的重要部分和巨大挑戰。蛋白質-蛋白質相互作用的研究也已被納入蛋白質組學的研究範疇。而蛋白質高級結構的解析即傳統的結構生物學,雖也有人試圖將其納入蛋白質組學研究範圍,但目前仍獨樹一幟。
翻譯后修飾
很多mRNA表達產生的蛋白質要經歷翻譯后修飾如磷酸化,糖基化,酶原激活等。翻譯后修飾是蛋白質調節功能的重要方式,因此對蛋白質翻譯后修飾的研究對闡明蛋白質的功能具有重要作用。
臨床醫藥
對人類而言,蛋白質組學的研究最終要服務於人類的健康,主要指促進分子醫學的發展。如尋找藥物的靶分子。很多藥物本身就是蛋白質,而很多藥物的靶分子也是蛋白質。藥物也可以干預蛋白質-蛋白質相互作用。
在基礎醫學和疾病機理研究中,了解人不同發育、生長期和不同生理、病理條件下及不同細胞類型的基因表達的特點具有特別重要的意義。這些研究可能找到直接與特定生理或病理狀態相關的分子,進一步為設計作用於特定靶分子的藥物奠定基礎。

7研究方法技術

蛋白質組學的發展既是技術所推動的也是受技術限制的。蛋白質組學研究成功與否,很大程度上取決於其技術方法水平的高低。蛋白質研究技術遠比基因技術複雜和困難。不僅氨基酸殘基種類遠多於核苷酸殘基(20/4), 而且蛋白質有著複雜的翻譯后修飾,如磷酸化和糖基化等,給分離和分析蛋白質帶來很多困難。此外,通過表達載體進行蛋白質的體外擴增和純化也並非易事,從而難以製備大量的蛋白質。蛋白質組學的興起對技術有了新的需求和挑戰。蛋白質組的研究實質上是在細胞水平上對蛋白質進行大規模的平行分離和分析,往往要同時處理成千上萬種蛋白質。因此,發展高通量、高靈敏度、高準確性的研究技術平台是現在乃至相當一段時間內蛋白質組學研究中的主要任務。當前在國際蛋白質組研究技術平台的技術基礎和發展趨勢有以下幾個方面:
樣品分離和分析
利用蛋白質的等電點和分子量通過雙向凝膠電泳的方法將各種蛋白質區分開來是一種很有效的手段。它在蛋白質組分離技術中起到了關鍵作用。如何提高雙向凝膠電泳的分離容量、靈敏度和解析度以及對蛋白質差異表達的準確檢測是目前雙向凝膠電泳技術發展的關鍵問題。主要趨勢有第一維電泳採用窄pH梯度膠分離以及開發與雙向凝膠電泳相結合的高靈敏度蛋白質染色技術,如新型的熒光染色技術。
蛋白質組研究工作台

  蛋白質組研究工作台

質譜技術是目前蛋白質組研究中發展最快,也最具活力和潛力的技術。它通過測定蛋白質的質量來判別蛋白質的種類。當前蛋白質組研究的核心技術就是雙向凝膠電泳-質譜技術,即通過雙向凝膠電泳將蛋白質分離,然後利用質譜對蛋白質逐一進行鑒定。對於蛋白質鑒定而言,高通量、高靈敏度和高精度是三個關鍵指標。一般寶護神監視器的質譜技術難以將三者合一,而最近發展的質譜技術可以同時達到以上三個要求,從而實現對蛋白質準確和大規模的鑒定。
生物信息學
蛋白質組資料庫是蛋白質組研究水平的標誌和基礎。瑞士的SWISS-PROT擁有目前世界上最大,種類最多的蛋白質組資料庫。丹麥、英國、美國等也都建立了各具特色的蛋白質組資料庫。生物信息學的發展已給蛋白質組研究提供了更方便有效的計算機分析軟體;特別值得注意的是蛋白質質譜鑒定軟體和演算法發展迅速,如SWISS-PROT、Rockefeller大學、BHS寶護神、UCSF等都有自主的搜索軟體和數據管理系統。最近發展的質譜數據直接搜尋基因組資料庫使得質譜數據可直接進行基因註釋、判斷複雜的拼接方式。隨著基因組學的迅速推進,會給蛋白質組研究提供更多更全的資料庫。另外,對肽序列標記的從頭測序軟體也十分引人注目。

8發展趨勢

在基礎研究方面,近兩年來蛋白質組研究技術已被應用到各種生命科學領域,如細胞生物學、神經生物學等。在研究對象上,覆蓋了原核微生物、真核微生物、植物和動物等範圍,涉及到各種重要的生物學現象,如信號轉導、細胞分化、蛋白質摺疊等等。在未來的發展中,蛋白質組學的研究領域將更加廣泛。
在應用研究方面,蛋白質組學將成為尋找疾病分子標記和藥物靶標最有效的方法之一。在對癌症、早老性痴獃等人類重大疾病的臨床診斷和治療方面蛋白質組技術也有十分誘人的前景,目前國際上許多大型藥物公司正投入大量的人力和物力進行蛋白質組學方面的應用性研究。
在技術發展方面,蛋白質組學的研究方法將出現多種技術並存,各有優勢和局限的特點,而難以象基因組研究一樣形成比較一致的方法。除了發展新方法外,更強調各種方法間的整合和互補,以適應不同蛋白質的不同特徵。另外,蛋白質組學與其它學科的交叉也將日益顯著和重要,這種交叉是新技術新方法的活水之源,特別是,蛋白質組學與其它大規模科學如基因組學,生物信息學等領域的交叉,所呈現出的系統生物學(System Biology)研究模式,將成為未來生命科學最令人激動的新前沿。

相關評論

同義詞:暫無同義詞