應用領域 | 醫療衛生,食品,生物產業,農業,司法 |
---|
在后基因組時代,隨著高通量測序技術的不斷發展和應用,亞細胞位置未知的蛋白質序列數據海量積累,同時具有多個亞細胞位置的蛋白質數量也快速增長,只靠傳統的實驗手段進行蛋白質亞細胞定位已越來越難以適應這種形勢,于是基于機器學習的蛋白質亞細胞定位預測方法逐漸發展起來,這種方法大都采用分類學習的手段進行預測。對預測方法進行研究有助于蛋白質亞細胞定位問題的解決,而蛋白質的亞細胞位置信息能夠為進一步確定蛋白質的功能提供非常有價值的線索,這有利于加速對蛋白質“序列-結構-功能”映射關系的解密,為蛋白質數據的注釋和管理提供支持。在已經出現的蛋白質亞細胞定位預測方法中,對集成多標記學習技術的應用還比較少,而且大都只關注對特定問題、特定算法或技術的研究,缺少對通用型可擴展預測系統的探索,特別是針對基于集成多標記學習的預測系統。研究構建集成多標記學習模型的底層基礎結構,為進一步實現基于集成多標記學習的蛋白質亞細胞定位預測系統建立良好支持,同時也為設計解決其它多標記學習問題的系統提供模型參考,這在理論和實踐方面都需要深入研究。
蛋白質標記定位系統的生物分子質譜成像(MSI)技術已成功用于直接分析生物組織切片.不僅避免了繁瑣的樣品提取、純化和分離步驟,而且能夠獲取生物組織中蛋白質和多肽表達譜。并繪制二維質譜圖像。質譜成像技術不需要預知蛋白的種類,不要要抗體標記,甚至不需要熒光染色,就能鑒定出未知的蛋白質.
目前蛋白質標記定位系統已廣泛用于生理和病理組織中蛋白質的表達以及其他分子標志物的發現。這一方法能夠使HE染色與質譜成像(MSI)的結果很好地關聯起來。
廣義的生物標志物是指任何一種可以標記出特殊疾病狀況,或是有機體生化機能狀態的物質,還可以是用來衡量有機體的功能及健康的指標物質。腫瘤生物標記物是腫瘤直接產生或由身體對癌癥特定響應分泌的物質,這些物質或過程的存在表明癌癥存在于人體。
標記物的類型有基因生物標記、蛋白質生物標記以及其他細胞、病毒、碳水化合物等生物標記。這些標記物存在于腫瘤組織、組織間隙液、血液等體液中,可用于診斷、預測、藥物研發、個性化醫療、代理指標等。早在1950年科學家就開始意識到血液里循環的生物分子能夠反映腫瘤細胞的狀態,目前對標志物的研發過程主要包括發現和篩選候選標志物以及驗證等。
在后基因組時代,科學家們不滿足對ATCG的探索,也開啟了蛋白質組學的研究。我們開始關注蛋白標志物。細胞中,除水分外,蛋白質約占細胞內物質的80%,因此它是構成機體組織、器官的主要成分,也是細胞生命活動的基礎。
蛋白質按照功能不同可以分為結構蛋白、營養和儲存蛋白、調節蛋白、運輸蛋白、催化蛋白、信使蛋白、防御蛋白等。作為諸多生物功能的直接執行者,蛋白質能更加直接迅速的反映機體的變化,故成為更好的候選腫瘤標志物。腫瘤蛋白標志物不存在于正常成人組織或者在腫瘤組織中的含量大大查過正常組織,包括癌胚蛋白、腫瘤相關抗原、酶、激素以及特殊的血漿蛋白。
目前蛋白質組學技術包括質譜分析、二維凝膠電泳、蛋白質微陣列技術、液相芯片等。由于技術的發展,我們不僅能檢測到體液(血液、尿液、組織間隙液等)內的痕量蛋白質,并且能對蛋白質進行相對和的定量,可以監測體內蛋白質的變化,而這些變化的蛋白質很可能提示著體內生理或者病理變化。
近年隨著對腫瘤發生發展機制的深入了解,科學家們已經發現了大量的潛在的腫瘤候選標志物,如AFP、CEA、PSA、CA125、Her2、TP53等,表1列出了已被FDA認證的腫瘤標志物的敏感性和特異性。目前的挑戰是如何提高這些標志物對疾病預測、輔助診斷、療效監測以及預后評估的敏感性和特異性。
除了初用單一的標志物對疾病進行預測,我們已經嘗試用一組標記物來克服單一標志物帶來的交叉反應等缺點。用CART、機器學習等分類統計的方法,我們可以篩選具有更高檢測靈敏性和特異性的標記物組合。許多生物公司也生產如Quantikine ELISA試劑盒等產品來檢測各種標志物組合。