01 當前中國蛋白組學格局如何?
D一,中國還沒有一家蛋白組學上市公司。
歐美二級市場有幾家蛋白組學上市公司,包括Quanterix、Olink、SomaLogic、Seer。國內A股還沒有一家蛋白組學公司,很接近的是杭州景杰生物。根據其招股書,景杰成立于2011年,2023年初剛剛過會創業板,目前還在排隊中。同時也可以看到,中國蛋白組學目前營收以質譜服務為主,跟國外Olink、Quanterix等公司通過售賣試劑盒和自動化設備有很大區別。第二,中國市場上的蛋白組學公司,處于混沌狀態,沒有產業鏈分工。今天的自稱蛋白組學的公司,大致兩個來源:一是傳統存在的質譜服務商,強于服務和渠道,二是新興的生物科技公司,強于技術和產品。本來這兩類公司應該是處于產業鏈上下游的關系:生物科技公司給服務商提供產品。但由于中國蛋白組學市場處于早期萌芽階段,出于各種原因,這兩類公司目前基本都自己既做服務,又做產品。第三,中國蛋白組學市場格局,以質譜路線占據主導地位。這跟歐美蛋白組學以親和試劑占主導地位形成明顯差異。歐美蛋白組學市場,以Olink和SomaLogic為代表的親和試劑路線占主導地位,大多數蛋白組大隊列都是用這兩家公司的產品開展的,以至于質譜蛋白組行業大牛,德國馬普所Matthias Mann教授都寫文章感慨:親和試劑遠比質譜要貴,為啥大隊列都用親和試劑呢?
質譜儀對于蛋白組學,就如同測序儀對于基因組學。但是蛋白組學大隊列竟然質譜都不占上風,其中的原因,值得所有質譜蛋白組學人反思。
02 蛋白組學限速因素還有什么?
蛋白組學zui大的一個應用場景就是多重蛋白生物標志物發現,基于多重蛋白標志物,可以開發疾病早篩、診斷、臨床病人分層、伴隨診斷、用藥指導等諸多應用。但多重蛋白標志物發現是D一位。蛋白標志物發現有一個“倒三角"框架,分為三個階段。D一階段:未知蛋白標志物篩選 (biomarker discovery)。這個階段目的就是從樣本中發展潛在的蛋白質標志物,常用的方法是不需要標記的非靶向質譜蛋白組學 (DIA)。特點是要在盡可能多的樣本中(1000個以上)盡可能地篩選更多的蛋白(比如5000種)。第二階段:標志物驗證(biomarker validation)。D一階段可能從5000個蛋白里面篩選到50個潛在蛋白標志物,就需要在第二階段進一步驗證。常用的方法是基于有標記的靶向質譜法(PRM)或者基于抗體的免疫分析法(immunoassay)。通常第二階段得到驗證的蛋白標志物能用于科學研究,但是想進一步成為臨床指標,則需要到第三階段。
第三階段:臨床標志物驗證(clinical biomarker validation)。這個階段通常需要多個中心的樣本來驗證蛋白標志物的可靠性、穩定性、標準化流程。常用的方法包括基于標記的靶向質譜法(SRM)或者基于抗體的免疫法(如化學發光)。如上文所述,質譜儀對于蛋白組學,就如同測序儀對于基因組學。但目前蛋白組學沒有被大規模應用,主要是長期以來三個要素的不到位而導致的,即:高通量、標準化、低成本。要素一:高通量。質譜的通量一直是一個被長期詬病的大難題。在2023年6月份之前,蛋白組學樣本都需要耗費一個小時的質譜時間,無論是用布魯克的g端版質譜儀Tims TOF Pro2和賽默飛的Orbitrap 480。一臺價值800萬的高分辨質譜儀一天只能跑20個樣本,低通量的問題同時帶來了高成本。假設一年一臺能跑300例樣本,每年折舊200萬,則平攤到每例樣本的費用就超過300元。但是質譜通量的問題隨著今年6月份賽默飛發布新款的Orbitrap Astral而被解決了。Astral一臺一年能夠處理2萬個樣本,未來3年,中國市場上會有100臺Astral,每年能處理的樣本量超過200萬個。未來3年,世界將會有超過1000臺Astral裝機量,每年能處理的樣本超過2000萬個。即便有世界20家藥企和英國樣本庫加持,Olink在世界也不過做了100萬個樣本。隨著Astral的快速普及,質譜能滿足市場上任何想做的大隊列樣本。同時,每個樣本大概產生4個Gb的蛋白組學數據,未來每年將有可能產生8000萬個Gb的蛋白質數據。在如此浩瀚的蛋白大數據面前,將產生非常豐富的蛋白組學的大模型。類似于DeepMind這樣的公司將層出不窮。要素二:標準化。質譜蛋白組學被人長期詬病的第二個問題就是前處理流程麻煩,難以自動化標準化。隨著實驗室自動化行業的發展,以及新冠帶來的自動化的認知普及,目前這個問題已經得到解決。國外行業巨tou包括哈Hamilton、Tecan都推出了自己的蛋白組學前處理工作站,但目前價格還是太貴,沒有得到很好的市場普及。國內自動化工作站產品的面世,前處理標準化正在得到普及。要素三:低成本。基因組學的發展,也是伴隨著二代測序成本的斷崖式下降而發展起來的。根據美國國家衛生研究院(NIH)公布的數據,2007年人類全基因組測序的成本是100萬美元,到2020年這個成本降低到1000美元,到現在已經接近1000人民幣。
數據來源:ARK Invest 2023 Big Ideas
從中心法則來講,蛋白質組的確可以做很多基因組做不到的事情。但是蛋白組學行業的發展,也必須要跟基因組一樣實現成本的快速下降。2023年的今天,蛋白組學的成本還是相對比較高。
拿芝加哥大學質譜蛋白組學平臺的對外服務報價來舉例,對工業客戶,常規的DIA蛋白組分析就需要378美元/例,用TiO2富集的全磷酸化蛋白組收費是535美元/例,如果是酪氨酸磷酸化修飾蛋白組,則費用達到了驚人的1417.5美元/例。
數據來源:Rates | Proteomics Platform
對于組學來說,沒有幾百個樣本,很難做出非常令人信服的數據。這樣高的成本,對于大多數研究機構和企業研發,都是一筆需要仔細考量的支出。有沒有一種可能,通過技術創新,讓蛋白組成本進一步降低,使得蛋白組成為一個不由分說的選項,默認就要去做的選項?這需要全行業的參與者來共同努力實現。
03 中國蛋白組學向何處去?
預測未來永遠都是一個自找打臉的事情。麥肯錫和中金的行業精英們也從來沒有預測準確過。但有些行業趨勢,又似乎已經非常明顯。
D一,中國蛋白組學產業鏈分工會更加明細。
未來5年,中國蛋白組學公司將會迅速分化。一部分企業將會專注做上游工具(試劑、設備、軟件),一部分企業將會專注做中游服務(服務商),還有一部分企業將會專注做下游應用(診斷、制藥)。沒有核心技術的、想做大而全的蛋白組學公司將被市場出清。
未來5年,形勢依舊不容樂觀。每一家蛋白組學公司,必須要想清楚自己在產業鏈的定位是什么?自己團隊zui大的優勢在哪里?如何做大自己的優勢,選擇在哪里建設自己的護城河,是每家公司需要考量的決定生死的D一要素。
第二,質譜蛋白組大隊列將井噴式激增。
隨著質譜蛋白組三要素(高通量、標準化、低成本)同時得到滿足,基于質譜的蛋白組大樣本隊列將呈現井噴式發展。1000例、2000例、3000例的大隊列將成為常規,1萬人甚至10萬人的質譜蛋白組大隊列將會涌現。
在今年的中國蛋白組學大會上,國家蛋白質科學中心就宣布,未來10年,國家將在蛋白組學上投入330億人民幣。這足以媲美任何一個歐美大科學項目。
第三,中國蛋白組學公司將會出海競逐海外市場。
中國企業在基因組學上吃過的虧,在蛋白組學上會長一智。基因組學快速發展的時候,中國生命科學行業尚在襁褓之中,從來都是歐美企業跑到中國來銷售產品,中國企業只有接受他們定價的份。
現在蛋白組學發展的時候,中國整個基礎領域(物理、化學、材料、自動化)已經發展起來,硬科技實力比20年前大幅增強。優質的中國蛋白組學公司,尤其掌握核心技術的上游產品,將有機會搶占海外市場。同時,海外客戶更高的產品要求、更好的付費意愿和付費能力,也能反過來要求中國企業打磨更優質的產品、培養更優秀的團隊。
第四,圍繞基因蛋白組的AI for Omics將成為熱點。
未來5年,隨著海量蛋白組數據的積累,結合過去積累的基因組數據,以基因組-蛋白組為中心的多組學將成為創新的熱點,AI for Omics將成為生物大數據新的研究范式。屆時,基于多組學的大模型將出現,行業將誕生類似DeepMind這樣的公司,配合強大的算力和優異的算法來整合海量多組學數據,把現在在各個高校實驗室里面的技術帶入到現實應用場景中來,就如當年的蛋白質結構預測工具AlphaFold。
本文轉載自 吳昊