“為什么伊馬替尼這么貴?電影《我不是藥神》講述了一群善良的人因格列衛(wèi)(伊馬替尼)價格昂貴而去冒險犯罪的故事,甚至驚動了總理親自批示將其納入醫(yī)保。但實際上藥企定價昂貴是有原因的,因為藥品研發(fā)實在太緩慢,(格列衛(wèi))花了42年,且研發(fā)過程中有好幾次差點(diǎn)流產(chǎn),投入的成本不可估量,定價高也是必然的。”近日,在一次行業(yè)會議上,中國科學(xué)院北京基因組研究所研究員方向東對包括21世紀(jì)經(jīng)濟(jì)報道在內(nèi)的媒體指出,縮短藥品研發(fā)周期便顯得尤為關(guān)鍵。
目前,在業(yè)內(nèi)形成的一個觀點(diǎn)是,計算助力生物醫(yī)藥行業(yè)可最大發(fā)揮藥物效益,大大提升研發(fā)效率。
中科院計算技術(shù)研究所高性能中心主任譚光明教授向21世紀(jì)經(jīng)濟(jì)報道記者舉例分析稱,自從谷歌AlphaFold2算法問世后,不僅可將試驗時間從幾年縮短成幾小時,投入成本也驟降為幾萬美元,準(zhǔn)確率相較傳統(tǒng)實驗也毫不遜色??傊褪怯糜嬎銠C(jī)先幫助減少試錯成本,將1萬次生物試驗降到100次或者10次。
計算醫(yī)學(xué)的本質(zhì)是采用密集數(shù)據(jù)驅(qū)動的科研范式,以人工智能為方法,以超算為支撐,可以始終系統(tǒng)全局性看待生命。用定量的方法去探尋數(shù)據(jù)和知識中蘊(yùn)藏的生命規(guī)律和基本機(jī)制,并用工程學(xué)的方法,為生物和醫(yī)學(xué)提供服務(wù)。
譚光明認(rèn)為一、二期臨床試驗數(shù)據(jù)表現(xiàn)很好的藥,三期臨床試驗照樣可能失敗。必須要有新技術(shù)打破固有的“天花板”,擁抱新技術(shù)有可能失敗,但也最可能成功,依靠生化技術(shù)推動的醫(yī)藥產(chǎn)業(yè)效率不斷在下降。一種極有潛力的趨勢是構(gòu)建新技術(shù)體系,將藥物從試驗驅(qū)動推向數(shù)字驅(qū)動,推動供給側(cè)提供高效優(yōu)質(zhì)的產(chǎn)品。
在上述行業(yè)會議上,中科院計算所西部高等技術(shù)研究院常務(wù)副院長張春明指出,目前醫(yī)藥領(lǐng)域面臨的挑戰(zhàn)有三:第一,靶點(diǎn)發(fā)現(xiàn)的技術(shù)紅利已結(jié)束,新技術(shù)還沒起效;第二,臨床試驗是“死亡之谷”,難以跨越;第三,疾病臨床用藥有效性差,市場差異化競爭困難。
其中,差異化競爭困難原因是中國藥企產(chǎn)品同質(zhì)化嚴(yán)重。美國很多藥研發(fā)成功,商業(yè)化便能成功,但中國很多藥研發(fā)出來,商業(yè)化卻以失敗告終,所以需呼吁產(chǎn)業(yè)創(chuàng)新。
學(xué)術(shù)上認(rèn)可的事情,商業(yè)卻并不一定成功。華夏基金控股子公司總經(jīng)理、清華大學(xué)內(nèi)科學(xué)博士陳斌認(rèn)為,科學(xué)高地上的問題轉(zhuǎn)化為一些工業(yè)界的問題,并且融入到工業(yè)的價值鏈當(dāng)中去,這才是商業(yè)上成功的前提條件。
近年來,雖然國內(nèi)生物藥獲批數(shù)量逐年上升,但創(chuàng)新度仍然不足,創(chuàng)新藥研發(fā)仍以熱門靶點(diǎn)為主,同質(zhì)化嚴(yán)重,賽道非常擁擠。有些熱門靶點(diǎn)如PD-1、PD-L1、BTK等,很多企業(yè)都在做,甚至100多家企業(yè)擠在一個賽道,存在一定的盲目性。
中科院計算所-哲源·圖靈-達(dá)爾文實驗室副主任趙宇認(rèn)為,大數(shù)據(jù)對一些醫(yī)藥企業(yè)來說并不是工具,而是泥潭?!氨M管數(shù)據(jù)的生產(chǎn)已經(jīng)工業(yè)化,但是數(shù)據(jù)的理解與使用的能力還是非常欠缺,尤其在生物和醫(yī)藥領(lǐng)域更加明顯?!?/p>
多維異構(gòu)的組學(xué)數(shù)據(jù)應(yīng)用到臨床會有斷層,其主要體現(xiàn)在兩方面,首先是臨床醫(yī)生看不懂?dāng)?shù)據(jù),不會在診療中使用數(shù)據(jù)幫助患者。另外,發(fā)表的高水平文章不能有效解決臨床實際遇到的問題。方向東表示,搭建知識網(wǎng)絡(luò)就是用臨床醫(yī)生及下游開發(fā)人員看得懂的語言將科學(xué)發(fā)現(xiàn)表達(dá)出來的過程。
數(shù)據(jù)的生產(chǎn)和理解完全失衡,所以生命科學(xué)和醫(yī)學(xué)的發(fā)展需要新的技術(shù)引擎。醫(yī)藥產(chǎn)業(yè)一直是以生化技術(shù)一條腿支撐,沿著這條技術(shù)路線中國的醫(yī)藥產(chǎn)業(yè)不可能超歐美發(fā)達(dá)國家,只有計算技術(shù)才能提供新的機(jī)會,才可能實現(xiàn)彎道超車。
張春明表示,放眼生物醫(yī)藥產(chǎn)業(yè)和研究,生化技術(shù)的紅利已走到盡頭,缺少新技術(shù)平臺,而計算醫(yī)學(xué),可為醫(yī)藥提供生化技術(shù)之外一個新技術(shù)體系,把工作搬到計算機(jī)上,計算機(jī)干80%的事,人干20%的事。計算醫(yī)學(xué)平臺不僅能提高成功率,還能縮小實驗規(guī)模,節(jié)約成本。據(jù)各大研究機(jī)構(gòu)評估,其可為新藥研發(fā)節(jié)省近500億美元的研發(fā)經(jīng)費(fèi),真正實現(xiàn)了藥物的研發(fā)時間減半、投入減半,臨床有效率提高一倍。所以計算機(jī)跟生物化學(xué)一結(jié)合就“無敵”了。
盡管一個非小細(xì)胞肺癌腫瘤細(xì)胞里有大概200多個體細(xì)胞突變,但其中人類認(rèn)識的、且對臨床治療有幫助的極少,能在臨床實踐中作為標(biāo)志物的不超過十個。其他兩百個變異盡管對腫瘤生長和功能也是必要的,但在解讀中未起到任何作用,其實是因為不了解而已。
利用數(shù)據(jù)模型便可有效提升對其了解程度。中科院計算所-哲源·圖靈-達(dá)爾文實驗室主任、細(xì)胞生物學(xué)與系統(tǒng)生物學(xué)博士牛鋼介紹稱,基因突變會引發(fā)細(xì)胞內(nèi)的確定性后果,這個后果可以測量和分析,所以接下來不需要任何生物學(xué)知識就可搭建各種數(shù)據(jù)模型和深度學(xué)習(xí)框架來模擬真實細(xì)胞,并進(jìn)一步通過知識模塊解讀任何真實細(xì)胞功能。
按細(xì)胞功能重新解讀得到的人類和疾病相關(guān)的功能數(shù)據(jù)叫基線數(shù)據(jù),了解基線數(shù)據(jù)尤為重要。牛鋼表示,只有根據(jù)基線數(shù)據(jù)進(jìn)行預(yù)判,才能提前做好病人的全流程管理。例肺腺癌,得到患者腫瘤的功能信息后,首先要判斷其轉(zhuǎn)移方向,其次要判斷腫瘤預(yù)后(例如預(yù)測患者OS),最后需判斷治療時機(jī)是否合適(例如抗血管藥物的使用)及免疫藥物是否適用等。如發(fā)生亞克隆進(jìn)化,則需了解其進(jìn)化方向。
張春明也表示,從基因到細(xì)胞行為,再到疾病表現(xiàn)可通過數(shù)學(xué)方法建立聯(lián)系,并能以此方式判斷臨床治療的有效性并給予解釋,甚至還能篩選最合適的人群做實驗以達(dá)到最好的藥物效果。
計算醫(yī)學(xué)解決的問題是將人類的知識用在生產(chǎn)實踐和科研領(lǐng)域里面。在藥物研發(fā)領(lǐng)域,可用知識圖譜融合人類全部知識寫一本“書”,例如AI寫了一本書《關(guān)于自閉癥的一切》可以將人類研究者發(fā)表的五萬六千多篇文獻(xiàn)做了一個系統(tǒng)的梳理和總結(jié)。知識圖譜在IT領(lǐng)域是共識化的概念,但領(lǐng)域?qū)S玫闹R圖譜考驗融合能力。
生物醫(yī)學(xué)數(shù)據(jù)庫里有3000多萬篇文獻(xiàn),計算醫(yī)學(xué)的根本假設(shè)是將其全部利用起來,但如何利用成為難點(diǎn)。牛鋼介紹,第一步需將研究內(nèi)容相關(guān)的最核心概念抓出來,抓的過程就是重新梳理知識的分布,因從眾心理導(dǎo)致的知識扎堆,所以要將虛高的壓下來。第二步是要重構(gòu)核心內(nèi)容,AI需要在沒有任何先驗知識情況下進(jìn)行,因此需要經(jīng)過幾輪迭代,最后獲得真正相關(guān)的內(nèi)容。第三步是分類提取知識顆粒,每一個類別代表當(dāng)前這個領(lǐng)域的一個特定的方向或研究熱點(diǎn)。最后,利用相關(guān)數(shù)據(jù)庫提取基因相互作用、信號通路、藥物及其它注釋信息,這樣就可將知識和數(shù)據(jù)的增量附加到每一個人類已經(jīng)建立認(rèn)知的領(lǐng)域中。
張春明表示,在新冠肺炎全球大流行早期,尚未有大量相關(guān)文獻(xiàn)報道的時候,運(yùn)用知識圖譜技術(shù)挖掘了14000多篇有關(guān)冠狀病毒的文獻(xiàn),通過梳理得出兩個結(jié)論:一是降血壓藥氯沙坦能夠預(yù)防新冠病人的危重癥,二是一種小分子藥物C21能作為治療新冠肺炎的潛在藥物。這兩個結(jié)論第一個去年被美國AHA列為心臟病的十大進(jìn)展,而小分子藥物C21之后被一家英國藥企注冊并進(jìn)入臨床二期,目前效果理想。
計算醫(yī)學(xué)需要超強(qiáng)的高性能計算支撐。譚光明教授表示,由于現(xiàn)在沒有通用軟件,有通用的知識沒有通用的算法,因此需要用超算做支撐,但超算買起來容易,用起來難,這涉及到“并行優(yōu)化技術(shù)”。作為計算所戰(zhàn)略布局,“生物醫(yī)學(xué)大數(shù)據(jù)”研究已達(dá)20年,可以快速高效地處理海量數(shù)據(jù)。
在應(yīng)用領(lǐng)域方面,張春明稱,可用模型不同的組合構(gòu)建面向應(yīng)用的接口型工具,并根據(jù)不同需求增加工具以構(gòu)建藥物的數(shù)字實驗場景,從算靶點(diǎn)、算結(jié)構(gòu)至人藥匹配,以真正利用平臺解決問題。
一種藥不會適合所有病人,利用計算醫(yī)學(xué)平臺選出最適合的人群,差異化競爭,提高藥物的成功率很關(guān)鍵。張春明表示,計算醫(yī)學(xué)平臺要對上述場景實現(xiàn)全覆蓋,少量臨床試驗數(shù)據(jù)上了平臺,可通過數(shù)據(jù)分析選出藥物最適合的人群,通過選擇優(yōu)勢人群保證藥物成功的典型代表是易瑞沙。
本來藥可賣給十個人,篩選后很可能只賣給兩個人,也可能賣給更多人,這可能會令藥企感到矛盾,但利用平臺篩選出最適合的人群主要有三個優(yōu)點(diǎn)。張春明指出,第一是可以認(rèn)證為突破性療法,縮短進(jìn)醫(yī)保的時間;第二是優(yōu)勢人群明確,因此可對藥品進(jìn)行差異化定價;第三可使藥品在適應(yīng)癥上療效更好,幫助研發(fā)企業(yè)提高內(nèi)功。
據(jù)臨床試驗的數(shù)據(jù),可推測出藥物優(yōu)勢人群的特征,并可據(jù)特征,推斷該藥還對哪些疾病有效。
一種藥研發(fā)成功來之不易,市場上10%的藥能拓展適應(yīng)癥,通過平臺可擴(kuò)大上億人市場,能大大增加藥的價值。例CDK4/6抑制劑,輝瑞、諾華、禮來三家已經(jīng)在激素陽性Her2陰性乳腺癌下展示了巨大商業(yè)價值,全球也開展了上百組新適應(yīng)癥臨床探索,但所費(fèi)不貲,而且臨床試驗曠日持久。而計算醫(yī)學(xué)指導(dǎo)下的藥物數(shù)字研發(fā)平臺,以新技術(shù)已經(jīng)幫助CDK4/6抑制劑“算出”若干新適應(yīng)癥,其中一種新適應(yīng)癥指向一個全球無藥的罕見病——“脊索瘤”,臨床實踐中,經(jīng)AI判斷適用的,手術(shù)、放療治療均失敗的反反復(fù)復(fù)發(fā)作的脊索瘤患者,單藥治療三周后,腫瘤即縮減37%。而另外幾種新適應(yīng)癥是非罕見腫瘤,這為全球藥物研發(fā)決策帶來廣闊想象空間。
更值得一提的是,全球每個月都有大量失敗的創(chuàng)新藥,可通過計算醫(yī)學(xué)平臺發(fā)現(xiàn)未知靶點(diǎn),創(chuàng)造新的產(chǎn)業(yè)集群,重建臨床失敗藥的價值。
張春明也強(qiáng)調(diào),計算醫(yī)學(xué)的數(shù)字藥物實驗場不會取代藥企,就是二八原則,80%上計算機(jī)干,20%還得人做。但是使用計算醫(yī)學(xué)技術(shù)的企業(yè),一定會去替代那些不使用計算醫(yī)學(xué)技術(shù)的企業(yè),趨勢如此。
(作者:朱萍,魏笑 編輯:徐旭)