中國醫藥產業“彎道超車”機會:計算賦能跨越生化技術“紅利危機”
“為什么伊馬替尼這么貴?電影《我不是藥神》講述了一群善良的人因格列衛(伊馬替尼)價格昂貴而去冒險犯罪的故事,甚至驚動了總理親自批示將其納入醫保。但實際上藥企定價昂貴是有原因的,因為藥品研發實在太緩慢,(格列衛)花了42年,且研發過程中有好幾次差點流產,投入的成本不可估量,定價高也是必然的。”近日,在一次行業會議上,中國科學院北京基因組研究所研究員方向東對包括21世紀經濟報道在內的媒體指出,縮短藥品研發周期便顯得尤為關鍵。
目前,在業內形成的一個觀點是,計算助力生物醫藥行業可最大發揮藥物效益,大大提升研發效率。
中科院計算技術研究所高性能中心主任譚光明教授向21世紀經濟報道記者舉例分析稱,自從谷歌AlphaFold2算法問世后,不僅可將試驗時間從幾年縮短成幾小時,投入成本也驟降為幾萬美元,準確率相較傳統實驗也毫不遜色。總之就是用計算機先幫助減少試錯成本,將1萬次生物試驗降到100次或者10次。
計算醫學的本質是采用密集數據驅動的科研范式,以人工智能為方法,以超算為支撐,可以始終系統全局性看待生命。用定量的方法去探尋數據和知識中蘊藏的生命規律和基本機制,并用工程學的方法,為生物和醫學提供服務。
譚光明認為一、二期臨床試驗數據表現很好的藥,三期臨床試驗照樣可能失敗。必須要有新技術打破固有的“天花板”,擁抱新技術有可能失敗,但也最可能成功,依靠生化技術推動的醫藥產業效率不斷在下降。一種極有潛力的趨勢是構建新技術體系,將藥物從試驗驅動推向數字驅動,推動供給側提供高效優質的產品。
醫和藥的困局
在上述行業會議上,中科院計算所西部高等技術研究院常務副院長張春明指出,目前醫藥領域面臨的挑戰有三:第一,靶點發現的技術紅利已結束,新技術還沒起效;第二,臨床試驗是“死亡之谷”,難以跨越;第三,疾病臨床用藥有效性差,市場差異化競爭困難。
其中,差異化競爭困難原因是中國藥企產品同質化嚴重。美國很多藥研發成功,商業化便能成功,但中國很多藥研發出來,商業化卻以失敗告終,所以需呼吁產業創新。
學術上認可的事情,商業卻并不一定成功。華夏基金控股子公司總經理、清華大學內科學博士陳斌認為,科學高地上的問題轉化為一些工業界的問題,并且融入到工業的價值鏈當中去,這才是商業上成功的前提條件。
近年來,雖然國內生物藥獲批數量逐年上升,但創新度仍然不足,創新藥研發仍以熱門靶點為主,同質化嚴重,賽道非常擁擠。有些熱門靶點如PD-1、PD-L1、BTK等,很多企業都在做,甚至100多家企業擠在一個賽道,存在一定的盲目性。
中科院計算所-哲源·圖靈-達爾文實驗室副主任趙宇認為,大數據對一些醫藥企業來說并不是工具,而是泥潭。“盡管數據的生產已經工業化,但是數據的理解與使用的能力還是非常欠缺,尤其在生物和醫藥領域更加明顯。”
多維異構的組學數據應用到臨床會有斷層,其主要體現在兩方面,首先是臨床醫生看不懂數據,不會在診療中使用數據幫助患者。另外,發表的高水平文章不能有效解決臨床實際遇到的問題。方向東表示,搭建知識網絡就是用臨床醫生及下游開發人員看得懂的語言將科學發現表達出來的過程。
數據的生產和理解完全失衡,所以生命科學和醫學的發展需要新的技術引擎。醫藥產業一直是以生化技術一條腿支撐,沿著這條技術路線中國的醫藥產業不可能超歐美發達國家,只有計算技術才能提供新的機會,才可能實現彎道超車。
張春明表示,放眼生物醫藥產業和研究,生化技術的紅利已走到盡頭,缺少新技術平臺,而計算醫學,可為醫藥提供生化技術之外一個新技術體系,把工作搬到計算機上,計算機干80%的事,人干20%的事。計算醫學平臺不僅能提高成功率,還能縮小實驗規模,節約成本。據各大研究機構評估,其可為新藥研發節省近500億美元的研發經費,真正實現了藥物的研發時間減半、投入減半,臨床有效率提高一倍。所以計算機跟生物化學一結合就“無敵”了。
計算醫學技術體系
盡管一個非小細胞肺癌腫瘤細胞里有大概200多個體細胞突變,但其中人類認識的、且對臨床治療有幫助的極少,能在臨床實踐中作為標志物的不超過十個。其他兩百個變異盡管對腫瘤生長和功能也是必要的,但在解讀中未起到任何作用,其實是因為不了解而已。
利用數據模型便可有效提升對其了解程度。中科院計算所-哲源·圖靈-達爾文實驗室主任、細胞生物學與系統生物學博士牛鋼介紹稱,基因突變會引發細胞內的確定性后果,這個后果可以測量和分析,所以接下來不需要任何生物學知識就可搭建各種數據模型和深度學習框架來模擬真實細胞,并進一步通過知識模塊解讀任何真實細胞功能。
按細胞功能重新解讀得到的人類和疾病相關的功能數據叫基線數據,了解基線數據尤為重要。牛鋼表示,只有根據基線數據進行預判,才能提前做好病人的全流程管理。例肺腺癌,得到患者腫瘤的功能信息后,首先要判斷其轉移方向,其次要判斷腫瘤預后(例如預測患者OS),最后需判斷治療時機是否合適(例如抗血管藥物的使用)及免疫藥物是否適用等。如發生亞克隆進化,則需了解其進化方向。
張春明也表示,從基因到細胞行為,再到疾病表現可通過數學方法建立聯系,并能以此方式判斷臨床治療的有效性并給予解釋,甚至還能篩選最合適的人群做實驗以達到最好的藥物效果。
計算醫學解決的問題是將人類的知識用在生產實踐和科研領域里面。在藥物研發領域,可用知識圖譜融合人類全部知識寫一本“書”,例如AI寫了一本書《關于自閉癥的一切》可以將人類研究者發表的五萬六千多篇文獻做了一個系統的梳理和總結。知識圖譜在IT領域是共識化的概念,但領域專用的知識圖譜考驗融合能力。
生物醫學數據庫里有3000多萬篇文獻,計算醫學的根本假設是將其全部利用起來,但如何利用成為難點。牛鋼介紹,第一步需將研究內容相關的最核心概念抓出來,抓的過程就是重新梳理知識的分布,因從眾心理導致的知識扎堆,所以要將虛高的壓下來。第二步是要重構核心內容,AI需要在沒有任何先驗知識情況下進行,因此需要經過幾輪迭代,最后獲得真正相關的內容。第三步是分類提取知識顆粒,每一個類別代表當前這個領域的一個特定的方向或研究熱點。最后,利用相關數據庫提取基因相互作用、信號通路、藥物及其它注釋信息,這樣就可將知識和數據的增量附加到每一個人類已經建立認知的領域中。
張春明表示,在新冠肺炎全球大流行早期,尚未有大量相關文獻報道的時候,運用知識圖譜技術挖掘了14000多篇有關冠狀病毒的文獻,通過梳理得出兩個結論:一是降血壓藥氯沙坦能夠預防新冠病人的危重癥,二是一種小分子藥物C21能作為治療新冠肺炎的潛在藥物。這兩個結論第一個去年被美國AHA列為心臟病的十大進展,而小分子藥物C21之后被一家英國藥企注冊并進入臨床二期,目前效果理想。
計算醫學需要超強的高性能計算支撐。譚光明教授表示,由于現在沒有通用軟件,有通用的知識沒有通用的算法,因此需要用超算做支撐,但超算買起來容易,用起來難,這涉及到“并行優化技術”。作為計算所戰略布局,“生物醫學大數據”研究已達20年,可以快速高效地處理海量數據。
在應用領域方面,張春明稱,可用模型不同的組合構建面向應用的接口型工具,并根據不同需求增加工具以構建藥物的數字實驗場景,從算靶點、算結構至人藥匹配,以真正利用平臺解決問題。
計算醫學賦能醫藥產業
一種藥不會適合所有病人,利用計算醫學平臺選出最適合的人群,差異化競爭,提高藥物的成功率很關鍵。張春明表示,計算醫學平臺要對上述場景實現全覆蓋,少量臨床試驗數據上了平臺,可通過數據分析選出藥物最適合的人群,通過選擇優勢人群保證藥物成功的典型代表是易瑞沙。
本來藥可賣給十個人,篩選后很可能只賣給兩個人,也可能賣給更多人,這可能會令藥企感到矛盾,但利用平臺篩選出最適合的人群主要有三個優點。張春明指出,第一是可以認證為突破性療法,縮短進醫保的時間;第二是優勢人群明確,因此可對藥品進行差異化定價;第三可使藥品在適應癥上療效更好,幫助研發企業提高內功。
據臨床試驗的數據,可推測出藥物優勢人群的特征,并可據特征,推斷該藥還對哪些疾病有效。
一種藥研發成功來之不易,市場上10%的藥能拓展適應癥,通過平臺可擴大上億人市場,能大大增加藥的價值。例CDK4/6抑制劑,輝瑞、諾華、禮來三家已經在激素陽性Her2陰性乳腺癌下展示了巨大商業價值,全球也開展了上百組新適應癥臨床探索,但所費不貲,而且臨床試驗曠日持久。而計算醫學指導下的藥物數字研發平臺,以新技術已經幫助CDK4/6抑制劑“算出”若干新適應癥,其中一種新適應癥指向一個全球無藥的罕見病——“脊索瘤”,臨床實踐中,經AI判斷適用的,手術、放療治療均失敗的反反復復發作的脊索瘤患者,單藥治療三周后,腫瘤即縮減37%。而另外幾種新適應癥是非罕見腫瘤,這為全球藥物研發決策帶來廣闊想象空間。
更值得一提的是,全球每個月都有大量失敗的創新藥,可通過計算醫學平臺發現未知靶點,創造新的產業集群,重建臨床失敗藥的價值。
張春明也強調,計算醫學的數字藥物實驗場不會取代藥企,就是二八原則,80%上計算機干,20%還得人做。但是使用計算醫學技術的企業,一定會去替代那些不使用計算醫學技術的企業,趨勢如此。

2、本網其他來源作品,均轉載自其他媒體,目的在于傳遞更多信息,不表明證實其描述或贊同其觀點。文章內容僅供參考。
3、若因版權等問題需要與本網聯絡,請在30日內聯系我們,電話:0755-32905944,或者聯系電子郵件: 434489116@qq.com ,我們會在第一時間刪除。
4、在本網發表評論者責任自負。
網友評論僅供其表達個人看法,并不表明本網同意其觀點或證實其描述,發言請遵守相關規定。