中醫藥領域卷出多個大模型,“AI老中醫”來了?

隨着AI普惠時代的到來,大模型“卷”向了各個行業。據不完全統計,2023年以來,在中醫藥行業已經有20多個相關的大模型相繼出爐。

中醫藥大模型一擁而上的背後,是中醫藥在傳承創新方面進入現代化的迫切需求。儘管中醫藥大模型在影像診斷、智慧問診方面已經有了一定的探索,但由於中醫理論和實踐的複雜性,中醫藥的數智化探索仍處於起步階段。

多位受訪專家認爲,在藥物研發方面,基礎臨牀數據積累和人才培養等仍然存在不小的挑戰,需要更多的臨牀研究單位和一線醫生參與進來,與大模型廠商和臨牀研究的真實數據做深度結合,才能真正發揮價值。

大模型卷向中醫藥領域

在不少中醫院裡,AI智能中醫診療儀已經在通過採集患者的面相和舌象,在進行AI智能識別後,結合數據庫中的知識,給出體質分析報告和定製化的養生建議。南京甚至還有茶飲店請來了“賽博老中醫”,推出AI舌面診和脈診對顧客進行茶飲匹配推薦。

“人工智能的技術爲我們提供了更加有效的方法學。” 上海中醫藥大學交叉科學研究院常務副院長葛廣波告訴第一財經記者,目前上海中醫藥大學結合人工智能開發現代的中醫四診儀,就是結合從臨牀中收集到的圖片信息,然後再結合人工智能做症型的分型,未來將按照證候分成的亞型,再指導中醫藥進行精準治療。

“中醫不傳之秘在於量”,據不完全統計,自2023年來,已經有20多個相關的大模型相繼出爐。在這些中醫藥大模型的背後,站着大量的高校和科研院所,也不乏華爲、百度等大廠的身影。

高校方面,復旦大學和同濟大學共同開發了仲景中醫大語言模型。華東師範大學、上海中醫藥大學、華東理工大學、海軍軍醫大學、臨港實驗室、華潤江中現代中藥全國重點實驗室聯合開發了“數智岐黃”中醫藥大模型。國家超級計算天津中心聯合現代中醫藥海河實驗室及天津中醫藥大學、天津大學、信創海河實驗室等團隊合作研發了“天河靈樞大模型”。

大廠方面,華爲和天士力共建了“數智本草大模型”。成都中醫藥大學、百度和太極集團等聯手發佈中藥全產業鏈大模型“本草智庫”。

多位受訪專家表示,中國有着豐富的中醫藥古籍經典和醫生經驗的積累,這爲“AI+”提供了很好的基礎。“人工智能還可以在中醫藥的藥效物質和作用機制的發掘中,產生一些新的應用,此外還在現代製藥中發掘新的適應症和創新藥的研發中有所應用。”葛廣波說。

輔助診斷應用更易落地

中醫藥大模型一擁而上的背後,是中醫藥在傳承創新方面進入現代化的迫切需求。

2019年10月發佈的《關於促進中醫藥傳承創新發展的意見》明確提出了以信息化支撐中醫藥服務體系建設,實施“互聯網+中醫藥健康服務”行動,爲中醫藥發展“把脈”“開方”,提升中醫藥信息化水平,大力推進中醫系統數字化、信息化,推動中醫藥與全民健康信息平臺互聯互通、信息共享。

今年8月,國家中醫藥管理局、國家數據局聯合印發《關於促進數字中醫藥發展的若干意見》(下稱“意見”),在包括中醫藥診療服務、人才培養、科技創新等方面提出了20條舉措。

在近期舉行的網絡藥理學與人工智能學術大會上,中國科學院院士、中國科學院上海藥物研究所研究員陳凱先在主題演講中表示,中醫藥在長期的發展過程中,積累了大量紛繁複雜的數據,完全可以將最新的現代科學技術應用到中醫藥的傳承創新和發展中,人工智能將推動中醫藥創新發展的技術變革浪潮。

從目前已經發布的大模型來看,大模型的具體應用場景仍然以輔助問診爲主,在中醫藥的原創和研發方面,也有一定的探索。有專家提出,目前由於穿戴式設備的發展和影像學的積累,人工智能在輔助診療中相對容易突破,也能夠發揮比較大的作用。但業界目前對大模型的期望,還是在於能夠讓AI在中醫藥的研發中發揮更大的作用。

據陳凱先院士介紹,南京信息工程大學和北京交通大學開展了多學科交叉、多單位合作的研究,用網絡醫學來揭示中醫辨證論治治療療效的一些共性的機制,爲中醫的辨證論治的科學內涵提供了新的思路,探索了由人工智能、大數據等應用於中醫藥領域、解決中醫藥問題的一些研究。

葛廣波表示,與傳統的化藥相比,中藥通常情況下是通過多成分、多種信號通路作用在多個藥物靶點上,然後產生的整合協同的效應。中藥的這種整合協同效應,使得中藥新藥研究很難篩選出其中某一種單一成分,可以代替整個中藥複方的藥理活性,這個時候就需要在方法學和研究策略上進行一些創新。

中醫藥高質量臨牀數據是關鍵

今年11月24日,華爲雲和天士力聯合上海中醫藥大學、廣州中醫藥大學、浙江中醫藥大學、中國藥科大學等多所高校和研究院所的專家學者,發起並啓動數智中醫藥創新聯盟,以期促進現代科技在中醫藥創新領域的應用和發展。

早在2021年,華爲雲就打造出盤古藥物分子大模型。華爲雲科學計算域總經理李寅在最近的一次演講中提到,華爲雲希望能整合一個大的平臺,吸引全球的用戶和開發者聚焦在平臺上去更加簡單地做一些事情。而天士力與華爲雲共建的“數智本草大模型”則欲在中醫藥研發領域有所發力。

在中醫藥領域內,已經累積了幾千年的經驗和文獻,但中醫藥對於人體的作用仍然處於比較模糊的狀態。目前國內提出的中醫藥大模型普遍以中醫藥傳統經驗知識圖譜作爲訓練數據,但如何用現代科學方法來解析中醫藥的作用原理,讓中醫藥和靶點數據庫進行一一對應,從而有科學依據地來優化和提高中醫藥臨牀療效,是亟需解決的問題。

受訪的多位專家都表示,中醫藥行業的數智化過程中,底層的數據庫和人才培養是最大的兩個難點,這需要中醫藥行業、大模型廠商以及社會各方面的共同努力。

浙江大學長三角智慧綠洲創新中心主任、長江學者特聘教授範驍輝直言,“事實上可能是我們這個行業自己還沒有做好準備”。

“大模型首先是需要有高質量的大數據,這在我們中醫藥界傳統上還是比較欠缺的。”範驍輝表示,現在比較豐富的是一些經典古籍類的文本數據,但是在臨牀試驗等數據方面,仍然沒有很好地梳理。他同時表示,很多大學的團隊、科研院所,包括醫院組織的一些團隊都在做數據積累的工作,但這些數據分散在各地,也缺乏標準化。“這個還涉及數據和臨牀結合的難點、數據的個性化等原因,以及醫藥行業的數據還涉及患者的隱私和倫理方面的因素。”

作爲“數智中醫藥創新聯盟”的發起人之一,上海市中西醫結合脈管病研究所所長曹永兵教授提到,他之所以要推動數智中醫藥創新聯盟的成立和發展,幫助大模型廠商去對接臨牀單位,就是希望大模型廠商能和中醫臨牀單位及一線的中醫緊密結合起來,真正推動高質量中醫藥臨牀診療數據的收集和整理,爲中醫藥大模型提供有效支撐,使其在新藥研發和中醫臨牀診治方面發揮重要作用。

曹永兵教授告訴第一財經,2019年的時候他就和臨牀醫生開始探索,如何建立一個醫生、科學家和患者這三個羣體爲一體的脈管病專病庫來進行脈管病中西醫結合診療數據的管理,但是由於各種原因這個項目最後沒能推進落實。其中除了資金問題和服務於醫生的臨牀研究團隊組建問題,更重要的是臨牀數據的脫敏和共享問題,“這個比科研經費更讓人頭疼。”

曹永兵同時強調稱,中醫藥臨牀數據收集非常難,但更難的是如何提高中醫藥臨牀數據的質量,尤其是與療效和安全性相關的數據,這是目前中醫藥大模型發展中最需要解決的難題。“如果大模型得到的數據都是基於網絡,而不是來自臨牀的真實、有效的數據,就相當於在大模型裡摻了很多的‘沙子’,這些‘沙子’會干擾到大模型的輸出,使錯誤被不斷放大。”

曹永兵提到,臨牀數據一定要真實、有效,好多大模型在底層數據輸入時沒有臨牀團隊的參與,就和真實的科研脫節了。“如果沒有數據,空有一堆大模型,就相當於建了很多爛尾樓。” 在大量有效的臨牀研究真實數據之外,另一個難點在於人才,目前已經有一些高校開始探索人工智能和中醫藥方面的交叉研究。

第一財經瞭解到,上海中醫藥大學正在籌備中國首箇中醫藥領域的人工智能研究院,浙江大學的藥學學科一直也非常注重用跨學科的技術來推動從基礎研究到轉化應用到人才培養等整個新藥研究體系的建設。

範驍輝告訴記者,真正要把中醫藥數智化這個事情做成,需要有一批人既懂人工智能方面的技術,又對中醫藥領域的科學問題相對比較瞭解,而當下能做到這樣跨界的複合型人才是非常缺乏的。

“原來傳統上的培養框架和體系跟不上現在的需求,如果人才培養體系不能夠很好改革以適應這種需求的話,短期內這個瓶頸還是很難去突破。”範驍輝說,各地的大學也都希望在學科交叉方向上去培養學生,“這既需要中醫藥行業裡面的人自己去努力,也需要國家和各個行業大家一起來努力。”