日前,Google?。遥澹螅澹幔颍悖琛『汀?a>Google DeepMind 的?。粒伞F(tuán)隊(duì)開發(fā)了一款基于大語言模型的人工智能系統(tǒng),?。粒停桑牛ǎ粒颍簦椋悖酰欤幔簦濉。停澹洌椋悖幔臁。桑睿簦澹欤欤椋纾澹睿悖濉。牛穑欤铮颍澹颍?,針對(duì)診斷對(duì)話進(jìn)行了優(yōu)化。AMIE采用了一種強(qiáng)化學(xué)習(xí)算法中的「自我博弈」方法,可以在一個(gè)模擬環(huán)境中自我對(duì)弈,通過自動(dòng)反饋機(jī)制,可在各種疾病、醫(yī)學(xué)??坪铜h(huán)境中進(jìn)行擴(kuò)展學(xué)習(xí)。AMIE已通過圖靈測(cè)試。該研究于 2024 年?。薄≡隆。保薄∪瞻l(fā)布在?。幔颍兀椋觥☆A(yù)印平臺(tái)。
研究人員基于真實(shí)世界數(shù)據(jù)集訓(xùn)練AMIE,這些數(shù)據(jù)集包括醫(yī)學(xué)推理、醫(yī)學(xué)總結(jié)和真實(shí)世界的臨床對(duì)話。但同時(shí)也面臨著挑戰(zhàn),一方面,現(xiàn)有的真實(shí)世界數(shù)據(jù)往往無法捕捉到大量的醫(yī)療條件和場(chǎng)景,這阻礙了數(shù)據(jù)的可擴(kuò)展性和全面性。另一方面,從真實(shí)世界對(duì)話記錄中獲得的數(shù)據(jù)往往是嘈雜的,包含含糊不清的語言(包括俚語、行話、幽默和諷刺)、中斷、不合語法的語句和不明確的引用。
為了解決這些局限性,研究人員設(shè)計(jì)了一個(gè)基于自演的模擬學(xué)習(xí)環(huán)境,讓聊天機(jī)器人訓(xùn)練自己“對(duì)話”。該環(huán)境具有自動(dòng)反饋機(jī)制,用于模擬醫(yī)療環(huán)境中的診斷性醫(yī)療對(duì)話,從而在多種醫(yī)療條件和環(huán)境中擴(kuò)展AMIE的知識(shí)和能力。
研究人員利用現(xiàn)有的現(xiàn)實(shí)世界數(shù)據(jù)集(例如電子健康記錄和轉(zhuǎn)錄的醫(yī)療對(duì)話)對(duì)基礎(chǔ)?。蹋蹋汀∵M(jìn)行了微調(diào)。為了進(jìn)一步訓(xùn)練模型,研究人員要求?。蹋蹋汀“缪莼加刑囟ú“Y的人,以及富有同理心的臨床醫(yī)生,旨在了解患者的病史并設(shè)計(jì)潛在的診斷。
團(tuán)隊(duì)設(shè)計(jì)了一個(gè)框架,來評(píng)估診斷對(duì)話的過程,包括病史采集、診斷準(zhǔn)確性、管理推理、溝通技巧和同理心。通過一項(xiàng)隨機(jī)、雙盲交叉研究,以客觀結(jié)構(gòu)化臨床檢查(OSCE)的方式與經(jīng)過驗(yàn)證的患者參與者進(jìn)行基于文本的咨詢,將?。粒停桑拧〉谋憩F(xiàn)與初級(jí)保健醫(yī)生(PCP)的表現(xiàn)進(jìn)行了比較。
該研究包括來自加拿大、英國(guó)和印度臨床提供者的?。保矗埂€(gè)病例場(chǎng)景、20 個(gè)與?。粒停桑拧∵M(jìn)行比較的初級(jí)保健醫(yī)生(PCP),以及??漆t(yī)生和患者參與者的評(píng)估。研究人員觀察到AMIE在模擬診斷對(duì)話中的表現(xiàn)至少與初級(jí)保健醫(yī)生不相上下。根據(jù)??漆t(yī)生的說法,AMIE的診斷準(zhǔn)確性更高,在32個(gè)指標(biāo)中的28?jìng)€(gè)指標(biāo)上表現(xiàn)更優(yōu)。根據(jù)參與研究的患者的說法,AMIE在26個(gè)指標(biāo)中的24個(gè)指標(biāo)上表現(xiàn)更優(yōu),包括禮貌、解釋病情和治療、給人誠(chéng)實(shí)的印象以及表達(dá)關(guān)心和承諾等。
AMIE表現(xiàn)出了充分的潛力,但目前該工具仍處于純粹的實(shí)驗(yàn)階段,還沒有在真正的患者身上進(jìn)行過測(cè)試。該團(tuán)隊(duì)在論文里也注明了該工具的局限性,應(yīng)謹(jǐn)慎使用。
論文的合著者?。粒欤幔睢。耍幔颍簦瑁椋耄澹螅幔欤椋睿纾幔怼”硎?,下一步是進(jìn)行更詳細(xì)的研究,從而評(píng)估潛在的偏見,并確保該系統(tǒng)對(duì)不同人群是公平的。Google 團(tuán)隊(duì)也在研究對(duì)臨床醫(yī)療問題系統(tǒng)測(cè)試的道德要求。未來還有許多重要的限制因素需要解決,包括在真實(shí)世界限制條件下的實(shí)驗(yàn)表現(xiàn),以及對(duì)健康公平與公正、隱私、穩(wěn)健性等重要主題的專門探索,以確保技術(shù)的安全性和可靠性。
注:文章來源于大健康派,如有侵權(quán),請(qǐng)聯(lián)系刪除