微軟 AI 診斷複雜病例效率比人類醫生高四倍

微軟 AI 診斷複雜病例效率比人類醫生高四倍

醫療診斷革命:微軟AI的卓越成就

微軟人工智慧憑藉其創新的人工智慧診斷協調器 (MAI-DxO) 在醫療診斷領域取得了重大進展。這款先進的工具已證明能夠準確診斷《新英格蘭醫學雜誌》(NEJM) 中85%的疑難病例。考慮到 NEJM 病例通常較為複雜,需要豐富的專業知識和診斷測試,通常需要多位專家共同協作才能得出最終診斷,這一成就顯得尤為突出。

MAI-DxO 的運作方式

MAI-DxO 透過模擬虛擬臨床醫生小組來提高診斷準確性。透過利用語言模型,它可以啟動必要的後續問診、請求額外檢查,並隨後提供有針對性的診斷。 MAI-DxO 的整合展現出了令人欣喜的結果,尤其是與 OpenAI 的 o3 模型配合使用時,其對 NEJM 基準病例的診斷準確率達到了85.5%

一項涉及21名來自美國和英國、擁有5至20年臨床經驗的醫生的對比研究顯示,他們在相同診斷任務上的平均準確率僅為20%。這項鮮明對比凸顯了人工智慧系統在某些診斷場景下超越傳統人類能力的潛力。

賦能患者和臨床醫生

微軟表示,MAI-DxO 有可能從根本上改變醫療保健格局。這項技術不僅使患者能夠掌控日常健康管理,還為醫療專業人員提供了增強的決策支援工具,以應對複雜的醫療案例。

開發序貫診斷基準

為了評估AI在NEJM病例診斷的有效性,微軟開發了序貫診斷基準(SD Bench)。此基準提供了一種結構化方法來分析NEJM中的304個近期病例,使AI模型能夠進行逐步診斷。隨著模型收集新信息,它會動態更新其推理過程,並逐步得出可與NEJM出版物進行評估的結論性診斷。

確保安全性和可靠性

儘管微軟的研究成果令人鼓舞,但必須認識到,這些發現代表著將生成式人工智慧融入醫療保健領域的初步進展。為了確保其在臨床環境中的安全有效應用,需要進一步的實證研究。此外,迫切需要建立合適的治理和監管框架,以確保這些人工智慧模式的可靠性和安全性。為了實現這些目標,微軟正在與各醫療機構合作,在大規模應用之前對其方法進行嚴格的測試和驗證。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *