首頁|台灣區電機電子工業同業公會

2022年底以來，國內外醫院陸續試用ChatGPT協作病歷文件、加值醫療資訊系統。與此相對，Google在2023年7月公開其醫療專用大型語言模型Med-PaLM 2，在全球智慧醫院龍頭－美國梅奧診所(Mayo Clinic)自4月起展開測試。

Med-PaLM出自Google，為第一個通過美國醫師執照考試(USMLE)的醫療專用大型語言模型，而由Google更大型模型PaLM 2訓練成的Med-PaLM 2，在USMLE正確率表現提升到目前最高紀錄86.5%。

大型語言模型需要大量運算資源運行，可能有5,400億以上參數的Med-PaLM 2運行在Google充足的硬體建設上。對梅奧診所而言，以Google雲端客戶名義直接測試Med-PaLM 2，不需煩惱額外硬體建設支出。

而早在2021年，梅奧已打算將千萬名以上患者相關的巨量資料，從院內平台移往Google雲端，進行更好的管理與運用，包含開發AI醫療應用。

根據Google雲端方案，客戶資料將由加密技術為客戶自行控管，Google無法取得、辨識個別客戶資料。而醫院作為代管患者資料的角色，需在確保患者隱私的前提下測試Med-PaLM 2，梅奧會先將相關資料去識別化，後在雲端測試模型時，Google亦無法取得患者相關資料。

Med-PaLM 2為醫療領域專用生成式AI

Med-PaLM(Med-PaLM 2前一代模型) 經由7個混合問題集微調訓練成，包含公開資料集MedQA(USMLE)、PubMedQA、Medication QA等，及Google由被搜尋過的健康問題組成的新資料集HealthSearchQA。Med-PaLM所有訓練資料包含醫師執照考題、學術論文、消費者提問等，皆與醫療健康相關，為醫療專用大型語言模型(LLM)。

大型語言模型與ChatGPT皆是一種自然語言處理(NLP)，而歷年NLP相關研究持續嘗試讓AI在理解醫學文件上有所突破，文件內容廣泛包含醫學期刊論文、醫師問診筆記、患者病歷報告等。

大型語言模型的出現也解鎖處理醫學文件內容的成功，處理任務包含從擷取醫師筆記中特定資訊、摘要患者病歷，到完整的醫療問題答覆，如Med-PaLM、Med-PaLM 2在醫療健康問答上
的準確率、正確性等表現。

在大型語言模型與近期AI技術持續對醫學術語、醫療健康知識，及醫療健康系統程式碼、資料格式等提升理解程度，醫療機構中長年累積的真實世界資料，尤其是非結構化資料如PDF患者病歷與檢驗報告等，有機會透過大型語言模型快速提取資訊，或做進一步分析。

雲端大廠紛紛展開跨界合作

在Med-PaLM的訓練中，模型以醫師執照考題、消費者醫療問題等醫療健康資料，搭配專業醫師參考回答來訓練，根據Google刊登在《Nature》的論文，Med-PaLM相較原先Flan-PaLM模型在消費者醫療問答的表現顯著提升，反應出將醫師實際回覆內容作為訓練資料，可提升模型答覆內容的品質。

而Med-PaLM 2並未搭配醫師參考回答來訓練，其訓練資料來自部分訓練Med-PaLM的醫療問答集(7個資料集中之5個)，而在各方面測試的表現都勝過Med-PaLM。Med-PaLM、MedPaLM 2的訓練過程，都在在顯示大型語言模型需要以醫療健康資料訓練才能應用於醫療領域。

然現階段大型語言模型，不論是否為醫療專用，都還未有以「真實世界的醫療資料」來進行訓練或測試的公開結果。個人實際在醫療場域包含看診、檢驗、治療與保險等資料，均涉及個人隱私，被保管在醫療、保險或政府機構的大型資料庫。

Google讓Med-PaLM 2在梅奧診所進行測試是少數先例，2023年4月微軟宣布將GPT-4導入其收購的語音AI公司Nuance旗下醫療產品；同樣的時間點，Amazon以生成式AI平台Bedrock和3M旗下醫療系統品牌M*Modal合作導入相關技術。

儘管真實世界醫療資料是否對大型語言模型能顯著提升效能或有其他助益還不得而知，但科技巨頭們紛紛將自家大型語言模型送入醫療場域，後續成效如何值得關注，尤其Med-PaLM 2已是醫療專用大型語言模型。