當前位置:首頁 > 國際 > 螞蟻醫(yī)療大模型拿下MedBench測評“雙料”冠軍 正文

螞蟻醫(yī)療大模型拿下MedBench測評“雙料”冠軍

來源:千龍網(wǎng)   作者:生活   時間:2025-03-15 21:47:58

近日,雙料記者發(fā)現(xiàn),螞蟻國內(nèi)權(quán)威醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單。醫(yī)療多個醫(yī)療AI產(chǎn)品及研究團隊入榜,大模其中螞蟻AI健康管家團隊研發(fā)的型拿下螞蟻醫(yī)療大模型以評測榜單97.5、自測榜單98.2的評冠高分再度奪得雙料冠軍。

(MedBench評測榜單截圖)

(MedBench自測榜單截圖)

MedBench測評結(jié)果顯示,雙料螞蟻醫(yī)療大模型在醫(yī)學(xué)知識問答、螞蟻醫(yī)學(xué)語言生成、醫(yī)療復(fù)雜醫(yī)學(xué)推理三類單項中位居第一,大模同時,型拿下在醫(yī)學(xué)語言理解和醫(yī)療安全和倫理等緯度也有突出表現(xiàn)。評冠在此前的雙料榜單綜合測評中,螞蟻醫(yī)療大模型也長期位居綜合榜第一。螞蟻

醫(yī)療行業(yè)是醫(yī)療復(fù)雜度較高的領(lǐng)域,醫(yī)療大模型實時評估體系對應(yīng)用穩(wěn)定落地尤為關(guān)鍵。MedBench為中文醫(yī)療大語言模型提供了一個公平、透明且科學(xué)的評估標準,螞蟻醫(yī)療大模型登頂榜單,意味著其當前的技術(shù)能力轉(zhuǎn)化為醫(yī)療AI產(chǎn)品具備專業(yè)度和領(lǐng)先性。

據(jù)了解,螞蟻醫(yī)療健康團隊近期完成了基于強化學(xué)習(xí)的新一代醫(yī)療推理模型研發(fā)。AI引擎升級后,該垂直行業(yè)大模型不僅具備“醫(yī)學(xué)思維”推理能力,還能完成“圖、文、音視頻等”多模態(tài)交互。基于此,螞蟻醫(yī)療大模型添加百億級中英文圖文、千億級醫(yī)療文本語料及千萬級高質(zhì)量醫(yī)療知識圖譜進行專業(yè)知識訓(xùn)練,經(jīng)過醫(yī)患診療、藥廠等真實場景問答的多任務(wù)微調(diào),以及數(shù)百個專業(yè)醫(yī)學(xué)團隊、醫(yī)生標注數(shù)據(jù)的強化學(xué)習(xí)。以醫(yī)學(xué)報告、藥品、毛發(fā)等圖像識別為例,目前該模型準確率達90%以上。

在安全性上,螞蟻醫(yī)療大模型集合了螞蟻集團在隱私安全風(fēng)控方面的技術(shù)優(yōu)勢,并在數(shù)據(jù)使用的去標識化方面遵循安全隱私標準。從去年7月推出以來,還面向行業(yè)開放了配套的“可信一體機+可信云”解決方案,保障數(shù)據(jù)隱私與算力效率,為醫(yī)院、醫(yī)療機構(gòu)提供可靠的本地部署與數(shù)據(jù)保護支持。

據(jù)悉,螞蟻醫(yī)療健康成立至今已有10年,從2023年開始進軍醫(yī)療AI領(lǐng)域,除了投入垂直領(lǐng)域大模型技術(shù)研發(fā)外,在AI應(yīng)用層面同樣進展迅速。

公開資料顯示,其與浙江衛(wèi)健委聯(lián)合推出全國首個省級官方AI健康應(yīng)用“安診兒”,已累計服務(wù)近3000萬人次,覆蓋浙江省內(nèi)1000余家醫(yī)療機構(gòu)。去年7月,與國內(nèi)頭部三家醫(yī)院、權(quán)威醫(yī)療機構(gòu)成立AI醫(yī)療創(chuàng)新應(yīng)用“聯(lián)盟”以來,螞蟻醫(yī)療健康已與各地衛(wèi)健委、醫(yī)保局、醫(yī)院、醫(yī)生合作研發(fā)了近百個醫(yī)生智能體,在完成對好大夫在線收購后,雙方在AI輔助醫(yī)生工作方面開展探索,推出“AI科普助手”等系列產(chǎn)品。截至目前,螞蟻醫(yī)療大模型已經(jīng)成為業(yè)內(nèi)應(yīng)用場景最豐富、與醫(yī)療機構(gòu)、醫(yī)生、醫(yī)院共建最深的垂類大模型之一。

標簽:

責(zé)任編輯:重慶