欧美日韩一区二区视频在线观看_欧美日本一区_av中文字幕在线播放_亚洲精品四区_人人爽日日爽_亚州成人

AI醫療進入精準化“深水區” :OpenAI醫療評估基準落地、大模型加速變革|AI醫療浪潮?

1個月前 來源: 觀看:77

21世紀經濟報道記者 閆碩 北京報道vFr即熱新聞——關注每天科技社會生活新變化gihot.com

近日,OpenAI推出HealthBench開源基準測試,用于衡量大語言模型在醫療健康領域的性能表現與安全可靠性,引發業內廣泛討論。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

根據官方信息,HealthBench由262位來自60個國家/地區執業的醫生共同參與構建,整合了5000段真實的醫療對話數據。與以前的狹窄基準不同,HealthBench通過48562個獨特的醫生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景和行為維度。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

有研報分析指出,隨著OpenAI推出HealthBench等醫療大模型評估基準的建立和完善,AI醫療模型的性能評估將更加科學、全面,有助于加速AI技術在醫療領域的落地應用,為醫療行業的智能化升級提供有力支持,相關企業有望迎來新的發展機遇。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

另一方面,大模型本身也在加速變革。事實上,隨著大模型競爭的白熱化,競爭的焦點也已進入全新階段:從早先粗放的參數體量堆砌競賽,轉變為模型效率優化與單位算力下的性能提升。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

IQVIA艾昆緯戰略規劃副總監Barrett Li向21世紀經濟報道記者表示,隨著大模型的不斷進化,以及模型優化方法的不斷提升,已經為AI在要求更特殊的專業場景中的更廣泛應用拓展了可能性,尤其是對于醫藥行業的AI應用來說,已顯現三大趨勢:模型即產品、本地與端側部署、研發端AI應用的快速拓展。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

新的評估測試集

改善人類健康將成為通用人工智能(AGI)的決定性影響之一。如果能夠得到有效開發和部署,大語言模型有望拓展健康信息的獲取渠道,支持臨床醫生提供高質量醫療服務,并幫助人們維護自身健康。而評估對于理解模型在醫療場景中的表現至關重要。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

OpenAI認為,現有評估仍然存在一些問題,首先,未反映真實場景,脫離了實際醫療互動的復雜性,如僅采用標準化測試或有限臨床問題。其次,缺乏專家醫學驗證,評分標準未經過醫療專家嚴格審核,難以體現專業醫療判斷。此外,也并未預留改進空間,最先進模型已接近“天花板”得分,無法激勵持續優化。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

也因此,在過去的一年里,OpenAI與60個國家的262名醫生合作構建了HealthBench,包括5000個真實的醫療對話數據。HealthBench 的測試樣本被分為7個主題和5個評估維度。其中,7個主題包括緊急轉診、專業溝通定制、健康數據任務等方面,5個評估緯度則包含準確性、溝通質量、情境理解等方面。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

在HealthBench的基礎上,OpenAI還推出了兩個特別版本:HealthBench Consensus(共識版)和HealthBench Hard(困難版)。前者包含34個經醫生共識驗證的、對模型行為表現尤為關鍵的評估維度;后者則設置了更高難度的評估場景,目前最高得分僅為o3模型的32%,主要被用于挑戰模型在復雜醫療情境中的極限表現。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

對于HealthBench的可信度,OpenAI開展了HealthBench Consensus(共識版)的元評估,即將模型的打分結果與醫生人工打分進行對比。結果表明,7個評估領域中的6個領域,模型打分結果與醫生評分的中位數水平高度一致。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

有券商分析師向21世紀經濟報道記者表示,在醫療等垂直領域,準確性和實際場景的相關性比“流暢對話”更為關鍵,HealthBench不同于過去大多關注通用大語言模型表現的基準,而是聚焦醫療垂直領域,為醫療領域的AI應用提供更為專業的評估工具,同時也將推動大模型領域建立專業的AI評估標準。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

值得一提的是,在HealthBench的測評中可以發現,大模型在醫療領域的應用正迅速發展。比如,2023年推出的GPT-3.5Turbo得分為16%,而2024年5月推出的GPT-4o得分已達到32%,2024年12月推出的o3模型得分更是達到60%。另外,較小規模的模型尤其進步顯著,GPT-4.1 nano的表現超過GPT-4o,且成本僅為GPT-4o的1/25。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

大模型持續優化

根據世界經濟論壇發布的《人工智能驅動健康的未來:引領潮流》報告,人工智能是醫療保健的主要變革力量,預計2024年—2032年,AI醫療市場將以每年43%的速度增長,市場規模有望達到4910億美元。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

其中,AI在醫療服務中的應用前景廣闊。中信建投證券分析指出,AI可以擴展醫療服務可及性,可應用于診斷前、診治及診斷后階段,解決當前醫院系統醫療人員短缺和缺乏有效分流等問題,以少量資源實現高效率。此外,AI輔助醫生診療未來有望降低誤診率的同時,在部分疑難雜癥診療方面也有望發揮協同作用。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

也因此,不僅評估工具在發生變革,大模型本身也在持續優化。當前,AI在醫療領域的應用歷經了從規則驅動到數據驅動、從單一任務優化到多模態協同的演變,已進入到多模態融合階段。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

浙商證券分析指出,大模型的多模態能力解決了早期AI醫療存在的信息割裂和數據孤島等問題,大模型通過“預訓練+微調”架構,用統一參數體系處理多模態醫療數據。在臨床應用中,借助多模態技術,AI可以實現跨模態數據的理解和動態時序建模,使得AI診療與醫生的診療水平更加接近。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

需要指出的是,由于萬億級參數模型高昂的訓練成本與當下較低的投資回報比,疊加通用參數的堆砌對專業場景下的模型效率提升遇到了瓶頸,大模型競爭的焦點已從早先粗放的參數體量堆砌競賽,轉向模型效率優化與單位算力下的性能提升。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

在應用方面,Barrett Li向記者總結道,隨著大模型的不斷進化,目前對于醫藥行業的AI應用來說,幾大趨勢已經顯現:vFr即熱新聞——關注每天科技社會生活新變化gihot.com

首先,模型即產品。相比通用大模型在其他行業中相對較低的應用門檻,醫藥行業高度專業性的場景,對于模型的適配性有著更高的要求。而隨著模型訓練與針對特定知識庫優化的技術與應用逐漸推廣,大模型廠商未來預計會逐步關閉對外的API接口,轉而將專業化后的模型本身作為產品直接提供給企業用戶使用,顛覆現有的套殼應用層。而現有的專業AI軟件,也必須逐步增強其底層模型訓練的能力以應對這一挑戰。在可見的未來,將會有更多直接針對醫藥行業訓練的模型被廣泛應用。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

其次,本地與端側部署。針對特定場景而訓練優化的專業模型,可以在滿足性能要求的前提下,減少對硬件方面提出過高的要求。因此在成本可控性、分析可溯源、數據安全、反饋延遲等要求更高的場景下,專業中小模型的本地部署會提供極大的賦能。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

“此外,研發端AI應用也在快速拓展。出于高度專業性、數據安全、隱私合規等因素,相比通用大模型在商業化階段的快速發展,醫藥行業企業尚未在研發階段感受到AI所帶來的巨大轉變。而隨著特定場景專業模型訓練的普及,研發階段AI應用的壁壘未來也有望被逐一消解?!盉arrett Li說道。vFr即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.gxcspki.cn/news-7-17974-0.htmlAI醫療進入精準化“深水區” :OpenAI醫療評估基準落地、大模型加速變革|AI醫療浪潮?

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇:CXO企業一季報:5家營收破10億元,8家虧損,國際化與創新賽道或成破局關鍵

下一篇:交易超10億美金,石藥這款首仿藥何以搶灘全球市場?

為你推薦
  近日公布的新版醫保藥品目錄新增91種藥品,目錄內藥品總數增至3159種,參保人的“藥籃子”再次升級。醫保目錄是如何誕生...
01-21
這里是《21健訊Daily》,歡迎與21世紀經濟報道新健康團隊共同關注醫藥健康行業最新事件!政策動向國家藥監局出臺新規支持化妝品原料創新 2月6...
02-07
  大眾網記者 秦瑾 通訊員 李永添 報道  12月24日,德州學院董仲舒書院揭牌開班儀式在厚德樓第二報告廳舉行。德州市人民政府原副市長、一級巡視員董紹輝,上海交通大學...
01-21
  大眾網記者 司心鵬 報道  12月24日上午,廉潔文化進學校暨“青春·清菏韻澤”廉潔文化館開館儀式在菏澤職業學院舉行。市委常委、市紀委書記、市監委主任趙永強、市...
01-21
  中國平安人壽保險股份有限公司(以下簡稱“平安人壽”)近日發布公告稱,平安資管受托該公司資金,...
01-24
  “我行推出了一款春節專享理財產品,業績比較基準會比同期限、同類型的理財產品高出5到10個基...
02-07
在星座學中,每個星座都有自己獨特的性格特點和喜好。而天蝎男作為十二星座中最神秘、深...
01-22
在星座學中,每個星座都有其獨特的性格特點和相處方式。而天蝎男作為十二星座中的一員,也...
01-22
短款襯衫裙子怎么搭配?一、短款襯衫裙子怎么搭配?搭配方案一:白襯衫+黑色A字褶裙傘形裙擺,細高腰的A字褶裙處處都散發著復古優雅女人味,搭配白襯衫,仿佛又回到赫本的熟女年代,加之...
02-12
明星魅力解析:那些令人傾倒的女神們在光影交錯的舞臺上,女明星們以她們的美麗和才華征服了無數觀眾。無論是熒幕上的風情萬種,還是紅毯上的璀璨奪目,明星的魅力總是讓人心醉神迷...
02-12
2月16日消息,蘇寧易采云近日先后中標多個重點項目,作為綜合實物電商供應商,將充分發揮系統平臺及自營供應鏈優勢,助力政企采購更高效更便捷。其中,蘇寧易采云中標江蘇省政府采購...
02-17
2月18日消息,京東宣布與學而思簽訂戰略合作協議,明確了未來三年內,學而思在京東全渠道銷售50億元、覆蓋超100萬用戶的目標。根據協議,雙方將聚焦“人、貨、場”的全面協同,通過產...
02-18
隨著2025年1月的新年序曲輕輕響起,一批精選的冬季好物如約而至。《消費者報道》在這個歲末年初的溫馨時刻,精心策劃并發布了本年度1...
02-07
2月26日消息,美國運通(海外)日前宣布與支付寶達成合作,將為在華持卡人提供數字支付服務。美國運通(海外)持卡人現可將其卡片關聯至支付寶賬戶,實現線上線下支付,簡化游客的交易過程...
02-27
【#小紅書1500萬在杭州成立新公司# #小紅書新公司叫棋行科技#】天眼查App顯示,近日,棋行科技(杭州)有限公司成立,法定代表人為張雷,注冊資本1500萬人民幣,經營范圍含社會經濟咨詢服...
01-21
【#福州市勘測院等成立空域領航科技公司# 含航空運營支持服務】天眼查App顯示,近日,福州市空域領航科技有限公司成立,法定代表人為吳建,注冊資本5000萬人民幣,經營范圍包括信息系...
02-09
雖然黑曜石希望玩家在《宣誓》的整個游戲過程中都能感受到成長,但該開發商也不希望這款角色扮演游戲“開局就給人糟糕的體驗”。因此,其理念是通過游戲界面對攻...
02-02
根據游戲制作人小島秀夫最新的推文暗示,《死亡擱淺2:冥灘之上》或即將發布新預告片。此前,在TGS 2024上,小島秀夫曾透露,《死亡擱淺2:冥灘之上》的正式發售日期將在2...
02-07
2月4日中午,中國選手谷愛凌的微博賬號發文,宣布退出哈爾濱亞冬會的比賽。谷愛凌在微博中說:“我在Aspen Xgames比賽受傷后,為了能參加緊接其后的世界杯比賽,在訓練中不幸再次受傷...
02-04
極目新聞記者 龐正 袁超一攝影記者 李輝海報制作 商羽琳什么是支點、建成什么樣的支點、怎樣建支點?2月5日,乙巳蛇年首個工作日,湖北“新春第一會”——全省加快建成中部地區崛...
02-06
近日,完美世界(002624.SZ)發布2024年度業績預告。預告顯示,完美世界去年全年預計實現營業收入55億元至56億元,預計歸母凈利潤為虧損11...
01-21
當下,IP成為了企業品牌發展的主旋律,而創始人IP更是企業品牌營銷中常見的一個名詞。2024年12月26日至28日,全球創始人IP領袖高峰論壇順應時勢,圍繞“創...
01-21
  日前,記者從省國資委獲悉,去年省屬企業再接再厲,實現利潤總額80.55億元,同比增長75.2%,利潤增速全國排名...
02-10
注意了!2025年遼寧省事業單位集中面向社會公開招聘工作人員公告發布報名時間2025年2月19日9:00至2月25日...
02-18
  一場公交車小型化潮流,正在席卷全國部分城市?!  皩殞毎褪俊痹絹碓蕉唷 ?025年初,不少青島居民發現,新的公交車“縮水”了?! ∫郧澳欠N“巨無霸”的公交車越來越...
01-21
  中新經緯1月17日電 題:新興領域發展為消費內循環提供新支撐  作者 劉春生 中央財經大學副教授  2024年,社會消費品零售總額達到48.8萬億元,比上年增長3.5%,規模穩居全球...
01-21
[本站 資訊] 日前,小米YU7實車圖再度曝光,這組實車圖展示給我們新車的更多細節,新車定位為中大型SUV,售價預計會在30-40萬之間,并將在2025年6月-7月份正式上市。此次最新...
01-24
肉體與靈魂一同出發,是件多么難的事。比如此刻的我,還沉浸在春節一醉方休的歡娛中。身體已然上班,內心依舊懶散。蛇年首個工作日,國內車圈首個重大新聞來自豐田:雷克薩斯將在上海...
02-06
  1、《難哄》段嘉許的扮演者是吳宇恒,吳宇恒在這部劇中客串了段嘉許一角,他是男主桑延的好朋友?! ?、吳宇恒出生于1996年,西南交通大學畢業,曾參加過綜藝《美少年學社》...
02-14
  1、《難哄》中溫以凡之所以叫溫霜降,是因為她的性格和氣質看起來比較高冷?! ?、而且溫以凡也是霜降的那一天出生的,不過只有桑延喜歡叫她溫霜降這個名字?! ?、溫以...
02-15
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕

主站蜘蛛池模板: 亚洲视频在线观看一区二区三区 | 国产成人精品免高潮在线观看 | 日韩高清一区二区 | 日韩欧美在线一区 | 99re6在线视频精品免费 | 黄色在线观看网站 | 国产在线观看一区二区三区 | 欧美日韩一级视频 | 免费黄色网址在线播放 | 国产一区二区在线不卡 | 欧美黄视频 | 99精品久久久久久蜜桃 | 黄色电影天堂 | 一级黄色影片在线观看 | 久久精品性视频 | 日本三级视频在线播放 | 国产不卡区 | 日韩一区二区三免费高清在线观看 | 亚洲成人一区二区 | 91久久久久久久久久久久久久 | 国产精品久久久av | 欧洲毛片| 四虎av| 久久99精品久久久久久青青日本 | 欧美一区二区三 | 亚洲免费视频在线观看 | 日本三级黄色大片 | 久久精品二区 | 国产精品久久久久久久久久免费 | 国产伦一区 | 欧美精品一区二区在线播放 | 可以在线观看的av网站 | 欧美亚洲国产精品 | 亚洲aaaaaa特级 | 免费欧美 | a在线播放 | 欧洲一区二区视频 | 婷婷综合五月天 | 国产精品粉嫩白浆在线观看 | 国产小视频在线观看 | 成人在线小视频 |