欧美日韩一区二区视频在线观看_欧美日本一区_av中文字幕在线播放_亚洲精品四区_人人爽日日爽_亚州成人

“喂”給人工智能的真實數據終將耗盡,合成數據能否讓AI模型精確可靠?

5個月前 來源:中國科技網 觀看:137

人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿足AI的“胃口”,科技行業正轉向使用合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

澳大利亞“對話”網站在本月稍早時間報道中指出,合成數據具有諸多優勢,但過度依賴合成數據也可能削弱AI的精確性和可靠性。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

合成數據應運而生Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

以往,科技公司主要依賴真實數據來構建、訓練和改進AI模型。真實數據是指由人類創建的文本、視頻和圖像。它們通過調查、實驗、觀察或挖掘網站和社交媒體等途徑被收集而來。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

真實數據因蘊含真實事件以及其場景和背景而極具價值,但其并非盡善盡美。它可能摻雜拼寫錯誤、不一致或無關的內容,甚至潛藏嚴重偏見,導致生成式AI模型在某些情況下創建的圖像僅展示男性或白人形象。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

但真實數據日益匱乏,因為人類生成數據的速度趕不上AI不斷增長的需求。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

美國開放人工智能研究中心聯合創始人伊利亞·蘇茨克維爾在去年12月舉行的機器學習會議上聲稱,AI行業已觸及他所稱的“數據峰值”,AI的訓練數據如同化石燃料一樣面臨著耗盡的危機。此外,有研究預測,到2026年,ChatGPT等大型語言模型的訓練將耗盡互聯網上所有可用文本數據,屆時將沒有新的真實數據可供使用。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

為給AI提供充足的“養分”,一種由算法生成的、模仿真實世界情況的數據——合成數據應運而生。合成數據是在數字世界中創造的,而非從現實世界收集或測量而來。它可以作為真實世界數據的替代品,來訓練、測試、驗證AI模型。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

從理論上來說,合成數據為訓練AI模型提供了一種經濟高效且快捷的解決方案。它有效解決了AI訓練使用真實數據時飽受詬病的隱私問題和道德問題,尤其是涉及個人健康數據等敏感信息時。更重要的是,與真實數據不同,合成數據在理論上可以無限供應。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

研究機構高德納公司估計,2024年AI及分析項目使用的數據中,約60%是合成數據。到2030年,AI模型使用的絕大部分數據將是由AI生成的合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

科技公司來者不拒Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

事實上,微軟、元宇宙平臺公司,以及Anthropic等眾多科技頭部企業和初創企業,已經開始廣泛使用合成數據來訓練其AI模型。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

例如,微軟在1月8日開源的AI模型“Phi-4”,便是合成數據攜手真實數據訓練的;谷歌的“Gemma”模型也采用了類似方法。Anthropic公司也利用部分合成數據,開發出其性能最優異的AI系統之一“Claude 3.5 Sonnet”。蘋果自研AI系統Apple Intelligence,在預訓練階段,也大量使用了合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

隨著科技公司對合成數據的需求與日俱增,生產合成數據的工具也接踵而至。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

英偉達公司發布的3D仿真數據生成引擎Omniverse Replicator,能夠生成合成數據,用于自動駕駛汽車和機器人訓練。去年6月,英偉達開源了Nemotron-4340b系列模型,開發者可使用該模型生成合成數據,用于訓練大型語言模型,以應用于醫療保健、金融、制造、零售等行業。在醫療、金融等專業領域,該模型能夠根據特定需求生成高質量的合成數據,幫助構建更為精準的行業專屬模型。微軟推出的開源合成數據工具Synthetic Data Showcase則旨在通過生成合成數據和用戶界面,實現隱私保護的數據共享和分析。亞馬遜云科技推出的Amazon SageMaker Ground Truth也能為用戶生成數十萬張自動標記的合成圖像。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

此外,去年12月,元宇宙平臺公司推出開源大模型Llama 3.3,更是大幅降低了生成合成數據的成本。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

過度依賴風險難測Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

盡管合成數據暫時解決了AI訓練的燃眉之急,但它也并非盡善盡美。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

一個關鍵問題在于:當AI模型過于依賴合成數據時,它們可能會“崩潰”。它們會產生更多“幻覺”,編造看似合理可信但實際上并不存在的信息。而且,AI模型的質量和性能也會飛速下降,甚至無法使用。例如,某個AI模型生成的數據出現了一些拼寫錯誤,利用這些充滿了錯誤的數據訓練其他模型,這些AI模型必定會“以訛傳訛”,導致更大的錯誤。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

此外,合成數據也存在過于簡單化的風險。它可能缺乏真實數據集蘊含的細節和多樣性,這可能導致在其上訓練的AI模型的輸出也過于簡單,缺乏實用性。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

為解決這些問題,國際標準化組織需要著手創建強大的系統,來跟蹤和驗證AI訓練數據。此外,AI系統可以配備元數據追蹤功能,讓用戶或系統能對合成數據進行溯源。人類也需要在AI模型的整個訓練過程中對合成數據進行監督,以確保其高質量且符合道德標準。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

AI的未來在很大程度上取決于數據的質量,合成數據將在克服數據短缺方面發揮越來越重要的作用。對合成數據的使用,人們必須保持謹慎態度,盡量減少錯誤,確保其作為真實數據的可靠補充,從而保障AI系統的準確性和可信度。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿足AI的“胃口”,科技行業正轉向使用合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

澳大利亞“對話”網站在本月稍早時間報道中指出,合成數據具有諸多優勢,但過度依賴合成數據也可能削弱AI的精確性和可靠性。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

合成數據應運而生Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

以往,科技公司主要依賴真實數據來構建、訓練和改進AI模型。真實數據是指由人類創建的文本、視頻和圖像。它們通過調查、實驗、觀察或挖掘網站和社交媒體等途徑被收集而來。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

真實數據因蘊含真實事件以及其場景和背景而極具價值,但其并非盡善盡美。它可能摻雜拼寫錯誤、不一致或無關的內容,甚至潛藏嚴重偏見,導致生成式AI模型在某些情況下創建的圖像僅展示男性或白人形象。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

但真實數據日益匱乏,因為人類生成數據的速度趕不上AI不斷增長的需求。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

美國開放人工智能研究中心聯合創始人伊利亞·蘇茨克維爾在去年12月舉行的機器學習會議上聲稱,AI行業已觸及他所稱的“數據峰值”,AI的訓練數據如同化石燃料一樣面臨著耗盡的危機。此外,有研究預測,到2026年,ChatGPT等大型語言模型的訓練將耗盡互聯網上所有可用文本數據,屆時將沒有新的真實數據可供使用。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

為給AI提供充足的“養分”,一種由算法生成的、模仿真實世界情況的數據——合成數據應運而生。合成數據是在數字世界中創造的,而非從現實世界收集或測量而來。它可以作為真實世界數據的替代品,來訓練、測試、驗證AI模型。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

從理論上來說,合成數據為訓練AI模型提供了一種經濟高效且快捷的解決方案。它有效解決了AI訓練使用真實數據時飽受詬病的隱私問題和道德問題,尤其是涉及個人健康數據等敏感信息時。更重要的是,與真實數據不同,合成數據在理論上可以無限供應。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

研究機構高德納公司估計,2024年AI及分析項目使用的數據中,約60%是合成數據。到2030年,AI模型使用的絕大部分數據將是由AI生成的合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

科技公司來者不拒Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

事實上,微軟、元宇宙平臺公司,以及Anthropic等眾多科技頭部企業和初創企業,已經開始廣泛使用合成數據來訓練其AI模型。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

例如,微軟在1月8日開源的AI模型“Phi-4”,便是合成數據攜手真實數據訓練的;谷歌的“Gemma”模型也采用了類似方法。Anthropic公司也利用部分合成數據,開發出其性能最優異的AI系統之一“Claude 3.5 Sonnet”。蘋果自研AI系統Apple Intelligence,在預訓練階段,也大量使用了合成數據。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

隨著科技公司對合成數據的需求與日俱增,生產合成數據的工具也接踵而至。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

英偉達公司發布的3D仿真數據生成引擎Omniverse Replicator,能夠生成合成數據,用于自動駕駛汽車和機器人訓練。去年6月,英偉達開源了Nemotron-4340b系列模型,開發者可使用該模型生成合成數據,用于訓練大型語言模型,以應用于醫療保健、金融、制造、零售等行業。在醫療、金融等專業領域,該模型能夠根據特定需求生成高質量的合成數據,幫助構建更為精準的行業專屬模型。微軟推出的開源合成數據工具Synthetic Data Showcase則旨在通過生成合成數據和用戶界面,實現隱私保護的數據共享和分析。亞馬遜云科技推出的Amazon SageMaker Ground Truth也能為用戶生成數十萬張自動標記的合成圖像。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

此外,去年12月,元宇宙平臺公司推出開源大模型Llama 3.3,更是大幅降低了生成合成數據的成本。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

過度依賴風險難測Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

盡管合成數據暫時解決了AI訓練的燃眉之急,但它也并非盡善盡美。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

一個關鍵問題在于:當AI模型過于依賴合成數據時,它們可能會“崩潰”。它們會產生更多“幻覺”,編造看似合理可信但實際上并不存在的信息。而且,AI模型的質量和性能也會飛速下降,甚至無法使用。例如,某個AI模型生成的數據出現了一些拼寫錯誤,利用這些充滿了錯誤的數據訓練其他模型,這些AI模型必定會“以訛傳訛”,導致更大的錯誤。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

此外,合成數據也存在過于簡單化的風險。它可能缺乏真實數據集蘊含的細節和多樣性,這可能導致在其上訓練的AI模型的輸出也過于簡單,缺乏實用性。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

為解決這些問題,國際標準化組織需要著手創建強大的系統,來跟蹤和驗證AI訓練數據。此外,AI系統可以配備元數據追蹤功能,讓用戶或系統能對合成數據進行溯源。人類也需要在AI模型的整個訓練過程中對合成數據進行監督,以確保其高質量且符合道德標準。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

AI的未來在很大程度上取決于數據的質量,合成數據將在克服數據短缺方面發揮越來越重要的作用。對合成數據的使用,人們必須保持謹慎態度,盡量減少錯誤,確保其作為真實數據的可靠補充,從而保障AI系統的準確性和可信度。Vjh即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.gxcspki.cn/news-2-217-0.html“喂”給人工智能的真實數據終將耗盡,合成數據能否讓AI模型精確可靠?

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇:仿昆蟲微型機器人飛行長達15分鐘

下一篇:新型光學原子鐘比銫鐘精度高千倍

為你推薦
“五、四、三、二、一,亮燈!”隨著現場倒計時結束,流光溢彩的秦淮花燈在南京秦淮河畔漸次點亮,百余架無人機吊著孔明燈同時升空,向著秦淮河上空飛去。這...
01-23
時尚行業的核心驅動力在于創意,而創意表達往往具有一定模糊性和容忍度。這一特性使得生成式人工智能(AIGC)在時尚領域的應用潛力顯得...
01-24
好消息!遼寧省手機、平板、智能手表(手環)購新補貼實施細則來啦每人每類可補貼1件每件最高補貼不超過500元...
01-21
  新華社北京1月31日電(記者鄒多為)據海關統計,2024年我國東北地區進出口達到1.25萬億元,同比增長1.6%,規...
02-01
  TikTok 禁令執行了十四個小時。當地時間 1 月 19 日下午,TikTok 在美國正式恢復上線。  此前,臨近 TikTok 禁令生效日,為尋找下一個互聯網落腳點,1 月 13 日,語言學習軟...
01-22
1 月 28 日消息,據日經亞洲報道,日本本田汽車公司計劃最早于 2026 年在北美市場推出一款售價低于 3 萬美元(備注:當前約 21.8 萬元人民幣)的小型電動汽車,以加快在純電動...
01-29
2 月 1 日消息,今日有多位博主分享海報,2025 年 2 月 1 日至 2 月 28 日期間支付定金購買蔚來,可享首付 20% 起,5 年 0 息特惠金融方案。還可疊加:10000 元選裝基金20000...
02-01
  1、《掌心》禮宗旭的母親是被他的父親毒打虐待的,禮宗旭因小時候目睹母親的遭遇而留下了童年陰影。  2、曾親眼看到母親被家暴的畫面,禮宗旭也成了心理變態,葉平安后來...
02-15
  1、電視劇《濾鏡》在騰訊視頻播出,這是騰訊視頻跟星蓮影視出品的科幻愛情喜劇。  2、2月24日開始在騰訊全網獨播,檀健次跟李蘭迪領銜主演,講述了由一個可以讓人變幻容貌...
02-17
這里是《21健訊Daily》,歡迎與21世紀經濟報道新健康團隊共同關注醫藥健康行業最新事件!政策動向今年的醫保目錄調整時間將提前1月17日,國家醫...
01-21
21世紀經濟報道記者季媛媛 上海報道 繼2023年出現上市以來首次虧損,科創板首家CRO(醫藥合同研發服務)企業美迪西(688202.SH)2024年的業績繼續...
01-22
2025年1月遼寧省普通高中學業水平合格性考試報名工作已于2024年11月24日結束。為滿足考生需求,結合工作...
01-21
作者:郭天平(重慶工業職業技術學院黨委書記)黨的二十屆三中全會通過的《中共中央關于進一步全面深化改革、...
01-22
  2024年12月30日,中國信托業協會發布《2023—2024中國信托業社會責任報告》(以下簡稱《報告》)...
01-24
  本報記者 劉琪  1月24日,國家金融監督管理總局(以下簡稱“國家金融監管總局”)發布消息,為進...
01-28
獅子座男生通常是陽光、自信和熱情的代表,當他們喜歡上一個人時,會展現出一系列明顯的行...
01-22
天蝎座男生以其神秘、深沉的性格而聞名,他們對感情非常專一,善于保護自己和所愛的人。然...
01-22
領結婚證穿搭男士? 朋友結婚男士穿什么衣服?一、領結婚證穿搭男士? 領證當天男士最好穿白色的襯衫、粉色的衣服、淺藍色的衣服,一來紅底的照片看上去色彩突出明顯;二來這些...
02-17
戶外直播文案? 怎么戶外直播?戶外直播文案?跟隨我們的戶外直播,探索大自然的奇妙之處!無論是遠足、攀巖還是劃船,我們將帶您親身體驗刺激和冒險。與我們的專業導游一起,您將發現隱...
02-17
2月6日消息,天眼查官網資料顯示,近日,辛選集團關聯公司廣州辛選網絡信息科技有限公司因虛假宣傳違法行為,被廣州市白云區市場監督管理局罰款175萬元。圖源:天眼查官網處罰事由顯...
02-07
2月3日消息,上海卓鋼鏈電子商務有限公司近日與河南鋼鐵集團周口鋼鐵有限公司簽署戰略合作協議。卓鋼鏈CFO林子云、周口鋼鐵副總經理鄧杭州代表雙方簽約。圖源:卓鋼鏈公眾號根...
02-07
2月20日消息,美團日前宣布將為全職及穩定兼職騎手繳納社保,預計2025年第二季度起實施。對此,美團核心本地商業CEO王莆中在公司內網發文稱,“履行好社會責任,不必用競爭思維來思考...
02-20
圖片來源:圖蟲創意 乳企仍在經歷原奶下行周期的陣痛。2月1...
02-21
近年來,智能門鎖已然成為智能家居領域的熱門單品。然而,隨著智能鎖技術的快速迭代,老款產品逐漸難以滿足人們日益增長的生活需求。眾多用戶雖有強烈的換新意愿,卻在這一過程中遭...
01-21
在新能源汽車賽道進入淘汰賽之際,一家新銳公司正異軍突起。12月18日消息,醇氫科技宣布完成1.35億美元的Pre-A+輪融資,引入多家戰略投資者,投后估值超1...
02-07
遭遇延期的《刺客信條:影》在近日重新開啟了預購,由于游戲以日本封建時代為背景,并采用了“黑人武士彌助”的設定以及將其作為主角之一,從而引發了不少爭議,尤其是...
01-27
2月8日,幻想冒險RPG游戲《二重螺旋》「狩夜測試」宣布定檔2月20日,據悉,測試將于2月20日10:00開啟,2月28日17:00結束。目前游戲的測試招募仍在進行中,預計2月10日23...
02-10
據央視新聞報道,當地時間2月1日,美國聯邦選舉委員會年底的備案文件顯示,埃隆·馬斯克在2024年美國大選中的花費超過了2.9億美元。馬斯克 資料圖(來源:環球網)文件表明,馬斯克在年末...
02-02
據東方財經報道,2月6日,大S離世后,張蘭首度出鏡在抖音直播帶貨,直播間人氣達到10W+,一個多小時后突然遭到封禁。張蘭直播時的截圖(圖源:個人賬號)直播時,張蘭表示,自己過去三天經歷了...
02-06
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕

主站蜘蛛池模板: 91偷拍精品一区二区三区 | 2019亚洲日韩新视频 | 欧美日本色 | 久久99精品久久久久久秒播放器 | 四虎免看黄 | 欧美一区二区三区在线观看视频 | av三级在线观看 | 成人在线一区二区 | 国产91亚洲精品 | 国产成人精品一区二区三区 | 黄色欧美一级片 | 欧美精品日韩 | 久久免费国产 | 99热少妇| 亚洲一区在线免费观看 | 国产女人免费看a级丨片 | 欧美成人a∨高清免费观看 久久精品在线 | 免费在线看a | 欧美精品一区二区三区一线天视频 | 9999精品| 久久99网 | 日本一区中文字幕 | 日本一区二区三区四区不卡视频 | 在线免费观看黄色av | 国产精品亚洲区 | 国产精品美女久久久久久久久久久 | 在线第一页 | 欧美亚韩| 国产成人免费网站 | 91精品一区二区三区久久久久久 | 欧美一区二区三区在线视频观看 | 久久tv在线观看 | 久久精品国产免费 | 青青久久久 | 欧美成人激情视频 | 日本啪啪网站 | 欧美在线观看一区 | 亚洲一区中文字幕在线观看 | 久草 在线 | 秋霞在线一区 | 黄色一级视屏 |