2024年春的一天,美國斯坦福大學病理學家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅動的“虛擬科學家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經科學家到藥物化學家,在幾分鐘內展開多輪討論,最終生成了一份長達一萬多字的會議紀要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團隊”,模擬真實研究協(xié)作過程,幫助科學家節(jié)省時間、完善假設,甚至激發(fā)新的科學靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學家”。
多家機構打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學家”的軟件。該軟件由6個AI代理組成,分別負責想法生成、反思或批評、概念演進、去重、排序和總結審稿,均由谷歌的Gemini 2.0模型驅動。這套系統(tǒng)是谷歌生物醫(yī)學AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內就解決了困擾科學家十多年的科學謎題。
美國斯坦福大學也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本。科技媒體Freethink網站報道稱,目前,該系統(tǒng)以OpenAI的GPT-4o為基礎,默認配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設定他們的專業(yè)領域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團隊也在開發(fā)虛擬科學家系統(tǒng),名為“VirSci”,專注于模擬科學家團隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點,它們還具備聯(lián)網檢索信息、執(zhí)行代碼、調用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術語目前尚不嚴格,但一般指LLM在一定程度上能自主承擔任務。美國阿貢國家實驗室的計算機科學家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數小時專注于解決復雜科學問題,不會走神,也不會疲憊。
AI科研團隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構的信息。但芝加哥大學計算機科學家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內容,提升整體可靠性。他還認為,即便是“幻覺”,在頭腦風暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學團隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學測試中的表現(xiàn)會提高幾個百分點,在實際科研應用中的回答也更加精準,例如在放射治療方案設計方面更具邏輯。
谷歌也曾對其聯(lián)合科學家系統(tǒng)展開評估,結果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認為其更具新意和科研潛力。
關于多少名AI代理、幾輪互動最為有效,科學界也正在尋找答案。上海人工智能實驗室計算機科學家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設置下。而斯坦福大學的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點子到底有多新
谷歌在宣布其聯(lián)合科學家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預測”。例如,斯坦福大學的加里·佩爾茨用谷歌的“AI聯(lián)合科學家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學家則認為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學院微生物學家何塞·佩納德斯團隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻后,提出了一種未見于任何文獻的新假設:移動遺傳元件可“跨細胞偷取”噬菌體尾部。這一觀點挑戰(zhàn)主流,卻與該團隊通過未公開實驗得出的結論一致。佩納德斯認為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學進步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結資料、激發(fā)靈感、提出新角度或查漏補缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認為,AI聯(lián)合科學家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學習能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
2024年春的一天,美國斯坦福大學病理學家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅動的“虛擬科學家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經科學家到藥物化學家,在幾分鐘內展開多輪討論,最終生成了一份長達一萬多字的會議紀要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團隊”,模擬真實研究協(xié)作過程,幫助科學家節(jié)省時間、完善假設,甚至激發(fā)新的科學靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學家”。
多家機構打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學家”的軟件。該軟件由6個AI代理組成,分別負責想法生成、反思或批評、概念演進、去重、排序和總結審稿,均由谷歌的Gemini 2.0模型驅動。這套系統(tǒng)是谷歌生物醫(yī)學AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內就解決了困擾科學家十多年的科學謎題。
美國斯坦福大學也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本。科技媒體Freethink網站報道稱,目前,該系統(tǒng)以OpenAI的GPT-4o為基礎,默認配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設定他們的專業(yè)領域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團隊也在開發(fā)虛擬科學家系統(tǒng),名為“VirSci”,專注于模擬科學家團隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點,它們還具備聯(lián)網檢索信息、執(zhí)行代碼、調用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術語目前尚不嚴格,但一般指LLM在一定程度上能自主承擔任務。美國阿貢國家實驗室的計算機科學家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數小時專注于解決復雜科學問題,不會走神,也不會疲憊。
AI科研團隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構的信息。但芝加哥大學計算機科學家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內容,提升整體可靠性。他還認為,即便是“幻覺”,在頭腦風暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學團隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學測試中的表現(xiàn)會提高幾個百分點,在實際科研應用中的回答也更加精準,例如在放射治療方案設計方面更具邏輯。
谷歌也曾對其聯(lián)合科學家系統(tǒng)展開評估,結果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認為其更具新意和科研潛力。
關于多少名AI代理、幾輪互動最為有效,科學界也正在尋找答案。上海人工智能實驗室計算機科學家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設置下。而斯坦福大學的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點子到底有多新
谷歌在宣布其聯(lián)合科學家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預測”。例如,斯坦福大學的加里·佩爾茨用谷歌的“AI聯(lián)合科學家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學家則認為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學院微生物學家何塞·佩納德斯團隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻后,提出了一種未見于任何文獻的新假設:移動遺傳元件可“跨細胞偷取”噬菌體尾部。這一觀點挑戰(zhàn)主流,卻與該團隊通過未公開實驗得出的結論一致。佩納德斯認為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學進步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結資料、激發(fā)靈感、提出新角度或查漏補缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認為,AI聯(lián)合科學家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學習能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
本文鏈接:http://www.gxcspki.cn/news-2-2871-0.htmlAI“聯(lián)合科學家”重塑科研協(xié)作方式
聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕