天久久亚洲黄色,91av剧情免费在线看片

人工智能最新研究：一種大語言模型加上評價框架帶來新數(shù)學發(fā)現(xiàn)

孫自法發(fā)布時間：2023-12-15 17:13:00來源：中國新聞網(wǎng)

　　中新網(wǎng)北京12月15日電 (記者孫自法)國際著名學術期刊《自然》最新發(fā)表一篇人工智能研究論文稱，研究人員報告了一種方法，他們利用一個大語言模型(LLM)對一個著名的數(shù)學問題作出了新發(fā)現(xiàn)，并通過系統(tǒng)的、迭代的評估框架確保正確。這一方法或可改進LLM用來解決問題和學習新知識的途徑。

　　該論文介紹，基于人工智能的工具(例如LLM)有望加速科學發(fā)現(xiàn)，解決長久存在的問題，但它們有時受制于“幻覺”，導致作出看似合理但錯誤的陳述。加入一個評估步驟，系統(tǒng)地衡量潛在解決方案的準確性，使得靠LLM幫助應對復雜問題成為可能。這些問題一般需要可驗證且定義明確，使這一工具在數(shù)學科學中有潛在價值。

　　論文第一作者和通訊作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi與同事及合作者一起提出一種方法，稱為FunSearch(因為它搜索函數(shù)空間)，將一組產(chǎn)生創(chuàng)造性解決方案的LLM和一個作為檢查者以避免錯誤建議的評估程序結合起來。一個多次迭代此過程的演化方法，通過提供此前最佳解決辦法作為輸入來引導LLM，結果表明這種方法可以收斂到新的、可驗證的正確結果。他們將FunSearch應用到了著名的上限集問題(cap set problem，數(shù)學中涉及計數(shù)和排列領域的一個中心問題)，發(fā)現(xiàn)了超越最著名上限集的大上限集新構造。

　　論文作者認為，F(xiàn)unSearch的成功關鍵是它會尋找描述如何解決一個問題的程序，而非尋找解決辦法。因為FunSearch的結果是程序，結果易于人類解釋和驗證，這意味著該方法有望激發(fā)該領域的進一步思考。

　　他們補充指出，目前，這個方法可能還不適合所有類型的挑戰(zhàn)，但通過未來改進或可使FunSearch應用于更大范圍的問題。(完)

（責編：王東）

黄网站免费人口观看,亚洲天堂国产,日本在线视频精品,a黄视频,黄色福利午夜视频,亚洲免费综合色在线视频,嫩草视频一区二区三区在线观看

人工智能最新研究：一種大語言模型加上評價框架帶來新數(shù)學發(fā)現(xiàn)

相關閱讀

專題推薦

微觀

賞閱

資料云

即時新聞