人工智能最新研究:一種大語言模型加上評(píng)價(jià)框架帶來新數(shù)學(xué)發(fā)現(xiàn)
中新網(wǎng)北京12月15日電 (記者 孫自法)國際著名學(xué)術(shù)期刊《自然》最新發(fā)表一篇人工智能研究論文稱,研究人員報(bào)告了一種方法,他們利用一個(gè)大語言模型(LLM)對(duì)一個(gè)著名的數(shù)學(xué)問題作出了新發(fā)現(xiàn),并通過系統(tǒng)的、迭代的評(píng)估框架確保正確。這一方法或可改進(jìn)LLM用來解決問題和學(xué)習(xí)新知識(shí)的途徑。
該論文介紹,基于人工智能的工具(例如LLM)有望加速科學(xué)發(fā)現(xiàn),解決長久存在的問題,但它們有時(shí)受制于“幻覺”,導(dǎo)致作出看似合理但錯(cuò)誤的陳述。加入一個(gè)評(píng)估步驟,系統(tǒng)地衡量潛在解決方案的準(zhǔn)確性,使得靠LLM幫助應(yīng)對(duì)復(fù)雜問題成為可能。這些問題一般需要可驗(yàn)證且定義明確,使這一工具在數(shù)學(xué)科學(xué)中有潛在價(jià)值。
論文第一作者和通訊作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi與同事及合作者一起提出一種方法,稱為FunSearch(因?yàn)樗阉骱瘮?shù)空間),將一組產(chǎn)生創(chuàng)造性解決方案的LLM和一個(gè)作為檢查者以避免錯(cuò)誤建議的評(píng)估程序結(jié)合起來。一個(gè)多次迭代此過程的演化方法,通過提供此前最佳解決辦法作為輸入來引導(dǎo)LLM,結(jié)果表明這種方法可以收斂到新的、可驗(yàn)證的正確結(jié)果。他們將FunSearch應(yīng)用到了著名的上限集問題(cap set problem,數(shù)學(xué)中涉及計(jì)數(shù)和排列領(lǐng)域的一個(gè)中心問題),發(fā)現(xiàn)了超越最著名上限集的大上限集新構(gòu)造。
論文作者認(rèn)為,F(xiàn)unSearch的成功關(guān)鍵是它會(huì)尋找描述如何解決一個(gè)問題的程序,而非尋找解決辦法。因?yàn)镕unSearch的結(jié)果是程序,結(jié)果易于人類解釋和驗(yàn)證,這意味著該方法有望激發(fā)該領(lǐng)域的進(jìn)一步思考。
他們補(bǔ)充指出,目前,這個(gè)方法可能還不適合所有類型的挑戰(zhàn),但通過未來改進(jìn)或可使FunSearch應(yīng)用于更大范圍的問題。(完)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 就醫(yī)逃單現(xiàn)象究竟是否普遍?該如何解決?
- 中國醫(yī)學(xué)團(tuán)隊(duì)國際首次繪制肝癌轉(zhuǎn)移的時(shí)空多組學(xué)演化圖譜
- 國家統(tǒng)計(jì)局:11月份規(guī)模以上工業(yè)主要能源產(chǎn)品生產(chǎn)繼續(xù)保持同比增長
- 國際最新研究:土衛(wèi)二氣體羽流中發(fā)現(xiàn)甲醇、乙烷和氧等更多有機(jī)分子
- 國家統(tǒng)計(jì)局:全年發(fā)展主要預(yù)期目標(biāo)有望較好完成
- 困住東方甄選的“小作文” 也是直播行業(yè)的內(nèi)在困境
- 人民日?qǐng)?bào) | 山東泰安高新區(qū)建設(shè)新聞出版產(chǎn)業(yè)項(xiàng)目
- 山東公布首批生產(chǎn)性服務(wù)業(yè)領(lǐng)軍企業(yè)名單
- 山東省委召開黨員領(lǐng)導(dǎo)干部會(huì)議 傳達(dá)學(xué)習(xí)中央經(jīng)濟(jì)工作會(huì)議精神
- 人民日?qǐng)?bào)點(diǎn)贊山東臨沂:黨建引領(lǐng) 社區(qū)善治