大語(yǔ)言模型對(duì)著名數(shù)學(xué)問(wèn)題有“新見(jiàn)解”

發(fā)布時(shí)間：2023-12-15 10:23:13來(lái)源：博客園

　　“深度思維”團(tuán)隊(duì)利用大語(yǔ)言模型(LLM)對(duì)一個(gè)著名的數(shù)學(xué)問(wèn)題提出了“新見(jiàn)解”，并通過(guò)系統(tǒng)的、迭代的評(píng)估框架確保其正確。這一研究或可改進(jìn) LLM 用來(lái)解決問(wèn)題和學(xué)習(xí)新知識(shí)的途徑。相關(guān)論文發(fā)表在 14 日的《自然》雜志上。

　　基于人工智能的工具(例如 LLM)有時(shí)受制于“幻覺(jué)”，導(dǎo)致作出看似合理但實(shí)際是錯(cuò)誤的陳述。加入一個(gè)評(píng)估步驟，系統(tǒng)地衡量潛在解決方案的準(zhǔn)確性，使得利用 LLM 應(yīng)對(duì)復(fù)雜問(wèn)題成為可能。這些問(wèn)題一般需要可驗(yàn)證且定義明確，從而使這一工具在數(shù)學(xué)科學(xué)中有潛在價(jià)值。

　　研究團(tuán)隊(duì)此次介紹了一種方法，稱為“FunSearch”。他們將一組產(chǎn)生創(chuàng)造性解決方案的 LLM 和一個(gè)作為檢查者以避免錯(cuò)誤建議的評(píng)估程序結(jié)合起來(lái)。接著，將一個(gè)多次迭代此過(guò)程的演化方法，作為輸入來(lái)引導(dǎo) LLM。結(jié)果表明，這種方法可以得到新的、可驗(yàn)證的正確結(jié)果。他們將“FunSearch”應(yīng)用到了著名的上限集問(wèn)題(數(shù)學(xué)中涉及計(jì)數(shù)和排列領(lǐng)域的一個(gè)中心問(wèn)題)，發(fā)現(xiàn)了超越最著名上限集的大上限集新構(gòu)造。

　　研究人員表示，“FunSearch”的成功關(guān)鍵是它會(huì)尋找那些描述怎樣解決問(wèn)題的程序，而非直接尋找解決辦法。因?yàn)?ldquo;FunSearch”的結(jié)果易于被解釋和驗(yàn)證，這意味著這一方法有望激發(fā)科學(xué)家在該領(lǐng)域的進(jìn)一步思考。

　　數(shù)學(xué)真要成為首個(gè)借助 AI 實(shí)現(xiàn)突破的學(xué)科嗎?一方面，數(shù)學(xué)家越來(lái)越頻繁地使用 AI;另一方面，AI 也很“配合”——既可用于解決編程等應(yīng)用學(xué)科的問(wèn)題，也可用來(lái)攻克包括數(shù)學(xué)在內(nèi)的自然學(xué)科。本文中這項(xiàng)成果，現(xiàn)階段可能還不適合解決大多數(shù)類型的挑戰(zhàn)，但研究團(tuán)隊(duì)提出了未來(lái)改進(jìn)的可能?；蛟S在不久之后，“FunSearch”將可用于破解數(shù)學(xué)界更大范圍、更多種多樣的難題。

千萬(wàn)別走錯(cuò)！廣州電動(dòng)自...

最后一頁(yè)

熱點(diǎn)推薦

成人无码嫩草影院免费-三级黄舔b在线观看视频-日本精品中文一区二区-精产一二三区av成人免费

大語(yǔ)言模型對(duì)著名數(shù)學(xué)問(wèn)題有“新見(jiàn)解”