OpenAI發布新AI模型,代號草莓,一步步解決難題

OpenAI發布新AI模型,代號草莓,一步步解決難題


開放人工智慧 去年推出 GPT-4 時,人工智慧領域取得了最後一次重大突破,將模型規模擴大到令人眼花撩亂的比例。該公司今天宣布了一項新的進展,標誌著方法的轉變——一種可以邏輯地「推理」許多困難問題的模型,並且比現有的人工智慧更聰明,而無需大規模擴展。

這個被稱為 OpenAI-o1 的新模型可以解決困擾現有 AI 模型的問題,包括 OpenAI 最強大的現有模型 GPT-4o。它不像大型語言模型通常那樣一步步得出答案,而是透過問題進行推理,像人一樣有效地大聲思考,然後得出正確的結果。

「這就是我們認為這些模式的新範式,」OpenAI 首席技術長 Mira Murati 告訴《連線》雜誌。 “它更擅長處理非常複雜的推理任務。”

該公司表示,新模型在 OpenAI 中的代號為 Strawberry,它不是 GPT-4o 的繼承者,而是對其的補充。

Murati 表示,OpenAI 目前正在建造其下一個主模型 GPT-5,該模型將比其前身大得多。不過,儘管該公司仍然相信規模將有助於從人工智慧中榨取新的能力,但 GPT-5 很可能還包括今天推出的推理技術。 「有兩種範式,」穆拉蒂說。 「擴展範式和這個新範式。我們希望能夠將他們聚集在一起。

法學碩士通常會從輸入大量訓練資料的龐大神經網路中得出答案。他們可以表現出卓越的語言和邏輯能力,但傳統上卻難以解決令人驚訝的簡單問題,例如涉及推理的基本數學問題。

Murati 表示,OpenAI-o1 使用強化學習,包括在模型得到正確答案時給予正面回饋,在沒有正確答案時給予負面回饋,以改善其推理過程。 「該模型提高了思維能力,並微調了用於得出答案的策略,」她說。強化學習使電腦能夠以超人的技能玩遊戲並完成設計電腦晶片等有用的任務。該技術也是將法學碩士轉變為有用且表現良好的聊天機器人的關鍵要素。

OpenAI 研究副總裁 Mark Chen 向 WIRED 展示了新模型,並用它解決了先前模型 GPT-4o 無法解決的幾個問題。其中包括一個高級化學問題和以下令人費解的數學難題:「當公主的年齡是王子當前年齡總和的一半時,公主的年齡是王子的兩倍,公主的年齡與王子的年齡一樣大。王子和公主的年齡是多少歲? (正確答案是王子30歲,公主40歲)。

「這 [new] 陳說,模型正在學習獨立思考,而不是像傳統的法學碩士那樣試圖模仿人類的思考方式。

OpenAI 表示,其新模型在許多問題集上的表現明顯更好,包括專注於編碼、數學、物理、生物和化學的問題集。據該公司稱,在針對數學學生的美國數學邀請賽 (AIME) 測試中,GPT-4o 平均解決了 12% 的問題,而 o1 的正確率達到 83%。



Source link

More From Author

戰爭機器人正在為派系競賽活動做準備

戰爭機器人正在為派系競賽活動做準備

波蘭發現2300年前的凱爾特頭盔

波蘭發現2300年前的凱爾特頭盔

Leave a Reply

Your email address will not be published. Required fields are marked *

Recent Comments

No comments to show.

Categories