技術(shù) Open AI

OpenAI發(fā)布最強(qiáng)模型o1：博士物理92.8分，IOI金牌水平

王宇寧 2024-09-13 10:48

智東西9月13日消息，OpenAI新模型無預(yù)警上新：o1系列，可以進(jìn)行通用復(fù)雜推理，每次回答要花費(fèi)更長時(shí)間思考。

在解決博士水平的物理問題時(shí)，GPT-4o還是“不及格”59.5分，o1一躍來到“優(yōu)秀檔”，直接干到92.8分！

沒錯(cuò)，傳說中的草莓終于來與大家見面了！

CEO奧特曼稱它是一種新范式的開始：可以進(jìn)行通用復(fù)雜推理的人工智能。從今天開始，o1-preview在ChatGPT中會(huì)向所有Plus和Team用戶推出，并且在API中向tier 5開發(fā)者推出。

同時(shí)，OpenAI還發(fā)布了o1-mini——一種經(jīng)濟(jì)高效的推理模型，非常擅長STEM，尤其是數(shù)學(xué)和編碼。

具體來說，o1系列是OpenAI首個(gè)經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的模型，在輸出回答之前，會(huì)在產(chǎn)生一個(gè)很長的思維鏈，以此增強(qiáng)模型的能力。

換句話說，內(nèi)部思維鏈越長，o1思考得越久，模型在推理任務(wù)上的表現(xiàn)就越好。

o1有多強(qiáng)呢？CEO奧特曼直給了答案：在剛剛結(jié)束的2024 IOI信息學(xué)奧賽題目中，o1的微調(diào)版本在每題嘗試50次條件下取得了213分，屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次，就能獲得362.14分，高于金牌選手門檻，可獲得金牌。另外它還在競爭性編程問題 (Codeforces) 中排名前89%，在美國數(shù)學(xué)奧林匹克 (AIME) 預(yù)選賽題目中躋身美國前500名學(xué)生之列。

來源：第一電動(dòng)網(wǎng)

作者：王宇寧

本文地址：http://autopag.com/news/jishu/245976

返回第一電動(dòng)網(wǎng)首頁 >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請聯(lián)系admin#d1ev.com（#替換成@）刪除。