1. 首頁
  2. 資訊
  3. 技術(shù)
  4. OpenAI發(fā)布最強(qiáng)模型o1:博士物理92.8分,IOI金牌水平

OpenAI發(fā)布最強(qiáng)模型o1:博士物理92.8分,IOI金牌水平

王宇寧

智東西9月13日消息,OpenAI新模型無預(yù)警上新:o1系列,可以進(jìn)行通用復(fù)雜推理,每次回答要花費(fèi)更長時(shí)間思考。

在解決博士水平的物理問題時(shí),GPT-4o還是“不及格”59.5分,o1一躍來到“優(yōu)秀檔”,直接干到92.8分!

沒錯(cuò),傳說中的草莓終于來與大家見面了!

image.png

CEO奧特曼稱它是一種新范式的開始:可以進(jìn)行通用復(fù)雜推理的人工智能。從今天開始,o1-preview在ChatGPT中會(huì)向所有Plus和Team用戶推出,并且在API中向tier 5開發(fā)者推出。

同時(shí),OpenAI還發(fā)布了o1-mini——一種經(jīng)濟(jì)高效的推理模型,非常擅長STEM,尤其是數(shù)學(xué)和編碼。

image.png

具體來說,o1系列是OpenAI首個(gè)經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的模型,在輸出回答之前,會(huì)在產(chǎn)生一個(gè)很長的思維鏈,以此增強(qiáng)模型的能力。

換句話說,內(nèi)部思維鏈越長,o1思考得越久,模型在推理任務(wù)上的表現(xiàn)就越好。

o1有多強(qiáng)呢?CEO奧特曼直給了答案:在剛剛結(jié)束的2024 IOI信息學(xué)奧賽題目中,o1的微調(diào)版本在每題嘗試50次條件下取得了213分,屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次,就能獲得362.14分,高于金牌選手門檻,可獲得金牌。另外它還在競爭性編程問題 (Codeforces) 中排名前89%,在美國數(shù)學(xué)奧林匹克 (AIME) 預(yù)選賽題目中躋身美國前500名學(xué)生之列。

來源:第一電動(dòng)網(wǎng)

作者:王宇寧

本文地址:http://autopag.com/news/jishu/245976

返回第一電動(dòng)網(wǎng)首頁 >

收藏
110
  • 分享到:
發(fā)表評論
新聞推薦
熱文榜
日排行
周排行
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!
-->