智東西9月13日消息,OpenAI新模型無預(yù)警上新:o1系列,可以進(jìn)行通用復(fù)雜推理,每次回答要花費(fèi)更長時(shí)間思考。
在解決博士水平的物理問題時(shí),GPT-4o還是“不及格”59.5分,o1一躍來到“優(yōu)秀檔”,直接干到92.8分!
沒錯(cuò),傳說中的草莓終于來與大家見面了!
CEO奧特曼稱它是一種新范式的開始:可以進(jìn)行通用復(fù)雜推理的人工智能。從今天開始,o1-preview在ChatGPT中會(huì)向所有Plus和Team用戶推出,并且在API中向tier 5開發(fā)者推出。
同時(shí),OpenAI還發(fā)布了o1-mini——一種經(jīng)濟(jì)高效的推理模型,非常擅長STEM,尤其是數(shù)學(xué)和編碼。
具體來說,o1系列是OpenAI首個(gè)經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的模型,在輸出回答之前,會(huì)在產(chǎn)生一個(gè)很長的思維鏈,以此增強(qiáng)模型的能力。
換句話說,內(nèi)部思維鏈越長,o1思考得越久,模型在推理任務(wù)上的表現(xiàn)就越好。
o1有多強(qiáng)呢?CEO奧特曼直給了答案:在剛剛結(jié)束的2024 IOI信息學(xué)奧賽題目中,o1的微調(diào)版本在每題嘗試50次條件下取得了213分,屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次,就能獲得362.14分,高于金牌選手門檻,可獲得金牌。另外它還在競爭性編程問題 (Codeforces) 中排名前89%,在美國數(shù)學(xué)奧林匹克 (AIME) 預(yù)選賽題目中躋身美國前500名學(xué)生之列。
來源:第一電動(dòng)網(wǎng)
作者:王宇寧
本文地址:http://autopag.com/news/jishu/245976
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。