OpenAI 最強(qiáng)推理模型、能夠“思考”圖片,o3 和 o4-mini 正式發(fā)布
2025-04-17 11:53:03 小編:鑫昌軟件園
感謝本站網(wǎng)友 GreatMOLA、耐小心 的線索投遞!
本站 4 月 17 日消息,在今日凌晨的直播中,OpenAI 正式發(fā)布了o3 和 o4-mini 模型。本站匯總內(nèi)容如下:
OpenAI 官方介紹稱,這是其在 o 系列模型中最新訓(xùn)練的成果,可以在回答前進(jìn)行更長(zhǎng)時(shí)間的思考,也宣稱是“迄今為止 OpenAI發(fā)布的最智能的模型”,代表了 ChatGPT 能力的一次重大飛躍,從好奇的用戶到高級(jí)研究人員都將因此受益。
首次,新的推理模型可以智能地使用和結(jié)合 ChatGPT 中的每一個(gè)工具 —— 包括搜索網(wǎng)絡(luò)、使用 Python 分析上傳的文件和其他數(shù)據(jù)、深入推理視覺輸入,甚至生成圖像。
關(guān)鍵的是,這些模型被訓(xùn)練來推理何時(shí)以及如何使用工具來產(chǎn)生詳細(xì)和深思熟慮的答案,通常在不到一分鐘內(nèi),以解決更復(fù)雜的問題。這使得它們能夠更有效地處理多方面的問題,朝著更智能、能夠獨(dú)立執(zhí)行任務(wù)的 ChatGPT 邁進(jìn)。
性能表現(xiàn)
o3 是 OpenAI最強(qiáng)大的推理模型,它在編碼、數(shù)學(xué)、科學(xué)、視覺感知等領(lǐng)域號(hào)稱處于前沿,在包括 Codeforces、SWE-bench 和 MMMU 在內(nèi)的基準(zhǔn)測(cè)試中實(shí)現(xiàn)了新的 SOTA。
OpenAI 稱,o3 非常適合需要多方面分析和答案可能不明顯的高級(jí)查詢。它在分析圖像、圖表和圖形等視覺任務(wù)上表現(xiàn)尤為出色。在外部專家的評(píng)估中,o3 在困難、現(xiàn)實(shí)世界的任務(wù)上比 OpenAI o1 少犯 20% 的重大錯(cuò)誤 —— 特別是在編程、商業(yè) / 咨詢和創(chuàng)意構(gòu)思等領(lǐng)域表現(xiàn)出色。
早期測(cè)試者強(qiáng)調(diào)了其作為思維伙伴的分析嚴(yán)謹(jǐn)性,并強(qiáng)調(diào)了其生成和批判性地評(píng)估新穎假設(shè)的能力 —— 特別是在生物學(xué)、數(shù)學(xué)和工程背景下。
OpenAI o4-mini 是一個(gè)針對(duì)快速、成本效益推理進(jìn)行優(yōu)化的較小模型 —— 它在其大小和成本方面取得了“令人矚目的性能”,尤其是在數(shù)學(xué)、編碼和視覺任務(wù)上。在 AIME 2025 上,當(dāng)提供 Python 解釋器時(shí),o4-mini 得分 99.5%。在專家評(píng)估中,它還在非 STEM 任務(wù)以及數(shù)據(jù)科學(xué)等領(lǐng)域相比前輩 o3-mini 表現(xiàn)更出色。得益于其效率,o4-mini 支持比 o3 高得多的使用限制,使其成為推理受益問題的強(qiáng)大高容量、高吞吐量選項(xiàng)。
與 OpenAI 的前幾代推理模型相比,這兩個(gè)模型也支持更加自然的對(duì)話,尤其是在它們參考記憶和過去的對(duì)話來使響應(yīng)更加個(gè)性化和相關(guān)時(shí)。
能夠推理圖片
在整個(gè) OpenAI o3 的開發(fā)過程中,OpenAI 發(fā)現(xiàn)大規(guī)模強(qiáng)化學(xué)習(xí)表現(xiàn)出與 GPT 系列預(yù)訓(xùn)練中觀察到的相同的“更多計(jì)算能力 = 更好性能”趨勢(shì)。通過重走擴(kuò)展路徑,OpenAI 在訓(xùn)練計(jì)算和推理時(shí)間上又推進(jìn)了一個(gè)數(shù)量級(jí),但仍然看到了明顯的性能提升,這驗(yàn)證了隨著模型被允許進(jìn)行更多思考,其性能仍在持續(xù)提升。與 OpenAI o1 相比,在相同的延遲和成本下,o3 在 ChatGPT 中提供了更高的性能 —— 如果我們讓它思考更長(zhǎng)的時(shí)間,其性能會(huì)持續(xù)攀升。
從下面這個(gè)實(shí)例可以看到,這些模型可以直接將圖像整合到它們的思維鏈中。它們不僅僅是看圖像 —— 而是用圖像思考。這解鎖了一種新的問題解決類別,融合了視覺和文本推理。
人們可以上傳白板照片、教科書圖表或手繪草圖,即使圖像模糊、顛倒或質(zhì)量很低,模型也可以解讀它們。通過使用工具,模型甚至可以實(shí)時(shí)操作圖像 —— 旋轉(zhuǎn)、縮放或?qū)⑵渥鳛橥评磉^程的一部分進(jìn)行變換。
OpenAI o3 和 o4-mini 可以完全訪問 ChatGPT 中的工具,以及通過 API 中的函數(shù)調(diào)用使用開發(fā)者自己的自定義工具。OpenAI 稱,這些模型經(jīng)過訓(xùn)練,能夠推理如何解決問題,選擇何時(shí)以及如何使用工具,以快速生成詳細(xì)且深思熟慮的答案,通常在不到一分鐘內(nèi)完成。
例如,用戶可能會(huì)問:“加利福尼亞的夏季能源使用量與去年相比如何?”該模型可以搜索公共事業(yè)數(shù)據(jù),編寫 Python 代碼進(jìn)行預(yù)測(cè),生成圖表或圖像,并解釋預(yù)測(cè)背后的關(guān)鍵因素,通過多個(gè)工具調(diào)用串聯(lián)起來。推理能力使模型能夠根據(jù)遇到的信息做出反應(yīng)和調(diào)整。例如,它們可以在搜索提供商的幫助下多次搜索網(wǎng)絡(luò),查看結(jié)果,并在需要更多信息時(shí)嘗試新的搜索。
成本
從成本來看,OpenAI 號(hào)稱 o3 和 o4-mini 是其發(fā)布過的最智能的模型,它們通常也比 o1 和 o3-mini 更高效。例如,在 2025 AIME 數(shù)學(xué)競(jìng)賽中,o3 的性價(jià)比優(yōu)于 o1;同樣,o4-mini 也優(yōu)于 o3-mini。
安全性
安全性方面,OpenAI o3 和 o4-mini 完全重建了安全訓(xùn)練數(shù)據(jù),在生物威脅(生物風(fēng)險(xiǎn))、惡意軟件生成和越獄等領(lǐng)域添加了新的拒絕提示。這些更新的數(shù)據(jù)使 o3 和 o4-mini 在其內(nèi)部拒絕基準(zhǔn)測(cè)試中取得了優(yōu)異的成績(jī)(例如,指令層次結(jié)構(gòu)、越獄)。
除了在模型拒絕方面表現(xiàn)出色外,OpenAI還開發(fā)了系統(tǒng)級(jí)緩解措施,以標(biāo)記前沿風(fēng)險(xiǎn)領(lǐng)域的危險(xiǎn)提示。類似于在圖像生成方面的早期工作,OpenAI訓(xùn)練了一個(gè)推理 LLM 監(jiān)控器,該監(jiān)控器從人類編寫的可解釋安全規(guī)范中工作。當(dāng)應(yīng)用于生物風(fēng)險(xiǎn)時(shí),該監(jiān)控器成功標(biāo)記了約 99% 的對(duì)話。
怎么使用
ChatGPT Plus、Pro 和 Team 用戶將從今天開始可以在模型選擇器中看到 o3、o4-mini 和 o4-mini-high,取代 o1、o3-mini 和 o3-mini-high。ChatGPT Enterprise 和 Edu 用戶將在一周后獲得訪問權(quán)限。免費(fèi)用戶可以在提交查詢前選擇“思考”來嘗試 o4-mini。所有計(jì)劃中的速率限制與之前的一組模型保持不變。
OpenAI 預(yù)計(jì)將在幾周內(nèi)發(fā)布 OpenAI o3-pro,并支持全部工具。目前,Pro 用戶仍然可以訪問 o1-pro。
今天更新的內(nèi)容反映了 OpenAI 模型的發(fā)展方向 —— 將 o 系列的專業(yè)推理能力與 GPT 系列的自然對(duì)話能力和工具使用能力相結(jié)合。
- 猜你喜歡
-
山海鏡花0.1折官方正版304.95MB手游下載
-
女媧捏人3手游51.89MB手游下載
-
漢賽爾和格萊特漢化版50.7MB手游下載
-
特技摩托前線官方正版88.39MB手游下載
-
城堡攻擊2雙人對(duì)戰(zhàn)官方正版91.94MB手游下載
-
巨型噴氣式飛行模擬器漢化版88.22MB手游下載
-
全球航空飛行2025全飛機(jī)解鎖版1.3GB手游下載
-
誅神世界火影跑酷0.05折版475.81MB手游下載
-
全民泡泡超人手游官方版1.8GB手游下載
- 相關(guān)手機(jī)游戲
-
SD高達(dá)G世代永恒國(guó)際版670.13MB手游下載
-
封神開天官方正版681.63MB手游下載
-
托法斯賽車無限金幣版799.7MB手游下載
-
沙盒與副本英勇之地官方正版10.57MB手游下載
-
亞刻奧特曼變身器模擬器最新版1.19GB手游下載
-
超級(jí)房車賽傳奇豪華版1.2GB手游下載
-
塞爾達(dá)傳說時(shí)之笛手機(jī)版153.4MB手游下載
-
大航海威加九游渠道服50.35MB手游下載
-
同城游五十K手機(jī)版139.23MB手游下載
- 推薦鑫昌秘籍
- OpenAI 最強(qiáng)推理模型、能夠“思考”圖片,o3 和 o4-mini 正式發(fā)布
- 消息稱 OpenAI 考慮以 30 億美元收購人工智能編程工具 Windsurf
- 消息稱育碧正開發(fā)全新“大逃殺”游戲,高度借鑒《Apex 英雄》
- Figma 要求 AI 初創(chuàng)公司停止使用“Dev Mode”一詞:自家商標(biāo)不容侵犯
- 斯賓塞:對(duì)今年 Xbox 平臺(tái)的第一方游戲陣容感到滿意
- 更短小 PCB,技嘉部分 RTX 5060 系列顯卡采用 ×8 長(zhǎng)度 PCIe 金手指
- 谷歌為安卓推新安全功能:手機(jī)連續(xù)鎖定三天將自動(dòng)重啟
- OpenAI ChatGPT 上線圖庫功能,更輕松管理 AI 生成圖片
- OpenAI 收購 Context.ai 團(tuán)隊(duì),AI 評(píng)估能力再升級(jí)
- 谷歌 Veo 2 視頻生成模型入駐 Gemini,用戶可創(chuàng)建 8 秒 720p 視頻
- 最新手機(jī)精選
-
櫻桃視頻直播官方版下載2025-01-28手游下載 | 88.51MB
-
TFS飛行模擬器破解版2025-02-14手游下載 | 86.66MB
-
Poppy Playtime第五章正版2025-01-15手游下載 | 603MB
-
花心直播軟件在哪里下載安卓版最新版2025-03-15手游下載 | 85.77MB
-
月夜直播免費(fèi)版下載觀看下載官方版2025-02-09手游下載 | 55.74MB
-
挺好tvbox電視版2025-02-13手游下載 | 39.09MB