亚洲色欲色欲www,亚洲欧洲日韩综合久久

初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

2025-04-16 15:51:20 小編：鑫昌軟件園

本站 4 月 16 日消息，科技媒體 bleepingcomputer 昨日（4 月 15 日）發(fā)布博文，報(bào)道稱 OpenAI 最新發(fā)布的 GPT-4.1 系列模型，其性能相比 GPT-4o 雖然實(shí)現(xiàn)重大飛躍，但多項(xiàng)跑分未能超越谷歌的 Gemini 系列。

本站昨日報(bào)道，OpenAI 公司發(fā)布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，官方公布的跑分?jǐn)?shù)據(jù)來看，這些模型在編程方面的能力，遠(yuǎn)超 GPT-4o 及 GPT-4o mini。

例如在 SWE-bench Verified 跑分中，GPT-4o 的得分為 21.4%，GPT-4.5 的得分為 26.6%，而 GPT-4.1 的得分為 54.6%。

盡管性能有較大提升，不過根據(jù)多位專家測試，相比較谷歌的 Gemini 系列，GPT-4.1 對比中卻顯露劣勢。

根據(jù) Stagehand（一款生產(chǎn)級瀏覽器自動(dòng)化框架）發(fā)布的基準(zhǔn)數(shù)據(jù)，Gemini 2.0 Flash 的錯(cuò)誤率僅為 6.67%，精確匹配率高達(dá) 90%，且價(jià)格低廉、速度更快。相比之下，GPT-4.1 的錯(cuò)誤率高達(dá) 16.67%，成本更是 Gemini 2.0 Flash 的 10 倍以上。