GPT5 來了

來源: 2025-08-07 13:50:00 [博客] [舊帖] [給我悄悄話] 本文已被閱讀:

經濟價值型任務表現

在 OpenAI 內部一個評估基準上,GPT5 同樣表現卓越,該測試專門評估模型在複雜、經濟價值知識型工作上的表現。在啟用推理功能時,GPT?5 在大約半數案例中的表現達到或超越人類專家水平,同時在法律、物流、銷售、工程等 40 多個職業領域的綜合任務表現上全麵優於 o3 模型和 ChatGPT Agent。