AI競賽進入產業化關鍵轉折
OpenAI響起戰時狀態的「紅色警報」,在12月將其最新模型GPT-5.2推至台前,這場匆忙的發布遠不止是一次版本更新!它清晰地標誌着全球生成式人工智能(GenAI)的競爭主軸,已從純粹追求參數規模與驚人演示,轉向一個更為務實、也更難攻克的核心戰場:可靠性、推理精度與商業就緒度。當谷歌Gemini等競爭對手在長上下文,多模態等特定維度成壓制時,OpenAI 選擇了一條不同的防禦路徑,把 GP GPT-5.2的技術指標揭示了這一戰略意圖,其最受耀目的提升並非某项炫目的新功能,而是在GDPval基準測試中,將複雜推理得分從上一代的38.8%大幅提升至70.9%。這意味看在涵盖金融、法律、科研等44個專業領域的知識任務中,其綜合表現已可媲美人類專家水準。 ...
