行有餘力則以學文: GPT‑5 發布爭議總結：技術、定位與使用者感受的落差

2025年8月11日星期一

摘要重點：

發布反應分裂：GPT‑5 上線後在社群（Twitter、Reddit）大量被批評「令人失望」、「不如預期」，但也有人認為這次升級在某些面向是優秀的。
主要問題之一：model selector（自動路由器）當天失效，導致多數使用者實際接觸到的並非最強或最合適的 GPT‑5 模型，讓體驗顯得「變笨」或不一致。
人格與互動風格的改變：GPT‑5 相對較少「配合性」與「暖心個性」，回應較短、較務實，失去過去某些版本（如 GPT‑4 系列）更友善、支持性的聊天風格，許多使用者因此懷念舊版。
定位轉變：OpenAI 正從研究團隊逐步轉向以產品與大眾用戶為優先，目標是大量每日活躍使用者（DAU）與成本效率，這會影響模型設計與調教方向。
基準測試與比較：社群質疑官方發表的圖表與排名（數據顯示錯置或不合理）。在多個公開 benchmark（如 SimpleBench、ARC AGI）中，Google 的 Gemini、Grok 等競品在推理、常識題上表現優異，GPT‑5 並未全面領先。
市場信心變化：例如在 PolyMarket 等平台上，GPT‑5 發布後投票或賭盤出現對 OpenAI 支持度下滑（報告指出降到約 14% 的數值），顯示外界預期受挫。
宣傳與期待管理失誤：過度炒作（例如 Sam Altman 的「Death Star」類比）使得社群對能力的期待過高，實際產品若在體驗或可見性能上未達到，容易招致反彈。

作者觀點與結論：

GPT‑5 本身在技術上有改進與潛力，但發布時的路由問題與人格調教決策造成了使用者大量負評，這是執行與產品策略的失誤，而非完全的模型能力不足。
OpenAI 似乎在優化「大眾化、成本化」的路線：把較昂貴的模型往後放、預設更經濟的選項，這會犧牲部分個性化與高階使用體驗。
短期建議：儘快修復自動 model selector、提高回覆的透明度（告知使用者哪個子模型回應）、針對一般用戶恢復或調整更友善的互動風格；長期則需更清楚地管理對外宣傳與期望。
整體判斷：雖然這次發布被視為失誤，但 OpenAI 並非必然出局；一般用戶可能只感受到個性差異，而專業或重度使用者則更在意細節與 benchmark 表現，市場競爭將持續推動改進。

結語：

GPT‑5 的教訓在於：技術實力與使用者感受都重要，發布時的路由、人格設計與溝通策略同樣會決定公眾接受度。若 OpenAI 迅速修正路由與調整使用者互動體驗，仍有機會挽回信任與領先地位。