摘要重點:
- 發布反應分裂:GPT‑5 上線後在社群(Twitter、Reddit)大量被批評「令人失望」、「不如預期」,但也有人認為這次升級在某些面向是優秀的。
- 主要問題之一:model selector(自動路由器)當天失效,導致多數使用者實際接觸到的並非最強或最合適的 GPT‑5 模型,讓體驗顯得「變笨」或不一致。
- 人格與互動風格的改變:GPT‑5 相對較少「配合性」與「暖心個性」,回應較短、較務實,失去過去某些版本(如 GPT‑4 系列)更友善、支持性的聊天風格,許多使用者因此懷念舊版。
- 定位轉變:OpenAI 正從研究團隊逐步轉向以產品與大眾用戶為優先,目標是大量每日活躍使用者(DAU)與成本效率,這會影響模型設計與調教方向。
- 基準測試與比較:社群質疑官方發表的圖表與排名(數據顯示錯置或不合理)。在多個公開 benchmark(如 SimpleBench、ARC AGI)中,Google 的 Gemini、Grok 等競品在推理、常識題上表現優異,GPT‑5 並未全面領先。
- 市場信心變化:例如在 PolyMarket 等平台上,GPT‑5 發布後投票或賭盤出現對 OpenAI 支持度下滑(報告指出降到約 14% 的數值),顯示外界預期受挫。
- 宣傳與期待管理失誤:過度炒作(例如 Sam Altman 的「Death Star」類比)使得社群對能力的期待過高,實際產品若在體驗或可見性能上未達到,容易招致反彈。
作者觀點與結論:
- GPT‑5 本身在技術上有改進與潛力,但發布時的路由問題與人格調教決策造成了使用者大量負評,這是執行與產品策略的失誤,而非完全的模型能力不足。
- OpenAI 似乎在優化「大眾化、成本化」的路線:把較昂貴的模型往後放、預設更經濟的選項,這會犧牲部分個性化與高階使用體驗。
- 短期建議:儘快修復自動 model selector、提高回覆的透明度(告知使用者哪個子模型回應)、針對一般用戶恢復或調整更友善的互動風格;長期則需更清楚地管理對外宣傳與期望。
- 整體判斷:雖然這次發布被視為失誤,但 OpenAI 並非必然出局;一般用戶可能只感受到個性差異,而專業或重度使用者則更在意細節與 benchmark 表現,市場競爭將持續推動改進。
結語:
GPT‑5 的教訓在於:技術實力與使用者感受都重要,發布時的路由、人格設計與溝通策略同樣會決定公眾接受度。若 OpenAI 迅速修正路由與調整使用者互動體驗,仍有機會挽回信任與領先地位。
沒有留言:
張貼留言