神經網絡革命:從冷落到顛覆AI的曙光
2023年夏天,OpenAI首席科學家Ilia Sudskver以及他在人工智慧領域的奮鬥故事被詳細回顧。Sudskver是ChatGPT背後的關鍵推手,該產品在短短九個月內成為史上增長最快的消費產品,OpenAI估值達290億美元。然而,他也因懼怕AI失控而設計地堡以備不時之需,並在2023年秋天因CEO Sam Alman的管理問題而協助董事會罷免他,這場內鬥震動AI界。
故事由11年前一通啟蒙的電話談起,那時著名神經網絡先驅Jeffrey Hinton正努力在經費匱乏的多倫多大學AI實驗室中追尋突破。儘管60年代AI領域被Symbolic AI(以規則和邏輯編碼為主)壓倒,但神經網絡派信奉「智慧必須學習而非編程」,認為類似人腦的神經調整是智慧的根本。1958年神經網絡初代模型Perceptron面世,雖僅能處理簡單圖形辨識,卻奠定了學習型AI的基礎。
1969年,著名AI大師Marvin Minsky的書籍《Perceptrons》宣稱神經網絡無法突破數學上的限制,導致資金被大幅削減,神經網絡研究陷入低潮。Hinton是少數持續堅信神經網絡潛力的研究者之一。2003年,年輕的Ilia Sudskver進入Hinton實驗室,展現非凡直覺與才華,協助開發深度信念網絡(deep belief networks),這是用於突破大型網絡訓練瓶頸的創新思路。
進入2010年代,Sudskver和同事發現繪圖處理器(GPU)非官方地適合進行神經網絡所需的矩陣計算,這帶來巨大的計算加速效果。帶著這一技術,他們將AI模型訓練規模成倍增加。2012年,Sudskver和Hinton的團隊使用兩台GPU參加ImageNet圖像識別大賽,模型準確率從74.3%一躍至84.7%,震驚學界,標誌著神經網絡迎來復興。
此後,谷歌等科技巨頭紛紛投入巨資競逐AI領域,令曾經被忽視的神經網絡一舉成為AI發展的主流技術。2015年,Sudskver被Elon Musk等人說服加入剛成立的非營利組織OpenAI,旨在推動負責任的AI發展。然而資金與理想的矛盾難以調和,OpenAI很快改組為有限營利模式,並於2019年接受微軟十億美元投資,開始商業化其模型。
2020年,OpenAI發布了GPT-3模型,展示AI藉由數據和計算規模擴大帶來的跨越式智能提升,寫作、編程、考試均表現優異,但同時團隊內部對於安全與倫理的擔憂日益加劇。2022年底,OpenAI推出基於GPT-3.5的ChatGPT聊天界面,迅速吸引數千萬用戶,使OpenAI成為硅谷最大新創之一,創始成員Sudskver開始聚焦AI安全研究,力圖防範技術失控帶來的風險。
2023年11月,Sudskver協助OpenAI董事會以種種包括資源調配不當、內部欺瞞等理由罷免Sam Alman,卻導致公司內部一片哗然,大批高管與員工離職,並面臨來自微軟的挖角與組隊競爭威脅。儘管如此,Sudskver並未回歸OpenAI,而是在2024年宣布成立新實驗室「Safe Super Intelligence (SSI)」,專注於高度安全的超智能AI發展。
從當年一個青澀的少年敲響Hinton實驗室門扉,到神經網絡從被否定走向顛覆性的勝利;從理想非盈利走向商業巨頭競爭,再到核心創始人為安全憂心忡忡的激烈內鬥,這段歷程全面展現了人工智慧從夢想到現實所經歷的挑戰與風險,也提醒人類,AI的快速發展同時帶來巨大機遇與深刻考驗。

沒有留言:
張貼留言