本次訪談邀請到深耕人工智慧與軟體工程多年的Andre Karpathy,討論AI代理(agents)技術的革命性進展、軟體工程與研究自動化的未來願景,以及AI在家居自動化、教育和機器人領域的應用趨勢。
AI代理顛覆軟體開發
Karpathy 表示,從2023年12月開始,他已經很少親自編寫程式碼,大部分的工作都交由各種AI代理(如Codex、Claude)完成。他將自己每天花16小時「表達意願給代理」視作新型態的軟體開發模式,這改變了既有的工程師工作流程。
他談及軟體開發變成「宏觀指令」的委派過程,例如不同代理分別負責研究、編碼、計劃,互相協作,打造複雜功能並管理多重程式庫。這使得個人的效率成為關鍵瓶頸,強調掌握如何有效指令和監督代理是未來軟體工程師的重要技能。
Claw代理與智能家居自動化
Karpathy分享自家打造的「Dobby the elf claw」,透過代理自動發現並逆向工程家中智慧設備(如Sonos音響系統、燈光、空調、泳池及安全系統),完美整合多個子系統,透過WhatsApp直接用自然語言指令控制。這讓他徹底擺脫過去需在不同App切換控制的繁瑣體驗,是智能家居與個人代理結合的生動範例。
他認為,未來用戶對軟體的期待是用自然語言與AI代理互動,省去繁瑣的UI學習,代理成為最貼合人類思維的使用介面。這可能將使得現有複雜多元的App生態受到根本顛覆,更傾向於一鍵連接背後豐富的API與智能代理。
自動化研究(Auto Research)與研究者角色轉變
針對訓練大型語言模型(LLM)與實驗調參效率,Karpathy推動了「自動化研究」概念:建立設定明確目標與約束的代理系統,自主搜集數據、優化模型架構及參數,減少人類研究者的介入,讓模型訓練與調優如同自動駕駛般自我迭代。
他指出,這種做法在小型模型上已有顯著成果,甚至超越過去他手動調整的效果,未來有潛力擴大至更大規模並大幅提升研究效率。他理想的模型培訓架構是多個研究組織以程序文件(program MD)描述工作方式,透過競賽方式優化最佳策略,並以自動驗證確保研究成果的可靠性,近似區塊鏈中「工作證明」的概念。
AI與職場趨勢觀察
Karpathy分析美國勞工統計數據,認為數位資訊處理相關職業將因AI助力產生結構性變化,效率大幅提升,雖難斷言工作總量增加或減少,但掌握AI工具必然是未來就業的關鍵。他對軟體工程職缺展望正面,預估因自動化降低成本反而引發「傑文斯悖論」般需求增長,使軟體開發更受重視,成為經濟重要推動力。
AI模型的現狀與限制
Karpathy坦言雖然模型在代碼生成等可驗證領域表現出色,但在較為模糊或多變的任務(如創意笑話產生)仍顯粗糙且表現有限。他認為AI整體能力呈現「鋸齒狀」(jaggedness),部分能力極強而其他部分仍需大幅改進。
他同時看好未來在AI模型中出現專業細分(speciation)的趨勢:設計多種專精於不同領域的小型模型,以提升效率和延展性,而非目前主流的全方位「單模」大模型。這種演化模式類似生物多樣性,會帶來更多元且專精的AI系統。
前沿研究開放性與產業生態
談及封閉實驗室(Frontier Labs)與開源模型的競合關係,Karpathy認為兩者將長期共存。開源模型距離前沿模型通常落後約半年至一年,但足以支援大部分一般消費與企業應用。他比喻此生態如作業系統產業的Windows與Linux共存,認為多元競爭對健康生態系發展有益。
機器人與數位/物理世界交界
對於機器人與物理世界AI的發展,Karpathy認為因涉及硬體複雜性與成本,比數位AI成長慢很多。目前數位資訊處理空間仍有巨量效率優化與解放工作可做,物理世界則將在較長時間後隨著數位AI成熟才出現爆發式發展。
他點出未來AI代理將在「傳感器」(sensors) 與「執行器」(actuators) 介面扮演重要角色,介入實驗室自動化、智慧硬體控制等領域,數位與物理界面的協同是下一波技術突破焦點。
未來教育與知識傳遞革新
Karpathy展示其「micro GPT」計畫:用不到200行程式碼寫出完整簡化版大型語言模型訓練流程,意在教育與傳遞AI核心演算法精髓。他認為未來教育將越來越仰賴AI代理做個人化引導,學生不再直接向人類教師求教,而是由代理解讀學習內容、以不同方式教導學生,老師將專注於補完代理不足部分。
他強調現階段轉型尚未完全成熟,但AI代理已經能協助解釋高階概念,未來教學將更加以代理為中心,這將成為教育模式的重大變革。
結語
本次訪談全面深入展望了AI代理技術如何從根本改變軟體開發、研究、生活自動化及職場等多面向領域,Karpathy展露出與時俱進的前瞻洞察及對技術倫理、產業結構的深刻反思,是理解AI未來發展不可錯過的重要分享。
