這段影片紀錄了作者從零開始訓練自己AI模型的過程,並分享了過程中遇到的各種困難與收穫。最初他對AI訓練毫無頭緒,靠著中國AI研究資料與開源社群的幫助,並運用boot.dev的程式教學課程,一步步學習與嘗試。
作者採用了名為Gwen 32B的編碼AI模型,並在眾多不同的資料集及格式間調整,努力優化模型表現。期間不斷遭遇硬體燒壞、資料污染、格式不合及訓練崩潰等問題,甚至差點燒毀自己的電腦。他也發現資料品質是關鍵,透過篩選優質資料和人工合成資料不斷改善訓練數據。
在多次失敗後,最終模型在官方的Ader Polyglot編碼能力評測中達到約39%的成績,成功超越市面上多款知名大型AI模型(如ChatGPT和Google Gemini Pro),但是因為存在資料污染及評測範圍限制,作者仍計畫重新清理資料並繼續優化。
影片強調學習過程中的重要心態:必須容忍失敗並從中學習,循序漸進才能達成目標。作者也提到,雖然訓練AI過程艱難且耗時,但編碼AI模型將為更多人激發學習程式設計的興趣。
最後他推薦了學習程式的網站boot.dev,強調真正理解背後原理的重要性,並感謝贊助商NordVPN,提醒大家保護上網安全。
總結來說,此影片不僅是訓練AI模型的技術分享,更是個人突破自我、堅持到底的勵志故事,適合對AI、程式設計或自我提升有興趣的觀眾觀看。

沒有留言:
張貼留言