在生成模型(Generative Models)迅速發展的當下,如何高效且多樣地生成候選樣本,成為許多應用領域中的關鍵挑戰。傳統生成模型如變分自編碼器(VAE)或生成對抗網絡(GAN)常著重於從數據分布中抽樣,但在應用場景中,尤其是像藥物設計、結構優化等領域,除了單純的高概率樣本外,更需要多樣且合理的候選解產生。GFlowNet這篇由Bengio等人在ICLR 2022提出的論文,正是針對這一瓶頸,提出了一種基於流網路(Flow Network,簡稱FlowNet)架構的生成方法,實現了非迭代且高效多樣候選生成的突破,因而榮獲該屆會議的Outstanding Paper殊榮。
研究背景與動機
在許多實務問題中,例如分子生成、結構設計或強化學習中的策略探索,目標並非只生成一個最優解,而是希望能夠生成一組多樣且高品質的候選,供後續評估及選擇。傳統生成模型多採隨機抽樣,但高機率區域往往集中在少數模式,造成生成多樣性不足。而強化學習策略則通常迭代更新策略,效率也未必理想。在此情境下,如何設計一種模型,使得能夠直接從複雜的狀態空間中非迭代地產生多樣且依機率分布(概率場)相符的樣本,成為一大挑戰。
基於此,論文的主軸在於結合生成模型與流網路理論,提出一種將生成過程視為多步決策(遞迴生成)的框架:GFlowNet(Generative Flow Network)。作者試圖用網絡中的「流動」概念來量化生成過程中各個決策路徑的概率,從而保證模型能夠本質上學習並匹配目標分布,不只是擬合單一最優解,而是能公平地覆蓋多樣化解空間。
核心方法與創新
GFlowNet的核心思想是將生成樣本的過程形式化為一個由起點到終點的馬爾可夫決策過程(MDP),每一次「行動」都是往生成的物件加入某個元素(或修改狀態),直到達到一個完整結構的終止狀態。整個生成過程可視為沿著有向無環圖(DAG)中的一條路徑。GFlowNet藉由定義在這條路徑上流動量(flow),用以表示在生成過程中模型對狀態動作對的概率流動,類似電路中電流流動的概念。
與傳統馬爾可夫決策過程不同的是,GFlowNet不是單純在追求最大化期望回報,而是在學習能產生「概率分佈匹配」的流量。具體來說,給定一個非負獎勵函數(reward function)R(x),表示生成終止結構x的相對重要性或目標函數,GFlowNet學習一個流量分布,使得生成終止狀態的機率「與獎勵值成比例」,即
P(x) ∝ R(x)
此處的比例關係是GFlowNet最重要的特性,使其生成過程能夠兼具多樣性與品質,避免所有概率集中在少數最佳解上。
為了實現這一目標,作者提出使用「流守恆」原理,保證對任一中間狀態,流入量等於流出量(除非是起點或終點),從而建立流量的平衡。這種流守恆約束作為訓練過程的理論基礎,引導模型學習合理的遷移概率。這不僅能支持非迭代一次性完成樣本生成,更使得訓練過程更具穩定性與理論保證。
論文中還提出了多種訓練算法,例如基於貝爾曼流守恆方程設計的流匹配損失函數,以及強化學習上的優化技巧。這些創新使得GFlowNet能夠在高維且非結構化的生成空間中有效運作。
主要實驗結果
作者在多個合成與實際問題上驗證了GFlowNet的生成能力。包括:
- 離散結構生成:在合成variant combinatorial problems中,GFlowNet成功生成高獎勵且多樣化的結構集合,顯著超越強化學習與蒙特卡洛樹搜索等基線方法。
- 分子設計:在分子結構生成實驗中,GFlowNet能以高效且非迭代的方式產生大量結構多樣的候選分子,並且獎勵指標(如藥理活性、合成可行性)得到提升。
- 模擬結果驗證流守恆:實驗中流守恆條件被良好滿足,訓練過程中收斂快速且穩健。
綜合來看,實驗部分突顯了GFlowNet不僅生成質量高,同時涵蓋目標空間的多樣性,具備強泛化與高效樣本生成能力。
對 AI 領域的深遠影響
GFlowNet的誕生代表了生成模型的一個重要轉折點,其理論架構和實踐效果為生成式模型與強化學習領域注入了新思維。具體而言:
- 多樣性與品質的平衡新解:GFlowNet打破了只能聚焦高概率最優解的傳統框架,實現概率性多樣樣本生成,滿足實務中候選多樣化的巨大需求。
- 連結生成式模型與決策過程:將生成任務抽象成流網路中的馬爾可夫決策過程,開拓了生成建模新方向,提供理論上更穩固的訓練基礎和可擴展框架。
- 促進新應用拓展:在藥物設計、材料科學、結構化策略搜索等領域,可望結合GFlowNet的多樣候選生成,提升設計效率及創新能力。
- 理論與實踐的橋樑:藉由流守恆與貝爾曼方程結合,GFlowNet提供了可理論分析且易於優化的模型架構,推動未來更多基於流網路的學習方法研究。
總結來說,Flow Network Based Generative Models for Non-Iterative Diverse Candidate Generation (GFlowNet)這篇論文,不僅提出了富有創見的理論架構,還在效率與多樣性兼顧的生成任務中展現了卓越成效。對於有意在生成模型、強化學習與結構化探索領域繼續深耕的研究者與工程師而言,GFlowNet無疑是一個重要且值得深入理解的里程碑式成果。
論文資訊
📄 Flow Network based Generative Models for Non-Iterative Diverse Candidate Generation (GFlowNet)
👥 Bengio, Jain, Korablyov, Precup, Bengio
🏆 ICLR 2022 · Outstanding Paper
🔗 arxiv.org/abs/2106.04399
