在生成模型蓬勃發展的近年,分數基生成模型(Score-based Generative Models,簡稱 SGMs)以其強大的生成能力與優異的表現,成為機器學習領域炙手可熱的研究主題。然而,傳統的 SGMs 主要建立於資料位於歐氏空間(Euclidean space)、即平坦流形的假設之上,這在許多實務場景如機器人學、地球科學或蛋白質結構建模中,資料卻多半天然存在於具有彎曲幾何結構的黎曼流形(Riemannian manifolds)上,造成現有方法的適用性嚴重受限。針對此一挑戰,加拿大多倫多大學的 De Bortoli 等人於 NeurIPS 2022 發表的傑出論文《Riemannian Score-Based Generative Modelling》提出創新架構,成功將分數基生成模型擴展到黎曼流形上,開創了生成建模的一項突破。
研究背景與動機
分數基生成模型是一類透過估計資料分布梯度(資料分數,score function)來構建的生成模型,主要分兩階段:在「加噪」(noising)階段,透過定義一個由真實資料往高斯噪音緩慢轉變的「前向擴散」(forward diffusion process);隨後在「去噪」(denoising)階段,透過學習該擴散過程的時間反向(time reversal)動態,來逐步恢復原始資料分布。此機制使得 SGMs 可以避免直接學習複雜的資料分布,而改由估計分數函數來實現高品質生成。
然而,至今大部分 SGMs 都是在歐氏空間設定中提出與實作,假設底層資料分布是平坦空間的一部分,難以應付資料存在於如球面、超橢球面、特殊正交群 SO(3) 等具非平坦度量(非歐氏)的黎曼流形空間。舉例來說,在地球氣候數據中,資料通常表示為球面上的分布;在機器人學與計算生物學中,蛋白質和機器手臂的位姿可能分布在旋轉群這類流形上。為了突破現有限制,迫切需要將生成模型理論與演算法擴展至一般黎曼流形空間中。
核心方法與創新
本文的核心貢獻在於系統性地將 SGMs 理論架構延展至可帶有彎曲結構的黎曼流形,提出一套名為 Riemannian Score-based Generative Models(RSGMs)的生成模型架構。其創新關鍵可歸納如下:
- 黎曼流形上的擴散過程定義:作者重新定義了前向擴散過程(forward diffusion process),使其為在黎曼流形上定義的隨機微分方程(Stochastic Differential Equation, SDE)。這條 SDE 模型了從真實資料分布向含極端擾動的平衡分布(通常是参照流形上的標準度量的抑制性噪音分布)緩慢演化的過程,並且尊重流形的幾何結構,例如向量場會自動被限制於切向空間(tangent space)。
- 黎曼流形上的時間反向模型:基於前向擴散的定義,作者利用黎曼流形上的 Eells-Elworthy-Malliavin 構造,建構了對應時間反向 SDE,並證明其生成動態仍可用流形上的分數函數估計來近似。透過這種時間反向 SDE,能夠從簡單先驗分布重建出複雜流形上的真實資料分布。
- 分數函數的黎曼估計策略:分數函數是生成模型的關鍵,而黎曼結構使得分數函數必須定義在切向量場上。作者設計了基於對切空間內的梯度與黎曼度量的分數估計方法,確保所學模型可有效捕捉資料在流形上的局部結構與全域幾何性質。
- 實作與數值方法:針對黎曼 SDE 的離散化與數值近似,作者融合了流形幾何與數值 SDE 解法,設計適用於流形的數值模擬器,並提出基於黑盒分數估計器(score network)與流形投影技巧的演算法,使得方法可直接應用於各類典型流形場景,如球面、超橢球面與旋轉群。
實驗結果精要
作者在多個典型的黎曼流形資料集上做廣泛實驗,證明了 RSGM 方法的有效性與適應性:
- 球面資料上的氣候數據模擬:透過地球表面氣候相關數據分布(如風速向量與溫度場分布)做生成實驗,RSGM 能夠成功模擬出符合物理結構與統計特性的球面環境資料,相較於以歐氏方法處理轉換數據,生成品質大幅提升,且保持了流形固有的連續性與可微性結構。
- 超橢球面與旋轉群 SO(3) 上的合成實驗:在造假實驗中,RSGM 可以精確地復原在高維流形如超橢球面上分布的資料,並在旋轉群 SO(3) 上處理機器人手臂姿態資料,展現該方法在機器人學與計算機視覺領域的潛力。
- 與既有方法的比較:相較於傳統歐氏 SGMs 的簡易投影方法,RSGM 明顯在生成的樣本多樣性與逼真度方面優勢顯著,同時維持了穩定的訓練過程,印證了黎曼流形結構對生成性能的提升效果。
對 AI 領域的深遠影響
本篇論文不僅解決了以往 SGMs 在流形資料生成上的理論與實踐瓶頸,更在生成模型的幾何學基礎上開啟了新方向。其影響和應用潛力包括:
- 拓展生成模型的應用範圍:過去生成技術多侷限於歐式空間,本文拓展到黎曼流形,使得在量子物理分子結構建模、腦神經影像形狀分析、機器人學姿態預測與動作生成、天文與氣象數據分析等多種領域,皆能使用更自然且具結構適應性的生成模型。
- 促進幾何深度學習與生成模型整合:本文理清了生成過程中如何有效結合流形幾何與隨機分析,對深化幾何深度學習研究具有指標意義,尤其在如何設計流形上高效可微神經網路與動態系統模型方面具啟發性。
- 推動流形結構資料的統計建模革命:未來大規模複雜結構資料如蛋白質序列與三維構型、交通網絡與社會網路的幾何特性分析,將可藉由 RSGM 這類流形生成模型,實現更精確且具解釋性的統計推斷。
總結而言,De Bortoli 等人提出的 Riemannian Score-Based Generative Modelling,不僅是將 SGMs 理論從歐氏空間推廣到更廣泛的幾何空間的里程碑,更吹響了生成模型與數學幾何深度融合的號角,具有重塑生成建模未來發展格局的潛力。
論文資訊
📄 Riemannian Score-Based Generative Modelling
👥 De Bortoli, Mathieu, Hutchinson, Thornton, Teh, Doucet
🏆 NeurIPS 2022 · Outstanding Paper
🔗 arxiv.org/abs/2202.02763

沒有留言:
張貼留言