隨著生成模型在影像、語音與科學計算等領域取得突破性進展,分數函數(score function)為核心的生成方法──Score-based Generative Models(SGMs)因其強大的生成能力及理論基礎,成為近年深度生成模型的熱門方向。然而,傳統的 SGMs 主要假設資料分佈於歐氏空間(Euclidean space),即幾何結構為平坦的流形(manifold)。但現實世界中許多數據自然存在於具有曲率的黎曼流形(Riemannian manifolds),例如機器人操作空間、天文與氣候科學中的球面數據、蛋白質結構建模等,這些領域中歐氏假設明顯不符,導致傳統 SGM 方法效能受限。NeurIPS 2022 傑出論文《Riemannian Score-Based Generative Modelling》由 De Bortoli 等人提出了一套創新的理論框架與實踐方法,拓展了 SGM 至黎曼流形,填補了此一重要空缺。
研究背景與動機
生成模型致力於學習資料真實分佈,並從中抽樣產生合成資料。Score-based Generative Models 利用無監督學習估計資料分布的分數函數(即資料分佈對數密度的梯度),透過擾動資料加上隨機噪聲形成一個正向擴散過程(forward diffusion),並反向模擬(time-reversal)以生成新資料。此方法理論扎實且較易穩定訓練,近年在圖片生成等大規模任務表現卓越。
然而,許多複雜資料並不自然存在於平坦空間。例如,地球的氣候資料即分佈於球面(spherical manifold),這是具有非零曲率的黎曼空間,機器人臂的運動學參數則位於旋轉群 SO(3) 或一般特殊歐氏群 SE(3) 等幾何空間。直接將歐氏空間的擴散模型套用於這些資料,不僅違背流形本質,也常導致生成效能顯著下降。論文團隊因此提出設計可適用於任意黎曼流形的擴散與反向生成方法,開啟具黎曼幾何感知的生成模型新篇章。
核心方法與創新
本論文創新地將 Score-based Generative Models 構建於黎曼流形結構上,提出「黎曼分數基生成模型」(Riemannian Score-Based Generative Models,RSGMs)。其關鍵挑戰之一在於:傳統 SGM 對應的向量空間與梯度計算皆需在歐氏空間中進行,面對黎曼流形,本質上必須尊重流形的內在曲率與連續結構。
具體而言,作者從以下幾方面突破:
- 隨機微分幾何基礎:建構在黎曼流形上的隨機過程與擴散方程,使用伊藤對流形擴散理論(Itô diffusion on manifolds),將擴散過程定義為在流形的切空間(tangent space)中的隨機行走,其動態受流形黎曼度量(Riemannian metric)調控。
- 黎曼分數函數(score function)估計:將資料分布的對數密度梯度轉寫成黎曼流形上的梯度形式,並設計相應的神經網路架構以估計該分數函數。黎曼分數的估計較歐氏空間複雜,因為必須針對流形幾何做差異化,確保梯度在切向量空間中正確計算。
- 擴散過程時間反演理論:基於 Anderson 的時間反轉理論,論文建立了黎曼流形擴散過程的反向隨機動態模型,從而得出從純噪聲逐步去噪生成資料的過程。此反向過程的定義與實現是論文的理論核心,確保生成過程尊重流形幾何且可數值穩定求解。
- 數值方法與網路架構的調整:設計切向量場(vector fields)上的神經估計器與黎曼流形上的數值積分方法(例如流行的Riemannian Euler-Maruyama法),用於訓練與推理階段的擴散過程模擬。
主要實驗結果
為驗證 RSGM 方法的有效性,作者在多個有黎曼流形結構的真實與合成數據集進行嚴格實驗:
- 球面數據 (S^2 manifold) 模型:對氣候數據與地球物理測量進行生成實驗,RSGM 不僅生成結果準確且具有良好多樣性,明顯優於直接用歐氏 SGM 處理導致的失真。
- 旋轉群 SO(3) 數據:在機器人臂末端姿態模擬中,RSGM 成功捕捉 SO(3) 上的概率分布,生成逼真且符合物理約束的姿態樣本,證明模型對複雜李群結構的適應性。
- 合成黎曼流形數據:透過人工構造具有曲率的流形資料集,展示模型如何明確捕捉流形彎曲帶來的統計特徵,並達成低樣本生成誤差。
實驗結果不僅證明了 RSGM 在多種黎曼流形上的強大泛化能力,還具有可行的計算複雜度與訓練穩定性。此外,模型在生成效率與生成質量間取得良好平衡,為後續實務應用建立堅實基礎。
對 AI 領域的深遠影響
這篇傑出論文的意義深遠,主要體現在以下幾方面:
- 拓展了生成模型理論邊界:傳統生成模型多聚焦於歐氏空間,而 RSGM 開啟了將深度生成模型與黎曼幾何結合的新方向,促使研究者進一步思考非線性、非平坦幾何中資料建模的方法論。
- 跨領域應用潛能巨大:機器人學、醫學影像、氣象預報、蛋白質摺疊等多個領域的高維非歐氏資料,都能藉由 RSGM 顯著提升生成樣本的物理合理性與科學解釋力,未來將推動具體產業落地。
- 促進數學與 AI 結合:該論文將隨機分析、黎曼幾何與深度學習巧妙融合,展示了數學理論在現代 AI 模型構建的核心價值,有助於培養更多跨領域人才,推動基礎理論與應用的雙向進步。
- 為流形深度學習奠基:近年來流形學習與幾何深度學習受矚,RSGM 在擴散生成的框架下成功實現黎曼流形建模,為未來流形上其它任務(如分類、聚類、強化學習)提供了可借鑑的典範。
總體而言,《Riemannian Score-Based Generative Modelling》不只提出了一套強大的生成框架,也啟示了未來 AI 模型開發應更貼近現實資料的內在幾何結構。隨著越來越多複雜資料涵蓋非線性流形結構,這項工作勢必成為推動生成模型理論與實踐迭代的里程碑。
論文資訊
📄 Riemannian Score-Based Generative Modelling
👥 De Bortoli, Mathieu, Hutchinson, Thornton, Teh, Doucet
🏆 NeurIPS 2022 · Outstanding Paper
🔗 arxiv.org/abs/2202.02763

沒有留言:
張貼留言