Diffusers 文件

ScoreSdeVpScheduler

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

ScoreSdeVpScheduler

ScoreSdeVpScheduler 是一個方差保持隨機微分方程 (SDE) 排程器。它由 Yang Song、Jascha Sohl-Dickstein、Diederik P. Kingma、Abhishek Kumar、Stefano Ermon、Ben Poole 在 Score-Based Generative Modeling through Stochastic Differential Equations 論文中提出。

論文摘要如下:

從資料中建立噪聲很容易;從噪聲中建立資料是生成建模。我們提出了一種隨機微分方程 (SDE),透過緩慢注入噪聲將複雜的真實資料分佈平滑地轉換為已知的先驗分佈,以及相應的逆時間 SDE,透過緩慢去除噪聲將先驗分佈轉換回資料分佈。至關重要的是,逆時間 SDE 僅取決於擾動資料分佈的時間相關梯度場(即分數)。透過利用基於分數的生成建模的進步,我們可以使用神經網路準確地估計這些分數,並使用數值 SDE 求解器生成樣本。我們展示了該框架封裝了以前基於分數的生成建模和擴散機率建模的方法,允許新的取樣過程和新的建模能力。特別是,我們引入了一個預測器-校正器框架來糾正離散化逆時間 SDE 演化中的誤差。我們還推匯出了一個等效的神經 ODE,它從與 SDE 相同的分佈中取樣,但額外實現了精確的似然計算和改進的取樣效率。此外,我們提供了一種使用基於分數的模型解決逆問題的新方法,正如類條件生成、影像修復和著色實驗所證明的那樣。結合多項架構改進,我們在 CIFAR-10 上實現了無條件影像生成的創紀錄效能,Inception 分數為 9.89,FID 為 2.20,有競爭力的似然為 2.99 bits/dim,並首次展示了基於分數的生成模型生成 1024 x 1024 影像的高保真度。

🚧 此排程器正在構建中!

ScoreSdeVpScheduler

diffusers.schedulers.ScoreSdeVpScheduler

< >

( num_train_timesteps = 2000 beta_min = 0.1 beta_max = 20 sampling_eps = 0.001 )

引數

  • num_train_timesteps (int, 預設為 2000) — 用於訓練模型的擴散步數。
  • beta_min (int, 預設為 0.1) —
  • beta_max (int, 預設為 20) —
  • sampling_eps (int, 預設為 1e-3) — 取樣結束值,其中時間步長從 1 逐漸減小到 epsilon。

ScoreSdeVpScheduler 是一個方差保持隨機微分方程 (SDE) 排程器。

該模型繼承自 SchedulerMixinConfigMixin。檢視超類文件以瞭解庫為所有排程器實現的通用方法,例如載入和儲存。

set_timesteps

< >

( num_inference_steps device: typing.Union[str, torch.device] = None )

引數

  • num_inference_steps (int) — 使用預訓練模型生成樣本時使用的擴散步數。
  • device (strtorch.device, 可選) — 時間步長應移動到的裝置。如果為 None,則時間步長不移動。

設定用於擴散鏈的連續時間步長(在推理前執行)。

step_pred

< >

( score x t generator = None )

引數

  • 分數 () —
  • x () —
  • t () —
  • generator (torch.Generator, 可選) — 隨機數生成器。

透過逆轉 SDE 預測前一個時間步的樣本。此函式從學習到的模型輸出(通常是預測的噪聲)傳播擴散過程。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.