Diffusers

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

影片處理器

VideoProcessor 為影片管道提供統一的 API，用於準備 VAE 編碼的輸入和解碼後處理輸出。該類繼承自 VaeImageProcessor，因此它包含大小調整、歸一化以及 PIL Image、PyTorch 和 NumPy 陣列之間的轉換等操作。

( video height: typing.Optional[int] = None width: typing.Optional[int] = None )

引數

video (List[PIL.Image], List[List[PIL.Image]], torch.Tensor, np.array, List[torch.Tensor], List[np.array]) — 輸入影片。可以是以下任意一種：
- PIL 影像列表。
- PIL 影像列表的列表。
- 4D Torch 張量（每個張量的預期形狀為 (num_frames, num_channels, height, width)）。
- 4D NumPy 陣列（每個陣列的預期形狀為 (num_frames, height, width, num_channels)）。
- 4D Torch 張量列表（每個張量的預期形狀為 (num_frames, num_channels, height, width)）。
- 4D NumPy 陣列列表（每個陣列的預期形狀為 (num_frames, height, width, num_channels)）。
- 5D NumPy 陣列：每個陣列的預期形狀為 (batch_size, num_frames, height, width, num_channels)。
- 5D Torch 張量：每個陣列的預期形狀為 (batch_size, num_frames, num_channels, height, width)。
height (int, 可選, 預設為 None) — 影片預處理幀的高度。如果為 None，將使用 get_default_height_width() 獲取預設高度。
width (int, 可選, 預設為 None) -- 影片預處理幀的寬度。如果為 None，將使用 get_default_height_width() 獲取預設寬度。

預處理輸入影片。

( video: Tensor output_type: str = 'np' )

引數

將影片張量轉換為幀列表以供匯出。