Diffusers 文件

影片處理器

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

影片處理器

VideoProcessor 為影片管道提供統一的 API,用於準備 VAE 編碼的輸入和解碼後處理輸出。該類繼承自 VaeImageProcessor,因此它包含大小調整、歸一化以及 PIL Image、PyTorch 和 NumPy 陣列之間的轉換等操作。

VideoProcessor

diffusers.video_processor.VideoProcessor.preprocess_video

< >

( video height: typing.Optional[int] = None width: typing.Optional[int] = None )

引數

  • video (List[PIL.Image], List[List[PIL.Image]], torch.Tensor, np.array, List[torch.Tensor], List[np.array]) — 輸入影片。可以是以下任意一種:
    • PIL 影像列表。
    • PIL 影像列表的列表。
    • 4D Torch 張量(每個張量的預期形狀為 (num_frames, num_channels, height, width))。
    • 4D NumPy 陣列(每個陣列的預期形狀為 (num_frames, height, width, num_channels))。
    • 4D Torch 張量列表(每個張量的預期形狀為 (num_frames, num_channels, height, width))。
    • 4D NumPy 陣列列表(每個陣列的預期形狀為 (num_frames, height, width, num_channels))。
    • 5D NumPy 陣列:每個陣列的預期形狀為 (batch_size, num_frames, height, width, num_channels)
    • 5D Torch 張量:每個陣列的預期形狀為 (batch_size, num_frames, num_channels, height, width)
  • height (int, 可選, 預設為 None) — 影片預處理幀的高度。如果為 None,將使用 get_default_height_width() 獲取預設高度。
  • width (int, 可選, 預設為 None) -- 影片預處理幀的寬度。如果為 None,將使用 get_default_height_width() 獲取預設寬度。

預處理輸入影片。

diffusers.video_processor.VideoProcessor.postprocess_video

< >

( video: Tensor output_type: str = 'np' )

引數

  • video (torch.Tensor) — 作為張量的影片。
  • output_type (str, 預設為 "np") — 後處理 video 張量的輸出型別。

將影片張量轉換為幀列表以供匯出。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.