Transformers 文件

飛馬座 (Pegasus)

變形金剛 (Transformers)

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

飛馬座 (Pegasus)

Pegasus是一個編碼器-解碼器（序列到序列）的轉換器模型，經過無標籤文字的預訓練，以執行抽象摘要。Pegasus在兩個自監督目標函式上聯合訓練：掩蔽語言建模（MLM）和間隙句子生成（GSG）。整個句子被掩蔽，模型必須填補文件中的空白。即使在只有1000個示例的小資料集上，它也能以良好的效能進行微調。

您可以在Google組織下找到所有原始的Pegasus檢查點。

點選右側邊欄中的Pegasus模型，檢視更多關於如何將Pegasus應用於不同語言任務的示例。

以下示例演示瞭如何使用Pipeline、AutoModel和命令列來總結文字。

流水線

自動模型

Transformers CLI

量化透過以較低精度表示權重來減少大型模型的記憶體負擔。有關更多可用量化後端，請參閱量化概述。

以下示例使用 bitsandbytes 將權重僅量化為 int4。

import torch
from transformers import BitsAndBytesConfig, AutoModelForSeq2SeqLM, AutoTokenizer

quantization_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_quant_type="nf4"
)
model = AutoModelForSeq2SeqLM.from_pretrained(
    "google/pegasus-xsum",
    torch_dtype=torch.bfloat16,
    device_map="auto",
    quantization_config=quantization_config
)

tokenizer = AutoTokenizer.from_pretrained(
    "google/pegasus-xsum"
)
input_text = """Plants are remarkable organisms that produce their own food using a method called photosynthesis.
This process involves converting sunlight, carbon dioxide, and water into glucose, which provides energy for growth.
Plants play a crucial role in sustaining life on Earth by generating oxygen and serving as the foundation of most ecosystems."""
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

output = model.generate(**input_ids, cache_implementation="static")
print(tokenizer.decode(output[0], skip_special_tokens=True))

注意事項

AdaFactor是微調Pegasus的推薦最佳化器。
此Pegasus實現繼承自BartForConditionalGeneration，但它使用靜態/正弦位置嵌入。Pegasus還以pad_token_id作為字首開始生成，並使用num_beams=8。

PegasusConfig

class transformers.PegasusConfig

< 來源 >

( vocab_size = 50265 max_position_embeddings = 1024 encoder_layers = 12 encoder_ffn_dim = 4096 encoder_attention_heads = 16 decoder_layers = 12 decoder_ffn_dim = 4096 decoder_attention_heads = 16 encoder_layerdrop = 0.0 decoder_layerdrop = 0.0 use_cache = True is_encoder_decoder = True activation_function = 'gelu' d_model = 1024 dropout = 0.1 attention_dropout = 0.0 activation_dropout = 0.0 init_std = 0.02 decoder_start_token_id = 0 scale_embedding = False pad_token_id = 0 eos_token_id = 1 forced_eos_token_id = 1 **kwargs )

引數

vocab_size (int, 可選, 預設為 50265) — PEGASUS模型的詞彙表大小。定義了呼叫PegasusModel或TFPegasusModel時可以透過inputs_ids表示的不同token的數量。
d_model (int, 可選, 預設為 1024) — 層和池化層的維度。
encoder_layers (int, 可選, 預設為 12) — 編碼器層的數量。
decoder_layers (int, 可選, 預設為 12) — 解碼器層的數量。
encoder_attention_heads (int, 可選, 預設為 16) — Transformer編碼器中每個注意力層的注意力頭數量。
decoder_attention_heads (int, 可選, 預設為 16) — Transformer解碼器中每個注意力層的注意力頭數量。
decoder_ffn_dim (int, 可選, 預設為 4096) — 解碼器中“中間”（通常稱為前饋）層的維度。
encoder_ffn_dim (int, 可選, 預設為 4096) — 解碼器中“中間”（通常稱為前饋）層的維度。
activation_function (str 或 function, 可選, 預設為 "gelu") — 編碼器和池化器中的非線性啟用函式（函式或字串）。如果是字串，支援"gelu"、"relu"、"silu"和"gelu_new"。
dropout (float, 可選, 預設為 0.1) — 嵌入層、編碼器和池化器中所有全連線層的丟棄機率。
attention_dropout (float, 可選, 預設為 0.0) — 注意力機率的丟棄率。
activation_dropout (float, 可選, 預設為 0.0) — 全連線層內部啟用的丟棄率。
max_position_embeddings (int, 可選, 預設為 1024) — 此模型可能使用的最大序列長度。通常設定為一個較大的值以防萬一（例如，512、1024或2048）。
init_std (float, 可選, 預設為 0.02) — 用於初始化所有權重矩陣的truncated_normal_initializer的標準差。
encoder_layerdrop (float, 可選, 預設為 0.0) — 編碼器的LayerDrop機率。更多詳情請參見[LayerDrop論文](參見https://huggingface.co/papers/1909.11556)。
decoder_layerdrop (float, 可選, 預設為 0.0) — 解碼器的LayerDrop機率。更多詳情請參見[LayerDrop論文](參見https://huggingface.co/papers/1909.11556)。
scale_embedding (bool, 可選, 預設為 False) — 透過除以sqrt(d_model)來縮放嵌入。
use_cache (bool, 可選, 預設為 True) — 模型是否應返回最後一個鍵/值注意力（並非所有模型都使用）。
forced_eos_token_id (int, 可選, 預設為 1) — 達到max_length時強制作為最後一個生成的token的ID。通常設定為eos_token_id。

這是用於儲存PegasusModel配置的配置類。它用於根據指定引數例項化PEGASUS模型，定義模型架構。使用預設值例項化配置將產生類似於PEGASUS google/pegasus-large架構的配置。

配置物件繼承自PretrainedConfig，可用於控制模型輸出。有關更多資訊，請參閱PretrainedConfig的文件。

示例

>>> from transformers import PegasusConfig, PegasusModel

>>> # Initializing a PEGASUS google/pegasus-large style configuration
>>> configuration = PegasusConfig()

>>> # Initializing a model (with random weights) from the google/pegasus-large style configuration
>>> model = PegasusModel(configuration)

>>> # Accessing the model configuration
>>> configuration = model.config

PegasusTokenizer

警告：add_tokens目前無法工作。

class transformers.PegasusTokenizer

< 來源 >

( vocab_file pad_token = '<pad>' eos_token = '</s>' unk_token = '<unk>' mask_token = '<mask_2>' mask_token_sent = '<mask_1>' additional_special_tokens = None offset = 103 sp_model_kwargs: typing.Optional[dict[str, typing.Any]] = None **kwargs )

引數

vocab_file (str) — SentencePiece檔案（通常以.spm副檔名結尾），其中包含例項化分詞器所需的詞彙表。
pad_token (str, 可選, 預設為 "<pad>") — 用於填充的token，例如當批次處理不同長度的序列時。
eos_token (str, 可選, 預設為 "</s>") — 序列結束符。

當使用特殊標記構建序列時，這不是用於序列結束的標記。所使用的標記是 sep_token。
unk_token (str, 可選, 預設為 "<unk>") — 未知標記。不在詞彙表中的標記無法轉換為ID，而是設定為此標記。
mask_token (str, 可選, 預設為 "<mask_2>") — 用於遮蔽單個標記值的標記。這是使用遮蔽語言建模 (MLM) 訓練此模型時使用的標記。這是 PEGASUS 編碼器在預訓練期間嘗試預測的標記。它對應於 PEGASUS: 用於抽象摘要的提取式句子生成預訓練中的 [MASK2]。
mask_token_sent (str, 可選, 預設為 "<mask_1>") — 用於遮蔽整個目標句子的標記。這是使用間隙句子生成 (GSG) 訓練此模型時使用的標記。這是 PEGASUS 解碼器在預訓練期間嘗試預測的句子。它對應於 PEGASUS: 用於抽象摘要的提取式句子生成預訓練中的 [MASK1]。
additional_special_tokens (List[str], 可選) — 標記器使用的額外特殊標記。如果未提供額外的特殊標記，則使用 <mask_2> 和 <unk_2, …, unk_102> 作為額外的特殊標記，對應於原始 PEGASUS 標記器，該標記器僅在預訓練時使用標記 2 - 104。
sp_model_kwargs (dict, 可選) — 將傳遞給 SentencePieceProcessor.__init__() 方法。 SentencePiece 的 Python 包裝器可用於設定（其中包括）：
- enable_sampling: 啟用子詞正則化。
- nbest_size: Unigram 取樣引數。對於 BPE-Dropout 無效。
  - nbest_size = {0,1}: 不執行取樣。
  - nbest_size > 1: 從 nbest_size 結果中取樣。
  - nbest_size < 0: 假設 nbest_size 是無限的，並使用前向濾波和後向取樣演算法從所有假設（格）中取樣。
- alpha: 用於 unigram 取樣的平滑引數，以及用於 BPE-dropout 的合併操作的 dropout 機率。

構建 PEGASUS 標記器。基於 SentencePiece。

此標記器繼承自 PreTrainedTokenizer，其中包含大部分主要方法。使用者應參閱此超類以獲取有關這些方法的更多資訊。

變形金剛 (Transformers)

飛馬座 (Pegasus)

注意事項

PegasusConfig

class transformers.PegasusConfig

PegasusTokenizer

class transformers.PegasusTokenizer

build_inputs_with_special_tokens

convert_tokens_to_string

get_special_tokens_mask

num_special_tokens_to_add

PegasusTokenizerFast

class transformers.PegasusTokenizerFast

build_inputs_with_special_tokens

get_special_tokens_mask

PegasusModel

class transformers.PegasusModel

forward

PegasusForConditionalGeneration

class transformers.PegasusForConditionalGeneration

forward

PegasusForCausalLM

class transformers.PegasusForCausalLM

forward

TFPegasusModel

class transformers.TFPegasusModel

呼叫

TFPegasusForConditionalGeneration

class transformers.TFPegasusForConditionalGeneration

呼叫

FlaxPegasusModel

class transformers.FlaxPegasusModel

__call__

編碼

解碼

FlaxPegasusForConditionalGeneration

class transformers.FlaxPegasusForConditionalGeneration

__call__

編碼

解碼

call

call