模型

PeftModel 是用於指定基礎 Transformer 模型和配置以應用 PEFT 方法的基礎模型類。基礎 PeftModel 包含從 Hub 載入和儲存模型的方法。

PeftModel

class peft.PeftModel

( model: PreTrainedModel peft_config: PeftConfig adapter_name: str = 'default' autocast_adapter_dtype: bool = True low_cpu_mem_usage: bool = False )

引數

model (PreTrainedModel) — 用於 Peft 的基礎 Transformer 模型。
peft_config (PeftConfig) — Peft 模型的配置。
adapter_name (str, 可選) — 介面卡的名稱，預設為 "default"。
autocast_adapter_dtype (bool, 可選) — 是否自動轉換介面卡的資料型別。預設為 True。目前，這隻會將使用 float16 和 bfloat16 的介面卡權重轉換為 float32，因為這通常是穩定訓練所必需的，並且隻影響特定的 PEFT 微調器。
low_cpu_mem_usage (bool, 可選, 預設為 False) — 在元裝置（meta device）上建立空的介面卡權重。有助於加快載入過程。

在為訓練建立新的 PEFT 介面卡時，不要使用 low_cpu_mem_usage=True。

包含各種 Peft 方法的基礎模型。

屬性:

base_model (torch.nn.Module) — 用於 Peft 的基礎 Transformer 模型。
peft_config (PeftConfig) — Peft 模型的配置。
modules_to_save (list of str) — 儲存模型時要儲存的子模組名稱列表。
prompt_encoder (PromptEncoder) — 如果使用 PromptLearningConfig，則為 Peft 使用的提示編碼器。
prompt_tokens (torch.Tensor) — 如果使用 PromptLearningConfig，則為 Peft 使用的虛擬提示令牌。
transformer_backbone_name (str) — 如果使用 PromptLearningConfig，則為基礎模型中 Transformer 主幹的名稱。
word_embeddings (torch.nn.Embedding) — 如果使用 PromptLearningConfig，則為基礎模型中 Transformer 主幹的詞嵌入。

add_adapter

< 來源 >

( adapter_name: str peft_config: PeftConfig low_cpu_mem_usage: bool = False )

引數

adapter_name (str) — 要新增的介面卡的名稱。
peft_config (PeftConfig) — 要新增的介面卡的配置。
low_cpu_mem_usage (bool, 可選, 預設為 False) — 在元裝置（meta device）上建立空的介面卡權重。在載入已儲存的介面卡時有助於加快處理速度。在為訓練建立新的 PEFT 介面卡時不要使用此選項。

根據傳入的配置向模型新增一個介面卡。

此介面卡未經訓練。要載入已訓練的介面卡，請檢視 PeftModel.load_adapter()。

新介面卡的名稱應該是唯一的。

新介面卡不會自動設定為活動介面卡。使用 PeftModel.set_adapter() 設定活動介面卡。

create_or_update_model_card

< 來源 >

( output_dir: str )

更新或建立模型卡以包含有關 peft 的資訊

新增 peft 庫標籤
新增 peft 版本
新增基礎模型資訊
如果使用了量化，則新增量化資訊

delete_adapter

< 來源 >

( adapter_name: str )

引數

adapter_name (str) — 要刪除的介面卡的名稱。

刪除一個現有的介面卡。

disable_adapter

< 來源 >

( )

停用介面卡模組的上下文管理器。使用此管理器在基礎模型上執行推理。

示例

>>> with model.disable_adapter():
...     model(inputs)

forward

< 來源 >

( *args: Any **kwargs: Any )

模型的前向傳播。

from_pretrained

< 來源 >

( model: torch.nn.Module model_id: Union[str, os.PathLike] adapter_name: str = 'default' is_trainable: bool = False config: Optional[PeftConfig] = None autocast_adapter_dtype: bool = True ephemeral_gpu_offload: bool = False low_cpu_mem_usage: bool = False key_mapping: Optional[dict[str, str]] = None **kwargs: Any )

引數

model (torch.nn.Module) — 要被適配的模型。對於 🤗 Transformers 模型，該模型應使用 from_pretrained 進行初始化。
model_id (str 或 os.PathLike) — 要使用的 PEFT 配置的名稱。可以是：
- 一個字串，即託管在 Hugging Face Hub 模型倉庫中的 PEFT 配置的 model id。
- 一個包含使用 save_pretrained 方法儲存的 PEFT 配置檔案的目錄路徑 (./my_peft_config_directory/)。
adapter_name (str, 可選, 預設為 "default") — 要載入的介面卡的名稱。這對於載入多個介面卡很有用。
is_trainable (bool, 可選, 預設為 False) — 介面卡是否可訓練。如果為 False，介面卡將被凍結，只能用於推理。
config (PeftConfig, 可選) — 要使用的配置物件，而不是自動載入的配置。此配置物件與 model_id 和 kwargs 互斥。當配置在呼叫 from_pretrained 之前已經載入時，此引數很有用。
autocast_adapter_dtype (bool, 可選) — 是否自動轉換介面卡的資料型別。預設為 True。僅與特定的介面卡型別相關。
ephemeral_gpu_offload (bool, 可選) — 是否對部分載入的模組使用臨時 GPU 解除安裝。預設為 False。當模型的某些部分和/或元件（如介面卡）儲存在 CPU 記憶體中直到需要時，此引數很有用。資料不是在小資料上執行昂貴的操作，而是按需傳輸到 GPU，執行操作，然後將結果移回 CPU 記憶體。這會帶來輕微的瞬時 VRAM 開銷，但在某些情況下可以提供數量級的加速。
low_cpu_mem_usage (bool, 可選, 預設為 False) — 在載入已儲存的權重之前，在元裝置（meta device）上建立空的介面卡權重。有助於加快處理速度。
torch_device (str, 可選, 預設為 None) — 載入介面卡的裝置。如果為 None，將自動推斷裝置。
key_mapping (dict, 可選, 預設為 None) — 在載入 state_dict 之前應用的 PEFT state_dict 鍵的額外對映。當應用此對映時，會預先刪除 PEFT 特定的 "base_model.model" 字首，並且尚未插入介面卡名稱（例如 "default"）。僅在您清楚自己在做什麼時才傳遞此引數。
kwargs — (可選): 傳遞給特定 PEFT 配置類的其他關鍵字引數。

從預訓練模型和載入的 PEFT 權重例項化一個 PEFT 模型。

請注意，傳入的 model 可能會被就地修改。

get_base_model

< 來源 >

( )

返回基礎模型。

get_layer_status

< 來源 >

( ) → 列表peft.peft_model.TunerLayerStatus

引數

model (~PeftModel) — 要獲取介面卡層狀態的模型。

列表peft.peft_model.TunerLayerStatus

一個數據類列表，每個資料類包含相應介面卡層的狀態。

獲取模型中每個介面卡層的狀態。

此方法返回一個 TunerLayerStatus 資料類例項列表，每個例項包含以下屬性：

name (str)：介面卡層的名稱，例如 model.encoder.block.0.layer.0.SelfAttention.q。
module_type (str)：介面卡層的型別，例如 lora.Linear。
enabled (bool)：介面卡層是否已啟用。
active_adapters (list[str])：活動介面卡的名稱（如果有），例如 ["default"]。
merged_adapters (list[str])：已合併的介面卡的名稱（如果有），例如 ["default"]。
available_adapters (list[str])：可用介面卡的名稱，例如 ["default"]。

get_model_status

< 來源 >

( ) → peft.peft_model.TunerModelStatus

引數

model (~PeftModel) — 要獲取介面卡層狀態的模型。

peft.peft_model.TunerModelStatus

包含模型狀態的資料類。

獲取模型中微調器的狀態。

此方法返回一個 TunerModelStatus 資料類例項，其中包含以下屬性：

base_model_type (str)：基礎模型的型別，例如 T5Model。
adapter_model_type (str)：介面卡模型的型別，例如 LoraModel。
peft_types (dict[str, str])：介面卡名稱到介面卡型別的對映，例如 {"default": "LORA"}。
trainable_params (int)：模型中可訓練引數的數量。
total_params (int)：模型中的總引數數量。
num_adapter_layers (int)：模型中介面卡層的數量。
enabled (bool, Literal["irregular"])：是否所有介面卡層都已啟用。如果有些啟用而有些未啟用，此值將為 "irregular"。這意味著您的模型處於不一致的狀態，可能無法按預期工作。
active_adapters (list[str], Literal["irregular"])：活動介面卡的名稱。如果活動介面卡在所有層中不一致，此值將為 "irregular"，這意味著您的模型處於不一致的狀態，可能無法按預期工作。
merged_adapters (list[str], Literal["irregular"])：已合併的介面卡的名稱。如果已合併的介面卡在所有層中不一致，此值將為 "irregular"，這意味著您的模型處於不一致的狀態，可能無法按預期工作。
available_adapters (list[str])：可用介面卡的名稱，例如 ["default"]。

get_nb_trainable_parameters

< 來源 >

( )

返回模型中可訓練引數的數量和所有引數的數量。

get_prompt

< 來源 >

( batch_size: int task_ids: Optional[torch.Tensor] = None max_cache_len: Optional[int] = None )

返回用於 Peft 的虛擬提示。僅適用於使用提示學習方法時。

get_prompt_embedding_to_save

< 來源 >

( adapter_name: str )

返回在儲存模型時要儲存的提示嵌入。僅適用於使用提示學習方法時。

load_adapter

< 來源 >

( model_id: Union[str, os.PathLike] adapter_name: str is_trainable: bool = False torch_device: Optional[str] = None autocast_adapter_dtype: bool = True ephemeral_gpu_offload: bool = False low_cpu_mem_usage: bool = False key_mapping: Optional[dict[str, str]] = None **kwargs: Any )

引數

model_id (str or os.PathLike) — 要使用的 PEFT 配置的名稱。可以是以下兩種之一：
- 字串，即 Hugging Face Hub 上模型倉庫中託管的 PEFT 配置的 model id。
- 使用 save_pretrained 方法儲存的包含 PEFT 配置檔案的目錄路徑 (./my_peft_config_directory/)。
adapter_name (str) — 要新增的介面卡的名稱。
is_trainable (bool, optional, 預設為 False) — 介面卡是否應可訓練。如果為 False，介面卡將被凍結，只能用於推理。
torch_device (str, optional, 預設為 None) — 載入介面卡的裝置。如果為 None，將自動推斷裝置。
autocast_adapter_dtype (bool, optional, 預設為 True) — 是否自動轉換介面卡的資料型別。預設為 True。目前，這隻會將使用 float16 和 bfloat16 的介面卡權重轉換為 float32，因為這通常是穩定訓練所必需的，並且隻影響特定的 PEFT 微調器。
ephemeral_gpu_offload (bool, optional, 預設為 False) — 是否對部分載入的模組使用臨時 GPU 解除安裝。預設為 False。
low_cpu_mem_usage (bool, optional, 預設為 False) — 在載入儲存的權重之前，在元裝置上建立空的介面卡權重。有助於加速該過程。
key_mapping (dict, optional, 預設為 None) — 在載入 state_dict 之前應用的 PEFT state_dict 鍵的額外對映。應用此對映時，會預先移除 PEFT 特定的 "base_model.model" 字首，並且尚未插入介面卡名稱（例如 "default"）。僅在您清楚自己在做什麼時才傳遞此引數。
kwargs — (optional): 用於修改介面卡載入方式的附加引數，例如 Hugging Face Hub 的 token。

將訓練好的介面卡載入到模型中。

新介面卡的名稱應該是唯一的。

新介面卡不會自動設定為活動介面卡。使用 PeftModel.set_adapter() 設定活動介面卡。

PEFT

模型

PeftModel

class peft.PeftModel

add_adapter

create_or_update_model_card

delete_adapter

disable_adapter

forward

from_pretrained

get_base_model

get_layer_status

get_model_status

get_nb_trainable_parameters

get_prompt

get_prompt_embedding_to_save

load_adapter

prepare_model_for_gradient_checkpointing

print_trainable_parameters

save_pretrained

set_adapter

PeftModelForSequenceClassification

class peft.PeftModelForSequenceClassification

PeftModelForTokenClassification

class peft.PeftModelForTokenClassification

PeftModelForCausalLM

class peft.PeftModelForCausalLM

PeftModelForSeq2SeqLM

class peft.PeftModelForSeq2SeqLM

PeftModelForQuestionAnswering

class peft.PeftModelForQuestionAnswering

PeftModelForFeatureExtraction

class peft.PeftModelForFeatureExtraction

PeftMixedModel

class peft.PeftMixedModel

add_adapter

disable_adapter

forward

from_pretrained

生成

get_nb_trainable_parameters

load_adapter

merge_and_unload

print_trainable_parameters

set_adapter

unload

實用工具

peft.cast_mixed_precision_params

peft.get_peft_model

peft.inject_adapter_in_model

peft.get_peft_model_state_dict

peft.prepare_model_for_kbit_training

peft.get_layer_status

peft.get_model_status