模型 - Hugging Face 文件

class lighteval.models.abstract_model.LightevalModel

< 原始碼 >

( )

清理

< 原始碼 >

( )

如有需要，執行清理操作，例如關閉端點。

greedy_until

< 原始碼 >

( requests: list ) → list[GenerativeResponse]

引數

requests (list[Request]) — 包含上下文和終止條件的請求列表。
disable_tqdm (bool, 可選) — 是否停用進度條。預設為 False。
override_bs (int, 可選) — 覆蓋生成的批處理大小。預設為 None。

返回

list[GenerativeResponse]

生成的響應列表。

使用貪婪解碼策略生成響應，直到滿足某些終止條件。

greedy_until_multi_turn

< 原始碼 >

( requests: list )

使用貪婪解碼策略生成響應，直到滿足某些終止條件。

loglikelihood

< 原始碼 >

( requests: list )

對上下文和續寫進行分詞，並計算這些分詞序列的對數似然。

loglikelihood_rolling

< 原始碼 >

( requests: list )

此函式用於計算上下文的對數似然，以用於困惑度指標。

loglikelihood_single_token

< 原始碼 >

( requests: list )

對上下文和續寫進行分詞，並計算這些分詞序列的對數似然。

tok_encode_pair

< 原始碼 >

( context continuation pairwise: bool = False ) → Tuple[TokenSequence, TokenSequence]

引數

context (str) — 待編碼的上下文字串。
continuation (str) — 待編碼的續寫字串。
pairwise (bool) — 如果為 True，則分別對上下文和續寫進行編碼。如果為 False，則將它們一起編碼然後拆分。

返回

Tuple[TokenSequence, TokenSequence]

包含已編碼的上下文和續寫的元組。

透過處理中間的空格來編碼上下文和續寫對。

成對編碼（pairwise）的優勢是：1）它能更好地與 LLM 預測詞元的方式對齊；2）在 len(tok(context,cont)) != len(tok(context)) + len(tok(continuation)) 的情況下也能正常工作。例如，如果中文的上下文和續寫之間沒有使用空格，就可能出現這種情況。

class lighteval.models.transformers.transformers_model.TransformersModelConfig

< 原始碼 >

( generation_parameters: GenerationParameters = GenerationParameters(early_stopping=None, repetition_penalty=None, frequency_penalty=None, length_penalty=None, presence_penalty=None, max_new_tokens=None, min_new_tokens=None, seed=None, stop_tokens=None, temperature=None, top_k=None, min_p=None, top_p=None, truncate_prompt=None, response_format=None) model_name: str tokenizer: str | None = None subfolder: str | None = None revision: str = 'main' batch_size: typing.Optional[typing.Annotated[int, Gt(gt=0)]] = None generation_size: typing.Annotated[int, Gt(gt=0)] = 256 max_length: typing.Optional[typing.Annotated[int, Gt(gt=0)]] = None add_special_tokens: bool = True model_parallel: bool | None = None dtype: str | None = None device: typing.Union[int, str] = 'cuda' trust_remote_code: bool = False use_chat_template: bool = False compile: bool = False multichoice_continuations_start_space: bool | None = None pairwise_tokenization: bool = False )

引數

model_name (str) — HuggingFace Hub 模型 ID 名稱或要載入的預訓練模型的路徑。這實際上是 HuggingFace `transformers` API 中 `from_pretrained` 的 `pretrained_model_name_or_path` 引數。
accelerator (Accelerator) — 用於模型訓練的加速器。
tokenizer (Optional[str]) — 用於分詞的 HuggingFace Hub 分詞器 ID。
multichoice_continuations_start_space (Optional[bool]) — 在多項選擇生成中，是否在每個續寫的開頭新增空格。例如，上下文：“法國的首都是什麼？”以及選項：“巴黎”、“倫敦”。將被分詞為：“法國的首都是什麼？巴黎”和“法國的首都是什麼？倫敦”。True 表示新增空格，False 表示去除空格，None 表示不作任何操作。
pairwise_tokenization (bool) — 是將上下文和續寫分開分詞還是一起分詞。
subfolder (Optional[str]) — 模型倉庫中的子資料夾。
revision (str) — 模型的版本。
batch_size (int) — 用於模型訓練的批處理大小。
max_gen_toks (Optional[int]) — 要生成的最大詞元數量。
max_length (Optional[int]) — 生成輸出的最大長度。
add_special_tokens (bool, 可選, 預設為 True) — 是否向輸入序列新增特殊詞元。如果為 `None`，對於 seq2seq 模型（例如 T5），預設值將設定為 `True`，對於因果模型則為 `False`。
model_parallel (bool, 可選, 預設為 None) — True/False: 強制使用或不使用 `accelerate` 庫在多個裝置上載入大型模型。預設值：None，對應於比較程序數與 GPU 數量。如果程序數較少 => 使用模型並行，否則不使用。
dtype (Union[str, torch.dtype], 可選, 預設為 None) —): 如果指定，將模型權重轉換為 `dtype`。字串會轉換為 `torch.dtype` 物件（例如，`float16` -> `torch.float16`）。使用 `dtype="auto"` 從模型的權重中推斷型別。
device (Union[int, str]) — 用於模型訓練的裝置。
quantization_config (Optional[BitsAndBytesConfig]) — 模型的量化配置，手動提供以載入一個通常為浮點數的模型，並以量化精度載入。對於 4 位和 8 位精度是必需的。
trust_remote_code (bool) — 在模型載入期間是否信任遠端程式碼。
generation_parameters (GenerationParameters) — 將影響生成的引數範圍。
generation_config (GenerationConfig) — GenerationConfig 物件（僅在手動建立期間傳遞）

模型的基礎配置類。

方法：post_init(): 對配置執行後初始化檢查。_init_configs(model_name, env_config): 初始化模型配置。init_configs(env_config): 使用環境配置初始化模型配置。get_model_sha(): 檢索模型的 SHA。

class lighteval.models.transformers.transformers_model.TransformersModel

< 原始碼 >

( config: TransformersModelConfig )

greedy_until

< 原始碼 >

( requests: list ) → list[GenerativeResponse]

引數

requests (list[Request]) — 包含上下文和終止條件的請求列表。
override_bs (int, 可選) — 覆蓋生成的批處理大小。預設為 None。

返回

list[GenerativeResponse]

生成的響應列表。

使用貪婪解碼策略生成響應，直到滿足某些終止條件。

init_model_parallel

< 原始碼 >

( model_parallel: bool | None = None )

計算所有與 model_parallel 相關的引數

loglikelihood

< 原始碼 >

( requests: list ) → list[Tuple[float, bool]]

引數

requests (list[Tuple[str, dict]]) — *描述*

返回

list[Tuple[float, bool]]

描述

對上下文和續寫進行分詞，並計算這些分詞序列的對數似然。

loglikelihood_single_token

< 原始碼 >

( requests: list ) → list[Tuple[float, bool]]

引數

requests (list[Tuple[str, dict]]) — *描述*

返回

list[Tuple[float, bool]]

描述

對上下文和續寫進行分詞，並計算這些分詞序列的對數似然。

Lighteval

模型

模型

LightevalModel

class lighteval.models.abstract_model.LightevalModel

清理

greedy_until

greedy_until_multi_turn

loglikelihood

loglikelihood_rolling

loglikelihood_single_token

tok_encode_pair

Accelerate 和 Transformers 模型

TransformersModel

class lighteval.models.transformers.transformers_model.TransformersModelConfig

class lighteval.models.transformers.transformers_model.TransformersModel

greedy_until

init_model_parallel

loglikelihood

loglikelihood_single_token

pad_and_gather

prepare_batch_logprob

AdapterModel

class lighteval.models.transformers.adapter_model.AdapterModelConfig

class lighteval.models.transformers.adapter_model.AdapterModel

DeltaModel

class lighteval.models.transformers.delta_model.DeltaModelConfig

class lighteval.models.transformers.delta_model.DeltaModel

基於端點的模型

InferenceEndpointModel

class lighteval.models.endpoints.endpoint_model.InferenceEndpointModelConfig

class lighteval.models.endpoints.endpoint_model.ServerlessEndpointModelConfig

class lighteval.models.endpoints.endpoint_model.InferenceEndpointModel

TGI ModelClient

class lighteval.models.endpoints.tgi_model.TGIModelConfig

class lighteval.models.endpoints.tgi_model.ModelClient

自定義模型

class lighteval.models.custom.custom_model.CustomModelConfig

Open AI 模型

class lighteval.models.endpoints.openai_model.OpenAIClient

greedy_until

VLLM 模型

VLLMModel

class lighteval.models.vllm.vllm_model.VLLMModelConfig

class lighteval.models.vllm.vllm_model.VLLMModel

greedy_until