Transformers 文件

CamemBERT

Transformers

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

CamemBERT

概述

CamemBERT 模型由 Louis Martin、Benjamin Muller、Pedro Javier Ortiz Suárez、Yoann Dupont、Laurent Romary、Éric Villemonte de la Clergerie、Djamé Seddah 和 Benoît Sagot 在論文 CamemBERT: a Tasty French Language Model 中提出。它基於 Facebook 於 2019 年釋出的 RoBERTa 模型。這是一個在 138GB 法語文字上訓練的模型。

論文摘要如下：

預訓練語言模型目前在自然語言處理中無處不在。儘管它們取得了成功，但大多數可用模型要麼是在英語資料上訓練的，要麼是在多種語言資料的拼接上訓練的。這使得這些模型在除英語之外的所有語言中的實際應用非常有限。為了解決法語的這個問題，我們釋出了 CamemBERT，這是一個法語版本的雙向 Transformer 編碼器（BERT）。我們在多個下游任務中衡量了 CamemBERT 相對於多語言模型的效能，這些任務包括詞性標註、依存句法分析、命名實體識別和自然語言推理。CamemBERT 在大多數考慮的任務中都提升了現有技術水平。我們釋出 CamemBERT 的預訓練模型，希望能夠促進法語自然語言處理的研究和下游應用。

此模型由 ALMAnaCH 團隊 (Inria) 貢獻。原始程式碼可以在這裡找到。

此實現與 RoBERTa 相同。有關用法示例以及輸入和輸出的相關資訊，請參閱 RoBERTa 文件。

資源

CamembertConfig

class transformers.CamembertConfig

< 源 >

( vocab_size = 30522 hidden_size = 768 num_hidden_layers = 12 num_attention_heads = 12 intermediate_size = 3072 hidden_act = 'gelu' hidden_dropout_prob = 0.1 attention_probs_dropout_prob = 0.1 max_position_embeddings = 512 type_vocab_size = 2 initializer_range = 0.02 layer_norm_eps = 1e-12 pad_token_id = 1 bos_token_id = 0 eos_token_id = 2 position_embedding_type = 'absolute' use_cache = True classifier_dropout = None **kwargs )

引數

vocab_size (int, 可選, 預設為 30522) — BERT 模型的詞彙表大小。定義了在呼叫 CamembertModel 或 TFCamembertModel 時，可以透過 inputs_ids 表示的不同詞元（token）的數量。
hidden_size (int, 可選, 預設為 768) — 編碼器層和池化層的維度。
num_hidden_layers (int, 可選, 預設為 12) — Transformer 編碼器中的隱藏層數量。
num_attention_heads (int, 可選, 預設為 12) — Transformer 編碼器中每個注意力層的注意力頭數量。
intermediate_size (int, 可選, 預設為 3072) — Transformer 編碼器中“中間層”（通常稱為前饋層）的維度。
hidden_act (str 或 Callable, 可選, 預設為 "gelu") — 編碼器和池化層中的非線性啟用函式（函式或字串）。如果是字串，支援 "gelu"、"relu"、"silu" 和 "gelu_new"。
hidden_dropout_prob (float, 可選, 預設為 0.1) — 嵌入層、編碼器和池化層中所有全連線層的丟棄機率。
attention_probs_dropout_prob (float, 可選, 預設為 0.1) — 注意力機率的丟棄率。
max_position_embeddings (int, 可選, 預設為 512) — 此模型可能使用的最大序列長度。通常將其設定為一個較大的值以備不時之需（例如，512、1024 或 2048）。
type_vocab_size (int, 可選, 預設為 2) — token_type_ids 的詞彙表大小，在呼叫 CamembertModel 或 TFCamembertModel 時傳入。
initializer_range (float, 可選, 預設為 0.02) — 用於初始化所有權重矩陣的截斷正態分佈初始化器的標準差。
layer_norm_eps (float, 可選, 預設為 1e-12) — 層歸一化層使用的 epsilon 值。
position_embedding_type (str, 可選, 預設為 "absolute") — 位置嵌入的型別。從 "absolute"、"relative_key"、"relative_key_query" 中選擇一個。對於位置嵌入，請使用 "absolute"。有關 "relative_key" 的更多資訊，請參閱 Self-Attention with Relative Position Representations (Shaw et al.)。有關 "relative_key_query" 的更多資訊，請參閱 Improve Transformer Models with Better Relative Position Embeddings (Huang et al.) 中的 Method 4。
is_decoder (bool, 可選, 預設為 False) — 模型是否用作解碼器。如果為 False，則模型用作編碼器。
use_cache (bool, 可選, 預設為 True) — 模型是否應返回最後的鍵/值注意力（並非所有模型都使用）。僅在 config.is_decoder=True 時相關。
classifier_dropout (float, 可選) — 分類頭的丟棄率。

這是一個配置類，用於儲存 CamembertModel 或 TFCamembertModel 的配置。它用於根據指定的引數例項化 Camembert 模型，定義模型架構。使用預設值例項化配置將產生與 Camembert almanach/camembert-base 架構類似的配置。

配置物件繼承自 PretrainedConfig，可用於控制模型輸出。有關更多資訊，請閱讀 PretrainedConfig 的文件。

示例

>>> from transformers import CamembertConfig, CamembertModel

>>> # Initializing a Camembert almanach/camembert-base style configuration
>>> configuration = CamembertConfig()

>>> # Initializing a model (with random weights) from the almanach/camembert-base style configuration
>>> model = CamembertModel(configuration)

>>> # Accessing the model configuration
>>> configuration = model.config

Transformers

CamemBERT

概述

資源

CamembertConfig

class transformers.CamembertConfig

CamembertTokenizer

class transformers.CamembertTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

CamembertTokenizerFast

class transformers.CamembertTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

CamembertModel

class transformers.CamembertModel

forward

CamembertForCausalLM

class transformers.CamembertForCausalLM

forward

CamembertForMaskedLM

class transformers.CamembertForMaskedLM

forward

CamembertForSequenceClassification

class transformers.CamembertForSequenceClassification

forward

CamembertForMultipleChoice

class transformers.CamembertForMultipleChoice

forward

CamembertForTokenClassification

class transformers.CamembertForTokenClassification

forward

CamembertForQuestionAnswering

class transformers.CamembertForQuestionAnswering

forward

TFCamembertModel

class transformers.TFCamembertModel

呼叫

TFCamembertForCausalLM

class transformers.TFCamembertForCausalLM

呼叫

TFCamembertForMaskedLM

class transformers.TFCamembertForMaskedLM

呼叫

TFCamembertForSequenceClassification

class transformers.TFCamembertForSequenceClassification

呼叫

TFCamembertForMultipleChoice

class transformers.TFCamembertForMultipleChoice

呼叫

TFCamembertForTokenClassification

class transformers.TFCamembertForTokenClassification

呼叫

TFCamembertForQuestionAnswering

class transformers.TFCamembertForQuestionAnswering

呼叫