Transformers.js 文件

處理器

您正在檢視的是需要從原始碼安裝。如果您想使用常規的 npm 安裝,請檢視最新的穩定版本(v3.0.0)。
Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

處理器

處理器用於為模型準備輸入(例如文字、影像或音訊)。

示例: 使用 WhisperProcessor 為模型準備音訊輸入。

import { AutoProcessor, read_audio } from '@huggingface/transformers';

const processor = await AutoProcessor.from_pretrained('openai/whisper-tiny.en');
const audio = await read_audio('https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac', 16000);
const { input_features } = await processor(audio);
// Tensor {
//   data: Float32Array(240000) [0.4752984642982483, 0.5597258806228638, 0.56434166431427, ...],
//   dims: [1, 80, 3000],
//   type: 'float32',
//   size: 240000,
// }

processors.Processor

表示一個從輸入中提取特徵的處理器。

型別processors 的靜態類


new Processor(config, components, chat_template)

使用給定的元件建立一個新的處理器

引數量型別
configObject
componentsRecord.<string, Object>
chat_template字串

processor.image_processor ⇒ <code> * </code>

型別Processor 的例項屬性
返回* - 處理器的影像處理器(如果存在)。


processor.tokenizer ⇒ <code> PreTrainedTokenizer </code> | <code> undefined </code>

型別Processor 的例項屬性
返回PreTrainedTokenizer | undefined - 處理器的分詞器(如果存在)。


processor.feature_extractor ⇒ <code> * </code>

型別Processor 的例項屬性
返回* - 處理器的特徵提取器(如果存在)。


processor.apply_chat_template(messages, options) ⇒ <code> * </code>

型別Processor 的例項方法

引數量型別
messages*
選項*

processor.batch_decode(...args) ⇒ <code> * </code>

型別Processor 的例項方法

引數量型別
...args*

processor.decode(...args) ⇒ <code> * </code>

型別Processor 的例項方法

引數量型別
...args*

processor._call(input, ...args) ⇒ <code> Promise. < any > </code>

使用給定的輸入呼叫 feature_extractor 函式。

型別Processor 的例項方法
返回Promise.<any> - 一個解析為提取的特徵的 Promise。

引數量型別描述
input任何

要從中提取特徵的輸入。

...args任何

附加引數。


Processor.from_pretrained(pretrained_model_name_or_path, options) ⇒ <code> Promise. < Processor > </code>

從預訓練模型中例項化庫中的一個處理器類。

要例項化的處理器類是根據配置物件的 image_processor_type(或舊版的 feature_extractor_type)屬性選擇的(既可以作為引數傳入,也可以在可能的情況下從 pretrained_model_name_or_path 載入)

型別Processor 的靜態方法
返回Promise.<Processor> - Processor 類的新例項。

引數量型別描述
pretrained_model_name_or_path字串

預訓練模型的名稱或路徑。可以是

  • 一個字串,即託管在 huggingface.co 模型倉庫中的預訓練處理器的模型 ID。有效的模型 ID 可以位於根級別,如 bert-base-uncased,也可以在使用者或組織名稱下命名,如 dbmdz/bert-base-german-cased
  • 一個指向包含處理器檔案的目錄的路徑,例如,./my_model_directory/
選項PretrainedProcessorOptions

載入處理器的附加選項。


processors~PreTrainedTokenizer : <code> Object </code>

附加的特定於處理器的屬性。

型別processors 的內部型別定義


< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.