Transformers.js 文件
處理器
您正在檢視的是需要從原始碼安裝。如果您想使用常規的 npm 安裝,請檢視最新的穩定版本(v3.0.0)。
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
處理器
處理器用於為模型準備輸入(例如文字、影像或音訊)。
示例: 使用 WhisperProcessor 為模型準備音訊輸入。
import { AutoProcessor, read_audio } from '@huggingface/transformers';
const processor = await AutoProcessor.from_pretrained('openai/whisper-tiny.en');
const audio = await read_audio('https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac', 16000);
const { input_features } = await processor(audio);
// Tensor {
// data: Float32Array(240000) [0.4752984642982483, 0.5597258806228638, 0.56434166431427, ...],
// dims: [1, 80, 3000],
// type: 'float32',
// size: 240000,
// }- 處理器
- 靜態
- .Processor
new Processor(config, components, chat_template)- 例項
.image_processor⇒*.tokenizer⇒PreTrainedTokenizer|undefined.feature_extractor⇒*.apply_chat_template(messages, options)⇒*.batch_decode(...args)⇒*.decode(...args)⇒*._call(input, ...args)⇒Promise.<any>
- 靜態
.from_pretrained(pretrained_model_name_or_path, options)⇒Promise.<Processor>
- .Processor
- 內部
~PreTrainedTokenizer:Object
- 靜態
processors.Processor
表示一個從輸入中提取特徵的處理器。
型別:processors 的靜態類
- .Processor
new Processor(config, components, chat_template)- 例項
.image_processor⇒*.tokenizer⇒PreTrainedTokenizer|undefined.feature_extractor⇒*.apply_chat_template(messages, options)⇒*.batch_decode(...args)⇒*.decode(...args)⇒*._call(input, ...args)⇒Promise.<any>
- 靜態
.from_pretrained(pretrained_model_name_or_path, options)⇒Promise.<Processor>
new Processor(config, components, chat_template)
使用給定的元件建立一個新的處理器
| 引數量 | 型別 |
|---|---|
| config | Object |
| components | Record.<string, Object> |
| chat_template | 字串 |
processor.image_processor ⇒ <code> * </code>
型別:Processor 的例項屬性
返回:* - 處理器的影像處理器(如果存在)。
processor.tokenizer ⇒ <code> PreTrainedTokenizer </code> | <code> undefined </code>
型別:Processor 的例項屬性
返回:PreTrainedTokenizer | undefined - 處理器的分詞器(如果存在)。
processor.feature_extractor ⇒ <code> * </code>
型別:Processor 的例項屬性
返回:* - 處理器的特徵提取器(如果存在)。
processor.apply_chat_template(messages, options) ⇒ <code> * </code>
型別:Processor 的例項方法
| 引數量 | 型別 |
|---|---|
| messages | * |
| 選項 | * |
processor.batch_decode(...args) ⇒ <code> * </code>
型別:Processor 的例項方法
| 引數量 | 型別 |
|---|---|
| ...args | * |
processor.decode(...args) ⇒ <code> * </code>
型別:Processor 的例項方法
| 引數量 | 型別 |
|---|---|
| ...args | * |
processor._call(input, ...args) ⇒ <code> Promise. < any > </code>
使用給定的輸入呼叫 feature_extractor 函式。
型別:Processor 的例項方法
返回:Promise.<any> - 一個解析為提取的特徵的 Promise。
| 引數量 | 型別 | 描述 |
|---|---|---|
| input | 任何 | 要從中提取特徵的輸入。 |
| ...args | 任何 | 附加引數。 |
Processor.from_pretrained(pretrained_model_name_or_path, options) ⇒ <code> Promise. < Processor > </code>
從預訓練模型中例項化庫中的一個處理器類。
要例項化的處理器類是根據配置物件的 image_processor_type(或舊版的 feature_extractor_type)屬性選擇的(既可以作為引數傳入,也可以在可能的情況下從 pretrained_model_name_or_path 載入)
型別:Processor 的靜態方法
返回:Promise.<Processor> - Processor 類的新例項。
| 引數量 | 型別 | 描述 |
|---|---|---|
| pretrained_model_name_or_path | 字串 | 預訓練模型的名稱或路徑。可以是
|
| 選項 | PretrainedProcessorOptions | 載入處理器的附加選項。 |
processors~PreTrainedTokenizer : <code> Object </code>
附加的特定於處理器的屬性。
型別:processors 的內部型別定義
< > 在 GitHub 上更新