推理提供商文件

文字生成

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

文字生成

根據提示生成文字。

如果您對基於訊息列表生成響應的聊天補全任務感興趣,請檢視 chat-completion 任務。

有關 `text-generation` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。

推薦模型

在此處探索所有可用模型並找到最適合您的模型。

使用 API

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="featherless-ai",
    api_key=os.environ["HF_TOKEN"],
)

completion = client.chat.completions.create(
    model="moonshotai/Kimi-K2-Instruct",
    messages="\"Can you please let us know more details about your \"",
)

print(completion.choices[0].message)

API 規範

請求

標頭
授權 字串 認證頭採用 `Bearer: hf_****` 形式,其中 `hf_****` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。
有效負載
輸入* 字串
引數 物件
        adapter_id 字串 Lora 介面卡 ID
        best_of 整數 生成 best_of 序列並返回其中令牌 logprobs 最高的那個。
        decoder_input_details 布林值 是否返回解碼器輸入令牌 logprobs 和 ID。
        details 布林值 是否返回生成詳情。
        do_sample 布林值 啟用 logits 取樣。
        frequency_penalty 數字 頻率懲罰的引數。1.0 表示沒有懲罰。根據新令牌在文字中已有的頻率進行懲罰,降低模型逐字重複相同行的可能性。
        grammar 未知 以下之一
                 (#1) 物件
                        型別* 列舉 可能值:json。
                        值* 未知 表示JSON Schema的字串。JSON Schema 是一種宣告性語言,允許用型別和描述來註釋 JSON 文件。
                 (#2) 物件
                        型別* 列舉 可能值:regex。
                        值* 字串
                 (#3) 物件
                        型別* 列舉 可能值:json_schema。
                        值* 物件
                                名稱 字串 模式的可選名稱識別符號
                                schema* 未知 實際的 JSON 模式定義
        max_new_tokens 整數 要生成的最大令牌數。
        repetition_penalty 數字 重複懲罰的引數。1.0 表示沒有懲罰。有關更多詳細資訊,請參閱這篇論文
        return_full_text 布林值 是否將提示前置於生成的文字。
        seed 整數 隨機取樣種子。
        stop 字串陣列 如果生成了 `stop` 成員,則停止生成令牌。
        temperature 數字 用於調節 logits 分佈的值。
        top_k 整數 保留用於 top-k 過濾的最高機率詞彙 token 數量。
        top_n_tokens 整數 用於 top-n 過濾的最高機率詞彙令牌數量。
        top_p 數字 核心取樣的 Top-p 值。
        truncate 整數 將輸入令牌截斷到給定大小。
        typical_p 數字 典型解碼質量。有關更多資訊,請參閱《自然語言生成的典型解碼》
        watermark 布林值 使用大型語言模型水印進行水印。
布林值

響應

輸出型別取決於 `stream` 輸入引數。如果 `stream` 為 `false`(預設),則響應將是具有以下欄位的 JSON 物件:

正文
詳情 物件
        best_of_sequences 物件陣列
                finish_reason 列舉 可能值:長度、eos_token、stop_sequence。
                generated_text 字串
                generated_tokens 整數
                prefill 物件陣列
                        ID 整數
                        logprob 數字
                        文字 字串
                種子 整數
                tokens 物件陣列
                        ID 整數
                        logprob 數字
                        特殊 布林值
                        文字 字串
                top_tokens 陣列[]
                        ID 整數
                        logprob 數字
                        特殊 布林值
                        文字 字串
        finish_reason 列舉 可能值:長度、eos_token、stop_sequence。
        generated_tokens 整數
        prefill 物件陣列
                ID 整數
                logprob 數字
                文字 字串
        seed 整數
        tokens 物件陣列
                ID 整數
                logprob 數字
                特殊 布林值
                文字 字串
        top_tokens 陣列[]
                ID 整數
                logprob 數字
                特殊 布林值
                文字 字串
生成的文字 字串

如果 `stream` 為 `true`,生成的令牌將作為流返回,使用伺服器傳送事件 (SSE)。有關流的更多資訊,請檢視本指南

正文
詳情 物件
        finish_reason 列舉 可能值:長度、eos_token、stop_sequence。
        generated_tokens 整數
        input_length 整數
        seed 整數
生成的文字 字串
索引 整數
token 物件
        ID 整數
        logprob 數字
        特殊 布林值
        文字 字串
top_tokens 物件陣列
        ID 整數
        logprob 數字
        特殊 布林值
        文字 字串
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.