文字生成

根據提示生成文字。

如果您對基於訊息列表生成響應的聊天補全任務感興趣，請檢視 chat-completion 任務。

有關 `text-generation` 任務的更多詳細資訊，請檢視其專用頁面！您將找到示例和相關材料。

使用 API

語言

客戶端

提供商

設定

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="featherless-ai",
    api_key=os.environ["HF_TOKEN"],
)

completion = client.chat.completions.create(
    model="moonshotai/Kimi-K2-Instruct",
    messages="\"Can you please let us know more details about your \"",
)

print(completion.choices[0].message)

API 規範

請求

標頭
授權	字串	認證頭採用 `Bearer: hf_**` 形式，其中 `hf_**` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。

有效負載
輸入*	字串
引數	物件
adapter_id	字串	Lora 介面卡 ID
best_of	整數	生成 best_of 序列並返回其中令牌 logprobs 最高的那個。
decoder_input_details	布林值	是否返回解碼器輸入令牌 logprobs 和 ID。
details	布林值	是否返回生成詳情。
do_sample	布林值	啟用 logits 取樣。
frequency_penalty	數字	頻率懲罰的引數。1.0 表示沒有懲罰。根據新令牌在文字中已有的頻率進行懲罰，降低模型逐字重複相同行的可能性。
grammar	未知	以下之一
(#1)	物件
型別*	列舉	可能值：json。
值*	未知	表示JSON Schema的字串。JSON Schema 是一種宣告性語言，允許用型別和描述來註釋 JSON 文件。
(#2)	物件
型別*	列舉	可能值：regex。
值*	字串
(#3)	物件
型別*	列舉	可能值：json_schema。
值*	物件
名稱	字串	模式的可選名稱識別符號
schema*	未知	實際的 JSON 模式定義
max_new_tokens	整數	要生成的最大令牌數。
repetition_penalty	數字	重複懲罰的引數。1.0 表示沒有懲罰。有關更多詳細資訊，請參閱這篇論文。
return_full_text	布林值	是否將提示前置於生成的文字。
seed	整數	隨機取樣種子。
stop	字串陣列	如果生成了 `stop` 成員，則停止生成令牌。
temperature	數字	用於調節 logits 分佈的值。
top_k	整數	保留用於 top-k 過濾的最高機率詞彙 token 數量。
top_n_tokens	整數	用於 top-n 過濾的最高機率詞彙令牌數量。
top_p	數字	核心取樣的 Top-p 值。
truncate	整數	將輸入令牌截斷到給定大小。
typical_p	數字	典型解碼質量。有關更多資訊，請參閱《自然語言生成的典型解碼》。
watermark	布林值	使用大型語言模型水印進行水印。
流	布林值

響應

輸出型別取決於 `stream` 輸入引數。如果 `stream` 為 `false`（預設），則響應將是具有以下欄位的 JSON 物件：

正文
詳情	物件
best_of_sequences	物件陣列
finish_reason	列舉	可能值：長度、eos_token、stop_sequence。
generated_text	字串
generated_tokens	整數
prefill	物件陣列
ID	整數
logprob	數字
文字	字串
種子	整數
tokens	物件陣列
ID	整數
logprob	數字
特殊	布林值
文字	字串
top_tokens	陣列[]
ID	整數
logprob	數字
特殊	布林值
文字	字串
finish_reason	列舉	可能值：長度、eos_token、stop_sequence。
generated_tokens	整數
prefill	物件陣列
ID	整數
logprob	數字
文字	字串
seed	整數
tokens	物件陣列
ID	整數
logprob	數字
特殊	布林值
文字	字串
top_tokens	陣列[]
ID	整數
logprob	數字
特殊	布林值
文字	字串
生成的文字	字串

如果 `stream` 為 `true`，生成的令牌將作為流返回，使用伺服器傳送事件 (SSE)。有關流的更多資訊，請檢視本指南。

正文
詳情	物件
finish_reason	列舉	可能值：長度、eos_token、stop_sequence。
generated_tokens	整數
input_length	整數
seed	整數
生成的文字	字串
索引	整數
token	物件
ID	整數
logprob	數字
特殊	布林值
文字	字串
top_tokens	物件陣列
ID	整數
logprob	數字
特殊	布林值
文字	字串

< > 在 GitHub 上更新

推理服務提供商

文字生成

推薦模型

使用 API

API 規範

請求

響應