推理提供商文件
文字生成
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
文字生成
根據提示生成文字。
如果您對基於訊息列表生成響應的聊天補全任務感興趣,請檢視 chat-completion
任務。
有關 `text-generation` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。
推薦模型
- google/gemma-2-2b-it: 一個經過訓練以遵循指令的文字生成模型。
- deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B: 最強大模型之一的較小變體。
- meta-llama/Meta-Llama-3.1-8B-Instruct: 一個經過訓練以遵循指令的非常強大的文字生成模型。
- microsoft/phi-4: 微軟開發的強大文字生成模型。
- simplescaling/s1.1-32B: 一個具有推理能力的非常強大的模型。
- Qwen/Qwen2.5-7B-Instruct-1M: 支援非常長指令的強大對話模型。
- Qwen/Qwen2.5-Coder-32B-Instruct: 用於編寫程式碼的文字生成模型。
- deepseek-ai/DeepSeek-R1: 強大的基於推理的開源大型語言模型。
在此處探索所有可用模型並找到最適合您的模型。
使用 API
語言
客戶端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="featherless-ai",
api_key=os.environ["HF_TOKEN"],
)
completion = client.chat.completions.create(
model="moonshotai/Kimi-K2-Instruct",
messages="\"Can you please let us know more details about your \"",
)
print(completion.choices[0].message)
API 規範
請求
標頭 | ||
---|---|---|
授權 | 字串 | 認證頭採用 `Bearer: hf_****` 形式,其中 `hf_****` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。 |
有效負載 | ||
---|---|---|
輸入* | 字串 | |
引數 | 物件 | |
adapter_id | 字串 | Lora 介面卡 ID |
best_of | 整數 | 生成 best_of 序列並返回其中令牌 logprobs 最高的那個。 |
decoder_input_details | 布林值 | 是否返回解碼器輸入令牌 logprobs 和 ID。 |
details | 布林值 | 是否返回生成詳情。 |
do_sample | 布林值 | 啟用 logits 取樣。 |
frequency_penalty | 數字 | 頻率懲罰的引數。1.0 表示沒有懲罰。根據新令牌在文字中已有的頻率進行懲罰,降低模型逐字重複相同行的可能性。 |
grammar | 未知 | 以下之一 |
(#1) | 物件 | |
型別* | 列舉 | 可能值:json。 |
值* | 未知 | 表示JSON Schema的字串。JSON Schema 是一種宣告性語言,允許用型別和描述來註釋 JSON 文件。 |
(#2) | 物件 | |
型別* | 列舉 | 可能值:regex。 |
值* | 字串 | |
(#3) | 物件 | |
型別* | 列舉 | 可能值:json_schema。 |
值* | 物件 | |
名稱 | 字串 | 模式的可選名稱識別符號 |
schema* | 未知 | 實際的 JSON 模式定義 |
max_new_tokens | 整數 | 要生成的最大令牌數。 |
repetition_penalty | 數字 | 重複懲罰的引數。1.0 表示沒有懲罰。有關更多詳細資訊,請參閱這篇論文。 |
return_full_text | 布林值 | 是否將提示前置於生成的文字。 |
seed | 整數 | 隨機取樣種子。 |
stop | 字串陣列 | 如果生成了 `stop` 成員,則停止生成令牌。 |
temperature | 數字 | 用於調節 logits 分佈的值。 |
top_k | 整數 | 保留用於 top-k 過濾的最高機率詞彙 token 數量。 |
top_n_tokens | 整數 | 用於 top-n 過濾的最高機率詞彙令牌數量。 |
top_p | 數字 | 核心取樣的 Top-p 值。 |
truncate | 整數 | 將輸入令牌截斷到給定大小。 |
typical_p | 數字 | 典型解碼質量。有關更多資訊,請參閱《自然語言生成的典型解碼》。 |
watermark | 布林值 | 使用大型語言模型水印進行水印。 |
流 | 布林值 |
響應
輸出型別取決於 `stream` 輸入引數。如果 `stream` 為 `false`(預設),則響應將是具有以下欄位的 JSON 物件:
正文 | ||
---|---|---|
詳情 | 物件 | |
best_of_sequences | 物件陣列 | |
finish_reason | 列舉 | 可能值:長度、eos_token、stop_sequence。 |
generated_text | 字串 | |
generated_tokens | 整數 | |
prefill | 物件陣列 | |
ID | 整數 | |
logprob | 數字 | |
文字 | 字串 | |
種子 | 整數 | |
tokens | 物件陣列 | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 | |
top_tokens | 陣列[] | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 | |
finish_reason | 列舉 | 可能值:長度、eos_token、stop_sequence。 |
generated_tokens | 整數 | |
prefill | 物件陣列 | |
ID | 整數 | |
logprob | 數字 | |
文字 | 字串 | |
seed | 整數 | |
tokens | 物件陣列 | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 | |
top_tokens | 陣列[] | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 | |
生成的文字 | 字串 |
如果 `stream` 為 `true`,生成的令牌將作為流返回,使用伺服器傳送事件 (SSE)。有關流的更多資訊,請檢視本指南。
正文 | ||
---|---|---|
詳情 | 物件 | |
finish_reason | 列舉 | 可能值:長度、eos_token、stop_sequence。 |
generated_tokens | 整數 | |
input_length | 整數 | |
seed | 整數 | |
生成的文字 | 字串 | |
索引 | 整數 | |
token | 物件 | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 | |
top_tokens | 物件陣列 | |
ID | 整數 | |
logprob | 數字 | |
特殊 | 布林值 | |
文字 | 字串 |