推理提供商文件
文字到影像
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
文字到影像
根據給定的文字提示生成影像。
有關 `text-to-image` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。
推薦模型
- black-forest-labs/FLUX.1-dev:最強大的影像生成模型之一,可以生成逼真的輸出。
- latent-consistency/lcm-lora-sdxl:一個強大而快速的影像生成模型。
- Kwai-Kolors/Kolors:用於逼真影像生成的文字到影像模型。
- stabilityai/stable-diffusion-3-medium-diffusers:一個強大的文字到影像模型。
在此處探索所有可用模型,找到最適合您的模型。
使用 API
語言
客戶端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="fal-ai",
api_key=os.environ["HF_TOKEN"],
)
# output is a PIL.Image object
image = client.text_to_image(
"Astronaut riding a horse",
model="Qwen/Qwen-Image",
)
API 規範
請求
標頭 | ||
---|---|---|
授權 | 字串 | 認證頭格式為 `Bearer: hf_****`,其中 `hf_****` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。 |
有效負載 | ||
---|---|---|
inputs* | 字串 | 輸入文字資料(有時稱為“提示”) |
引數 | 物件 | |
guidance_scale | 數字 | 更高的指導尺度值會促使模型生成與文字提示緊密相關的影像,但過高的值可能會導致飽和和其他偽影。 |
negative_prompt | 字串 | 一個提示,用於指導影像生成中不應包含的內容。 |
num_inference_steps | 整數 | 去噪步數。更多的去噪步數通常會帶來更高質量的影像,但推理速度會變慢。 |
width | 整數 | 輸出影像的寬度(畫素) |
height | 整數 | 輸出影像的高度(畫素) |
scheduler | 字串 | 用相容的排程器覆蓋當前排程器。 |
seed | 整數 | 隨機數生成器的種子。 |
響應
正文 | ||
---|---|---|
image | 未知 | 生成的影像以原始位元組的形式在負載中返回。 |