文字到影像

根據給定的文字提示生成影像。

有關 `text-to-image` 任務的更多詳細資訊，請檢視其專用頁面！您將找到示例和相關材料。

使用 API

語言

客戶端

提供商

設定

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="fal-ai",
    api_key=os.environ["HF_TOKEN"],
)

# output is a PIL.Image object
image = client.text_to_image(
    "Astronaut riding a horse",
    model="Qwen/Qwen-Image",
)

API 規範

請求

標頭
授權	字串	認證頭格式為 `Bearer: hf_**`，其中 `hf_**` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。

有效負載
inputs*	字串	輸入文字資料（有時稱為“提示”）
引數	物件
guidance_scale	數字	更高的指導尺度值會促使模型生成與文字提示緊密相關的影像，但過高的值可能會導致飽和和其他偽影。
negative_prompt	字串	一個提示，用於指導影像生成中不應包含的內容。
num_inference_steps	整數	去噪步數。更多的去噪步數通常會帶來更高質量的影像，但推理速度會變慢。
width	整數	輸出影像的寬度（畫素）
height	整數	輸出影像的高度（畫素）
scheduler	字串	用相容的排程器覆蓋當前排程器。
seed	整數	隨機數生成器的種子。

響應

正文
image	未知	生成的影像以原始位元組的形式在負載中返回。

< > 在 GitHub 上更新

推理服務提供商

文字到影像

推薦模型

使用 API

API 規範

請求

響應