元資料解析

鑑於該格式的簡潔性，使用小範圍的（Range）HTTP 請求來獲取和解析 Safetensors 權重的元資料（即張量列表、它們的型別、形狀或引數數量）非常簡單和高效。

此解析功能已在 huggingface.js 中用 JS 實現（示例程式碼如下），但在任何其他語言中實現也類似。

用例示例

可能會有很多潛在的用例。例如，我們在 Hugging Face Hub 上使用它來顯示具有 safetensors 權重的模型資訊。

http

javascript

python

例如，這裡是 Hugging Face Hub 上一些模型按 dtype 分類的引數數量。更多用法示例，請參見此 issue。

模型	safetensors	引數
gpt2	單檔案	{ ‘F32’ => 137022720 }
roberta-base	單檔案	{ ‘F32’ => 124697433, ‘I64’ => 514 }
Jean-Baptiste/camembert-ner	單檔案	{ ‘F32’ => 110035205, ‘I64’ => 514 }
roberta-large	單檔案	{ ‘F32’ => 355412057, ‘I64’ => 514 }
distilbert-base-german-cased	單檔案	{ ‘F32’ => 67431550 }
EleutherAI/gpt-neox-20b	分片	{ ‘F16’ => 20554568208, ‘U8’ => 184549376 }
bigscience/bloom-560m	單檔案	{ ‘F16’ => 559214592 }
bigscience/bloom	分片	{ ‘BF16’ => 176247271424 }
bigscience/bloom-3b	單檔案	{ ‘F16’ => 3002557440 }