AutoTrain 文件

表格分類/迴歸

您正在檢視的是需要從原始碼安裝。如果您想透過 pip 常規安裝,請檢視最新的穩定版本 (v0.8.24)。
Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

表格分類/迴歸

使用 AutoTrain,您可以輕鬆地訓練一個模型來對錶格資料進行分類或迴歸。您需要做的就是從模型列表中選擇一個模型並上傳您的資料集。引數調整是自動完成的。

模型

以下模型可用於表格分類/迴歸。

  • xgboost
  • random_forest
  • ridge
  • logistic_regression
  • svm
  • extra_trees
  • gradient_boosting
  • adaboost
  • decision_tree
  • knn

資料格式

id,category1,category2,feature1,target
1,A,X,0.3373961604172684,1
2,B,Z,0.6481718720511972,0
3,A,Y,0.36824153984054797,1
4,B,Z,0.9571551589530464,1
5,B,Z,0.14035078041264515,1
6,C,X,0.8700872583584364,1
7,A,Y,0.4736080452737105,0
8,C,Y,0.8009107519796442,1
9,A,Y,0.5204774795512048,0
10,A,Y,0.6788795301189603,0
.
.
.

您的 CSV 資料集必須包含兩列: idtarget

引數

class autotrain.trainers.tabular.params.TabularParams

< >

( data_path: str = None model: str = 'xgboost' username: typing.Optional[str] = None seed: int = 42 train_split: str = 'train' valid_split: typing.Optional[str] = None project_name: str = 'project-name' token: typing.Optional[str] = None push_to_hub: bool = False id_column: str = 'id' target_columns: typing.Union[typing.List[str], str] = ['target'] categorical_columns: typing.Optional[typing.List[str]] = None numerical_columns: typing.Optional[typing.List[str]] = None task: str = 'classification' num_trials: int = 10 time_limit: int = 600 categorical_imputer: typing.Optional[str] = None numerical_imputer: typing.Optional[str] = None numeric_scaler: typing.Optional[str] = None )

引數

  • data_path (str) — 資料集的路徑。
  • model (str) — 要使用的模型的名稱。預設為“xgboost”。
  • username (Optional[str]) — Hugging Face 使用者名稱。
  • seed (int) — 用於可復現性的隨機種子。預設為 42。
  • train_split (str) — 訓練資料拆分的名稱。預設為“train”。
  • valid_split (Optional[str]) — 驗證資料拆分的名稱。
  • project_name (str) — 輸出目錄的名稱。預設為“project-name”。
  • token (Optional[str]) — 用於身份驗證的 Hub 令牌。
  • push_to_hub (bool) — 是否將模型推送到 Hub。預設為 False。
  • id_column (str) — ID 列的名稱。預設為“id”。
  • target_columns (Union[List[str], str]) — 資料集中的目標列。預設為 [“target”]。
  • categorical_columns (Optional[List[str]]) — 分類列的列表。
  • numerical_columns (Optional[List[str]]) — 數值列的列表。
  • task (str) — 任務型別(例如,“classification”)。預設為“classification”。
  • num_trials (int) — 超引數最佳化的試驗次數。預設為 10。
  • time_limit (int) — 訓練時間限制(以秒為單位)。預設為 600。
  • categorical_imputer (Optional[str]) — 分類列的插補策略。
  • numerical_imputer (Optional[str]) — 數值列的插補策略。
  • numeric_scaler (Optional[str]) — 數值列的縮放策略。

TabularParams 是用於表格資料訓練引數的配置類。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.