XGBoost
less than a minute
wandb
ライブラリには、XGBoost のトレーニングからメトリクス、設定、保存されたブースターをログするための WandbCallback
コールバックがあります。ここでは、XGBoost WandbCallback
の出力を含む ライブ Weights & Biases ダッシュボード を確認できます。

始めに
XGBoost で収集したメトリクス、設定、ブースターモデルを Weights & Biases にログするのは、XGBoost に WandbCallback
を渡すだけで簡単です。
from wandb.integration.xgboost import WandbCallback
import xgboost as XGBClassifier
...
# wandb run を開始
run = wandb.init()
# モデルに WandbCallback を渡す
bst = XGBClassifier()
bst.fit(X_train, y_train, callbacks=[WandbCallback(log_model=True)])
# wandb run を終了
run.finish()
このノートブック を開いて、XGBoost と Weights & Biases を使用したログの詳細な方法を見ることができます。
WandbCallback
リファレンス
機能
WandbCallback
を XGBoost モデルに渡すと、以下のことが行えます:
- ブースターモデルの設定を Weights & Biases にログする
- XGBoost によって収集された評価メトリクス(例: rmse, accuracy)を Weights & Biases にログする
- XGBoost で収集されたトレーニングメトリクスをログする(eval_set にデータを提供する場合)
- 最良のスコアと最良のイテレーションをログする
- トレーニング済みモデルを Weights & Biases Artifacts に保存およびアップロードする(
log_model = True
の場合) log_feature_importance=True
(デフォルト)の場合、特徴重要度のプロットをログするdefine_metric=True
(デフォルト)の場合、wandb.summary
に最良の評価メトリックをキャプチャする
引数
-
log_model
: (boolean) True の場合、モデルを Weights & Biases Artifacts に保存しアップロードする -
log_feature_importance
: (boolean) True の場合、特徴重要度の棒グラフをログする -
importance_type
: (str){weight, gain, cover, total_gain, total_cover}
のいずれかでツリーモデルに適用。重みは線形モデルに対応。 -
define_metric
: (boolean) True(デフォルト)の場合、トレーニングの最良のステップでモデルのパフォーマンスをwandb.summary
にキャプチャする(最後のステップではなく)。
WandbCallback
のソースコードを確認できます。
追加の例は、GitHub の例のリポジトリをチェックしてください。
Sweep でハイパーパラメーターをチューニングする
モデルの最大パフォーマンスを引き出すには、ツリーの深さや学習率など、ハイパーパラメーターをチューニングする必要があります。Weights & Biases には、大規模なハイパーパラメーターテスト実験を設定、編成、分析するための強力なツールキットである Sweeps が含まれています。
この XGBoost & Sweeps Python スクリプト も試すことができます。

フィードバック
このページは役に立ちましたか?
Glad to hear it! If you have more to say, please let us know.
Sorry to hear that. Please tell us how we can improve.