wandb 라이브러리는 XGBoost 트레이닝에서 메트릭, 설정(configs) 및 저장된 부스터를 로그하기 위한 WandbCallback 콜백을 제공합니다. 여기에서 XGBoost WandbCallback의 출력값이 포함된 라이브 W&B Dashboard를 확인하실 수 있습니다.

시작하기
XGBoost 메트릭, 설정 및 부스터 모델을 W&B로 로그하는 방법은WandbCallback을 XGBoost에 전달하는 것만큼 간단합니다:
WandbCallback 레퍼런스
기능
XGBoost 모델에WandbCallback을 전달하면 다음과 같은 작업이 수행됩니다:
- 부스터 모델 설정을 W&B에 로그합니다.
- rmse, accuracy 등 XGBoost가 수집한 평가 메트릭을 W&B에 로그합니다.
- 트레이닝 메트릭을 W&B에 로그합니다 (eval_set에 데이터를 제공한 경우).
- 최적의 점수(best score)와 최적의 반복 횟수(best iteration)를 로그합니다.
- 트레이닝된 모델을 저장하고 W&B Artifacts 에 업로드합니다 (
log_model = True인 경우). - 피처 중요도(feature importance) 플롯을 로그합니다 (
log_feature_importance=True인 경우, 기본값). - 최적의 평가 메트릭을
wandb.Run.summary에 캡처합니다 (define_metric=True인 경우, 기본값).
인수
-
log_model: (boolean) True인 경우 모델을 저장하고 W&B Artifacts 에 업로드합니다. -
log_feature_importance: (boolean) True인 경우 피처 중요도 막대 그래프를 로그합니다. -
importance_type: (str) 트리 모델의 경우{weight, gain, cover, total_gain, total_cover}중 하나입니다. 선형 모델의 경우 weight입니다. -
define_metric: (boolean) True(기본값)인 경우run.summary에서 트레이닝의 마지막 스텝 대신 최적의 스텝에서의 모델 성능을 캡처합니다.
Sweeps 로 하이퍼파라미터 튜닝하기
모델에서 최고의 성능을 끌어내기 위해서는 트리 깊이(tree depth)나 학습률(learning rate)과 같은 하이퍼파라미터를 튜닝해야 합니다. W&B Sweeps 는 대규모 하이퍼파라미터 테스트 실험을 설정, 오케스트레이션 및 분석하기 위한 강력한 툴킷입니다. Try in Colab 이 XGBoost & Sweeps 파이썬 스크립트를 직접 실행해 볼 수도 있습니다.