メインコンテンツへスキップ
このページでは、W&B セルフマネージドをデプロイするために必要なインフラストラクチャーとソフトウェアの要件を包括的に説明します。デプロイを開始する前に、これらの要件を確認してください。
W&B では、W&B Multi-tenant CloudW&B Dedicated Cloud などの完全マネージドなデプロイオプションを推奨しています。W&B の完全マネージドサービスは、必要な設定が最小限、または不要で、簡単かつ安全に使用できます。
アーキテクチャに関する完全なガイダンスについては、リファレンスアーキテクチャを参照してください。

ソフトウェアのバージョン要件

ソフトウェア最小バージョン
Kubernetesv1.32 以降 (サポートされる Kubernetes バージョン)
Helmv3.x
MySQLv8.0.x が必須です (v8.0.32 以降) 。v8.0.44 以降を推奨します。
Aurora MySQL 3.x version は v3.05.2 以降である必要があります
Redisv7.x

ハードウェア要件

CPU アーキテクチャ: W&B は Intel (x86) CPU アーキテクチャでのみ動作します。ARM はサポートされていません。 サイジング: Kubernetes ノードと MySQL の CPU、メモリ、ディスクのサイジング推奨事項については、リファレンスアーキテクチャの サイジング セクション を参照してください。要件は、Models、Weave、またはその両方を実行するかどうかによって異なります。 ユースケース (Models のみ、Weave のみ、またはその両方) に応じた詳細なサイジングの推奨事項については、リファレンスアーキテクチャのサイジングセクションを参照してください。

Kubernetes

W&B Server は、複数の pod を管理する Kubernetes Operator としてデプロイされます。Kubernetes cluster は、次の要件を満たしている必要があります。
  • Version: 上記の ソフトウェアのバージョン要件 を参照してください
  • Ingress controller: 適切に設定され、正常に動作する ingress controller (Nginx、Istio、Traefik、または cloud provider ingress)
  • Persistent volumes: persistent volumes をプロビジョニングできること
  • CPU architecture: Intel または AMD の 64 ビット (ARM はサポートされていません)
W&B は、クラウド、オンプレミス、air-gapped 環境の OpenShift Kubernetes clusters へのデプロイをサポートしています。具体的な設定手順については、Operator ガイドの OpenShift section を参照してください。 ロードバランサー と ingress の設定を含む Kubernetes の完全な要件については、リファレンスアーキテクチャ Kubernetes section を参照してください。

MySQL データベース

W&B では、外部の MySQL データベースが必要です。 本番環境では、W&B はマネージドデータベースサービスの利用を強く推奨しています。 マネージドデータベースサービスには、自動バックアップ、監視、高可用性、パッチ適用の機能があり、運用負荷を軽減できます。 MySQL の要件全体 (推奨サイジングや設定パラメーターを含む) については、リファレンスアーキテクチャを参照してください。データベース作成用の SQL については、ベアメタルガイドを参照してください。デプロイ環境のデータベース設定に関するご質問は、サポートまたは担当の AISE までお問い合わせください。 W&B では、本番デプロイには AWS RDS Aurora MySQL、Google Cloud SQL for MySQL、Azure Database for MySQL などのマネージドデータベースサービスの利用を強く推奨しています。マネージドサービスでは、自動バックアップ、監視、高可用性、パッチ適用が提供されるため、運用の複雑さを大幅に軽減できます。

MySQL 設定パラメーター

独自の MySQL インスタンスを使用している場合は、MySQL を次の設定で構成してください。
binlog_format = 'ROW'
binlog_row_image = 'MINIMAL'
innodb_flush_log_at_trx_commit = 1
innodb_online_alter_log_max_size = 268435456
max_prepared_stmt_count = 1048576
sort_buffer_size = '67108864'
sync_binlog = 1
これらの設定は、最適なパフォーマンスと信頼性が得られるよう、W&B によって検証されています。

データベースの作成

MySQL データベースとユーザーを手動で作成する手順については、次を参照してください。 次の SQL コマンドを使用して、データベースとユーザーを作成します。SOME_PASSWORD は、任意の強力なパスワードに置き換えてください。
CREATE USER 'wandb_local'@'%' IDENTIFIED BY 'SOME_PASSWORD';
CREATE DATABASE wandb_local CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
GRANT ALL ON wandb_local.* TO 'wandb_local'@'%' WITH GRANT OPTION;
バックアップ、パフォーマンス、モニタリング、可用性などの追加事項については、リファレンスアーキテクチャの MySQL セクションを参照してください。

Redis

W&B では、コンポーネントによるジョブキューイングとデータキャッシュのために、単一ノード構成の Redis 7.x デプロイが必要です。テストや概念実証の開発を容易にするため、W&B セルフマネージドにはローカルの Redis デプロイが含まれていますが、これは本番デプロイには適していません。 本番デプロイでは、W&B は次の環境にある Redis インスタンスに接続できます。 W&B は、以下の環境の Redis インスタンスに接続できます。

オブジェクトストレージ

W&B では、事前署名付き URL と CORS をサポートするオブジェクトストレージが必要です。 推奨されるストレージプロバイダー:
  • Amazon S3: 業界トップクラスのスケーラビリティ、データ可用性、セキュリティ、パフォーマンスを備えたオブジェクトストレージサービス。
  • Google Cloud Storage: 非構造化データを大規模に保存するためのマネージドサービス。
  • Azure Blob Storage: 大量の非構造化データを保存するためのクラウドベースのオブジェクトストレージソリューション。
  • CoreWeave AI Object Storage: AI ワークロード向けに最適化された高パフォーマンスの S3 互換オブジェクトストレージサービス。
  • エンタープライズ向け S3 互換ストレージ: MinIO Enterprise (AIStor)NetApp StorageGRID、またはその他のエンタープライズグレードのソリューション
MinIO Open Source は、アクティブな開発や事前コンパイル済みバイナリの提供がない maintenance mode です。本番デプロイでは、W&B はマネージドオブジェクトストレージサービス、または MinIO Enterprise (AIStor) などのエンタープライズ向け S3 互換ソリューションの使用を推奨しています。
IAM ポリシー、CORS 設定、アクセス設定を含む詳細なバケットプロビジョニング手順については、Bring Your Own Bucket (BYOB) ガイドを参照してください。 完全な要件については、リファレンスアーキテクチャのオブジェクトストレージセクションを参照してください。

ストレージバケットをプロビジョニングする

W&B を設定する前に、適切な IAM ポリシー、CORS 設定、アクセス認証情報を用意して、オブジェクトストレージバケットをプロビジョニングしてください。 以下についての詳細な step ごとのプロビジョニング手順は、Bring Your Own Bucket (BYOB) ガイド を参照してください。
  • Amazon S3 (IAM ポリシーとバケットポリシーを含む)
  • Google Cloud Storage (PubSub 通知を含む)
  • Azure Blob Storage (マネージド ID を含む)
  • CoreWeave AI Object Storage
  • S3 互換ストレージ (MinIO Enterprise、NetApp StorageGRID、その他のエンタープライズソリューション)

W&B でバケットを使用するように設定する

バケットをプロビジョニングしたら、Operator の Helm values で W&B がそのバケットを使用するように設定します。詳細は、Operator のオブジェクトストレージ設定セクションを参照してください。

ネットワーク

ネットワーク接続されたデプロイでは、インストール時とランタイム時の_両方で_、以下のエンドポイントへのアウトバウンド通信が必要です。
デプロイ設定によっては、追加のコンテナーレジストリが必要になる場合があります。
  • Weave のオンライン評価用に Bufstream と etcd をデプロイする場合は、https://gcr.io が必要です。
エアギャップ環境でのデプロイについては、エアギャップ環境向け Kubernetes Operatorを参照してください。 W&B とオブジェクトストレージへのアクセスは、トレーニングインフラストラクチャーと、Experiments の要件をトラッキングする各システムで必要です。

DNS

W&Bデプロイの完全修飾ドメイン名 (FQDN) は、Aレコードで ingress/ロードバランサー のIPアドレスに名前解決されている必要があります。

ロードバランサーと ingress

W&B Kubernetes Operator は、URL パスに基づいてサービスエンドポイントにルーティングする Kubernetes ingress controller を使用して、サービスを公開します。ingress controller には、機械学習のペイロードを実行するすべてのマシン、および Web ブラウザー経由でサービスにアクセスするすべてのマシンからアクセスできる必要があります。 ロードバランサーの詳細なオプション、ingress controller の要件、設定例については、リファレンスアーキテクチャのロードバランンサーセクションを参照してください。

SSL/TLS

W&B では、クライアントとサーバー間の安全な通信のために、有効な署名付き SSL/TLS 証明書が必要です。SSL/TLS の終端は ingress/load balancer で行う必要があります。W&B Server アプリケーション自体は、SSL または TLS 接続を終端しません。 重要: W&B は自己署名証明書およびカスタム CA をサポートしていません。自己署名証明書を使用するとユーザーに問題が生じるため、サポート対象外です。 可能であれば、Let’s Encrypt のようなサービスを使用して、load balancer に信頼できる証明書を提供するのが効果的です。Caddy や Cloudflare のようなサービスを使えば、SSL を代わりに管理できます。 セキュリティポリシーで、信頼できるネットワーク内でも SSL 通信が必要な場合は、Istio のようなツールや side car containers の使用を検討してください。

ライセンス

すべてのセルフマネージド環境へのデプロイには、有効な W&B Server ライセンスが必須です。 W&B Self-Managed をデプロイするには、W&B ライセンスが必要です。
  1. まだ W&B アカウントをお持ちでない場合は、作成してください。
  2. 重要なセキュリティ機能やその他のエンタープライズ向け機能のサポートを含むエンタープライズ向け試用ライセンスが必要な場合は、リクエストを送信するか、W&B チームにお問い合わせください。
  3. それ以外の場合は、Deploy Manager を開いて無料の試用ライセンスを生成します。この URL から W&B Local のライセンスを取得 フォームにリダイレクトされます。次の情報を入力してください。
    • ライセンス所有者
    • デプロイ タイプ
    • インスタンスの名と任意の説明
  4. Generate License Key をクリックします。
デプロイの概要と、そのインスタンスに関連付けられたライセンスが表示されます。

次のステップ

インフラストラクチャーがこれらの要件を満たしていることを確認したら、次の手順に進んでください。