본문으로 건너뛰기

Artifacts

W&B Artifacts를 사용하여 직렬화된 데이터를 W&B Runs의 입력 및 출력으로 추적하고 버전 관리하세요. 예를 들어, 모델 트레이닝 run은 데이터셋 입력으로, 트레인된 모델을 출력으로서 받아드릴 수 있습니다. Run에 하이퍼파라미터와 메타데이터를 로깅하는 것 외에도, 아티팩트를 사용하여 모델을 트레이닝하는 데 사용된 데이터셋을 입력으로, 결과적인 모델 체크포인트를 출력으로 로깅할 수 있습니다. 그렇기 때문에 "이 모델이 어떤 버전의 데이터셋으로 트레이닝되었는가"라는 질문에 항상 답할 수 있습니다.

요약하자면, W&B Artifacts를 사용하면 다음과 같은 작업을 수행할 수 있습니다:

위 다이어그램은 runs의 입력 및 출력으로 아티팩트를 사용하여 전체 ML 워크플로우를 어떻게 활용할 수 있는지 보여줍니다.

작동 방식

네 줄의 코드로 아티팩트를 생성합니다:

  1. W&B run을 생성합니다.
  2. wandb.Artifact API를 사용하여 아티팩트 객체를 생성합니다.
  3. 하나 이상의 파일(예: 모델 파일 또는 데이터셋)을 아티팩트 오브젝트에 추가합니다.
  4. W&B에 아티팩트를 로그합니다.
run = wandb.init(project="artifacts-example", job_type="add-dataset")
artifact = wandb.Artifact(name="my_data", type="dataset")
artifact.add_dir(local_path="./dataset.h5") # 아티팩트에 데이터셋 디렉토리 추가
run.log_artifact(artifact) # "my_data:v0"라는 아티팩트 버전을 로깅

앞선 코드조각과 이 페이지에 링크된 colab 노트북은 파일을 W&B에 업로드하여 추적하는 방법을 보여줍니다. 외부 오브젝트 스토리지(예: Amazon S3 버킷)에 저장된 파일이나 디렉토리에 레퍼런스를 추가하는 방법에 대해서는 외부 파일 추적 페이지를 참조하세요.

시작 방법

유스케이스에 따라 밑의 자료를 살펴보고 W&B Artifacts를 시작하세요:

Was this page helpful?👍👎