사전 요구 사항
W&B Python SDK 설치
pip를 사용하면 됩니다:
W&B에 로그인하고 인증하세요
wandb login CLI 명령어를 사용한 다음 안내에 따라 W&B 계정에 로그인하세요:
wandb login 레퍼런스 문서를 참조하세요.
트레이닝 스크립트와 의존성 복사하기
PyTorch 트레이닝 모델 스크립트
PyTorch 트레이닝 모델 스크립트
다음 코드를 다음 코드를 다음 코드를
requirements.txt 파일에 복사하여 붙여넣으세요. 이 파일에는 트레이닝 스크립트에 필요한 의존성이 들어 있습니다.requirements.txt
hyperparameters.yaml라는 YAML 파일에 복사하여 붙여넣으세요. 이 파일에는 트레이닝 스크립트용 하이퍼파라미터가 들어 있습니다.hyperparameters.yaml
train.py 파일에 복사하여 붙여넣으세요. 이 스크립트는 UCI Zoo 데이터셋으로 단순한 PyTorch 모델을 트레이닝하고, 트레이닝된 모델을 zoo_wandb.pth 파일에 저장합니다.train.py
샌드박스를 생성하고 트레이닝 스크립트를 실행하세요
train.py, requirements.txt, hyperparameters.yaml 파일과 같은 디렉터리에 저장하세요.
train_in_sandbox.py
- (6~9행) 샌드박스에 마운트할 파일인
train.py와requirements.txt를 나열합니다. - (12행) 샌드박스를 시작합니다. 샌드박스는
python:3.13컨테이너 이미지를 사용하고, 인터넷 액세스가 가능하며, 최대 수명은 3600초(1시간)로 설정됩니다. - (18행)
hyperparameters.yaml파일을 샌드박스에 작성합니다. 이렇게 하면 트레이닝 스크립트(train.py)가 실행될 때 하이퍼파라미터에 액세스할 수 있습니다. - (22행) 의존성을 설치합니다. 트레이닝 스크립트에 필요한 의존성을 설치하기 위해 샌드박스 내부에서
pip install -r requirements.txt명령을 실행합니다. - (26행) 트레이닝 스크립트를 실행합니다. 트레이닝 프로세스를 시작하기 위해 샌드박스 내부에서
python train.py --config hyperparameters.yaml명령을 실행합니다. 이 스크립트는 UCI Zoo 데이터셋으로 PyTorch 모델을 트레이닝하고, 트레이닝된 모델을zoo_wandb.pth라는 이름의 파일에 저장합니다. - (27~29행) 출력과 종료 코드를 출력합니다. 트레이닝 스크립트 실행이 완료되면 디버깅 및 검증을 위해 표준 출력, 표준 오류, 종료 코드를 콘솔에 출력합니다.
- (33~34행) 생성된 모델 파일을 다운로드합니다.
read_file()메서드를 사용해 샌드박스에서zoo_wandb.pth파일을 조회하고 로컬에 저장합니다.