sweep command는 --pause, --resume 같은 플래그를 사용해 sweep이 새 W&B run을 생성할 수 있는지를 제어하며, 기존 run에는 다음과 같이 서로 다른 영향을 줍니다.
--pause: sweep을 일시 중지하면 sweep을 재개할 때까지 에이전트가 새 run을 생성하지 않습니다. 기존 run은 정상적으로 계속 실행됩니다.--resume: sweep을 재개하면 에이전트가 검색 전략에 따라 새 run 생성을 계속합니다.--stop: sweep을 중지하면 에이전트가 새 run 생성을 중지합니다. 기존 run은 완료될 때까지 계속 실행됩니다.--cancel: sweep을 취소하면 에이전트가 현재 실행 중인 모든 run을 즉시 종료하고 새 run 생성을 중지합니다.
sweep 일시 중지
wandb sweep --pause 명령어를 사용하세요. 일시 중지할 sweep ID를 지정합니다.
sweep 재개
wandb sweep --resume 명령어로 재개할 수 있습니다. sweep은 검색 전략에 따라 새 run을 다시 생성하기 시작합니다. 재개하려는 sweep ID를 지정합니다:
sweep 중지
wandb sweep --stop 명령어를 사용합니다:
sweep 취소
wandb sweep --cancel 명령어를 사용하세요. 취소할 sweep ID를 지정하세요. signal과 sweep run에 대한 자세한 내용은 Signal handling and sweep runs를 참조하세요.
sweep와 run 상태 이해하기
주요 차이점
- Sweep status는 새 run이 생성될지 여부를 제어합니다 (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
- Run status는 개별 run의 실행 상태를 나타냅니다 (Pending, Running, Finished, Failed, Crashed, Killed)
개별 run 중지
모범 사례
- 실행 중인 Experiments를 잃지 않고 탐색을 일시 중지하려면 cancel 대신
--pause를 사용하세요 - 개별 run 상태를 모니터링하여 시스템적 실패를 파악하세요
- 만족스러운 하이퍼파라미터를 찾았다면 정상적으로 종료하려면
--stop을 사용하세요 - run이 과도한 리소스를 소모하거나 오류를 발생시키는 긴급 상황에서만
--cancel을 사용하세요