spacy train과 함께 사용하여 spaCy 모델의 트레이닝 메트릭을 추적하고 모델과 데이터셋을 저장 및 버저닝할 수 있습니다. 설정에 몇 줄만 추가하면 됩니다.
가입하고 API 키 만들기
API 키는 사용자의 머신이 W&B에 인증되도록 합니다. 사용자 프로필에서 API 키를 생성할 수 있습니다.보다 간소화된 접근 방식을 위해 https://wandb.ai/authorize로 직접 이동하여 API 키를 생성할 수 있습니다. 표시된 API 키를 복사하여 비밀번호 관리자와 같은 안전한 위치에 저장합니다.
- 오른쪽 상단 모서리에 있는 사용자 프로필 아이콘을 클릭합니다.
- User Settings를 선택한 다음 API Keys 섹션으로 스크롤합니다.
- Reveal을 클릭합니다. 표시된 API 키를 복사합니다. API 키를 숨기려면 페이지를 새로 고칩니다.
wandb 라이브러리 설치 및 로그인
wandb 라이브러리를 로컬에 설치하고 로그인하려면 다음을 수행합니다.
- Command Line
- Python
- Python notebook
-
API 키로
WANDB_API_KEY환경 변수를 설정합니다. -
wandb라이브러리를 설치하고 로그인합니다.
spaCy 설정 파일에 WandbLogger 추가
spaCy 설정 파일은 로깅뿐만 아니라 트레이닝의 모든 측면(GPU 할당, 옵티마이저 선택, 데이터셋 경로 등)을 지정하는 데 사용됩니다. 최소한 [training.logger] 아래에 @loggers 키를 값 "spacy.WandbLogger.v3"와 함께 제공하고 project_name을 제공해야 합니다.
spaCy 트레이닝 설정 파일의 작동 방식과 트레이닝을 사용자 정의하기 위해 전달할 수 있는 기타 옵션에 대한 자세한 내용은 spaCy 설명서를 참조하십시오.
| 이름 | 설명 |
|---|---|
project_name | str. W&B Project의 이름입니다. 아직 존재하지 않으면 프로젝트가 자동으로 생성됩니다. |
remove_config_values | List[str] . W&B에 업로드하기 전에 설정에서 제외할 값의 목록입니다. 기본적으로 []입니다. |
model_log_interval | Optional int. 기본적으로 None입니다. 설정되면 Artifacts를 사용하여 모델 버전 관리를 활성화합니다. 모델 체크포인트를 로깅하는 사이의 단계 수를 전달합니다. 기본적으로 None입니다. |
log_dataset_dir | Optional str. 경로가 전달되면 트레이닝 시작 시 데이터셋이 Artifact로 업로드됩니다. 기본적으로 None입니다. |
entity | Optional str . 전달되면 지정된 엔터티에 run이 생성됩니다. |
run_name | Optional str . 지정되면 지정된 이름으로 run이 생성됩니다. |
트레이닝 시작
spaCy 트레이닝 설정에WandbLogger를 추가했으면 평소와 같이 spacy train을 실행할 수 있습니다.
- Command Line
- Python
- Python notebook