- 시간에 따른 평가 메트릭 (Evaluation metrics) 트래킹
- 프로그램 시그니처의 진화를 확인하기 위한 W&B Tables
- MIPROv2와 같은 DSPy 옵티마이저와의 인테그레이션
안내
wandb==0.21.2 및 weave==0.52.5 버전부터는 W&B와 함께 사용할 때 Weave가 자동으로 초기화됩니다:weave를 임포트한 후wandb.init()을 호출하는 경우 (스크립트 사례)wandb.init()을 호출한 후 나중에weave를 임포트하는 경우 (노트북/Jupyter 사례)
weave.init(...)을 호출할 필요가 없습니다.설치 및 인증
필요한 라이브러리를 설치하고 W&B에 인증합니다:- Command Line
- Python
- Notebook
-
필요한 라이브러리를 설치합니다:
-
WANDB_API_KEY환경 변수를 설정하고 로그인합니다:
프로그램 최적화 트래킹 (실험적 기능)
dspy.Evaluate를 사용하는 DSPy 옵티마이저(MIPROv2 등)의 경우, WandbDSPyCallback을 사용하여 시간에 따른 평가 메트릭을 로그하고 W&B Tables에서 프로그램 시그니처의 변화를 트래킹할 수 있습니다.
WandbDSPyCallback에 run 오브젝트를 전달하지 않으면 글로벌 run 오브젝트가 사용됩니다.

W&B Tables에 예측값 로그하기
최적화 과정에서 개별 예시를 검사하기 위해 상세한 예측값 로그를 활성화하세요. 콜백은 각 평가 단계마다 W&B Tables를 생성하며, 이를 통해 특정 성공 및 실패 사례를 분석할 수 있습니다.예측값 데이터 엑세스
최적화가 완료된 후 W&B에서 예측값 데이터를 확인할 수 있습니다:- 해당 run의 Overview 페이지로 이동합니다.
predictions_0,predictions_1등과 같은 패턴으로 명명된 Table 패널을 찾습니다.is_correct로 필터링하여 실패 사례를 분석합니다.- 프로젝트 Workspace에서 여러 run의 테이블을 비교해 봅니다.
example: 입력 데이터prediction: 모델 출력is_correct: 평가 결과