- 새로운 evaluation run이 추가될 때
- 그리고 결과가 저장된 필터와 일치할 때
Leaderboard에서 Evaluation 결과 시각화하기
프로젝트에 Weave Evaluation 데이터가 포함되어 있으면, evaluation 테이블을 사용하여 필터링된 결과 서브셋을 기반으로 Weave Leaderboard 뷰를 빠르게 생성할 수 있습니다. Weave Leaderboard를 생성하려면:- wandb.ai로 이동합니다.
- Weave 사이드바 메뉴에서 Evaluations를 클릭합니다.
- 비교하려는 Models, Datasets 또는 run으로 데이터를 좁히기 위해 evaluation 테이블에 필터를 적용합니다.
- evaluation table toolbar에서 Visualize를 클릭합니다. Weave는 테이블에서 현재 필터링된 데이터만을 사용하여 Leaderboard 패널을 자동으로 생성합니다.
- Leaderboard 패널 헤더에서 Configure를 클릭하여 Edit Leaderboard 패널을 엽니다.
Edit Leaderboard 패널에서는 Models, Datasets, Scorers 및 메트릭이 표시되는 방식을 정밀하게 제어할 수 있습니다.

가시성 및 커스텀 이름을 사용한 Leaderboard 요소 설정
다음은 Models, Datasets, Scorers, Metrics의 네 가지 설정 탭이 있는 Edit Leaderboard 패널을 보여줍니다.
-
표시 활성화/비활성화
Leaderboard에 표시할 Models, Datasets, Scorers 및 메트릭을 체크하거나 체크 해제하여 선택합니다. -
Models, Datasets 및 Scorers 이름 변경
표시하기 쉬운 이름을 할당합니다 (예: 모델 run의 이름을GPT-4로 변경하거나 데이터셋 이름을JokesV1로 변경). 이름이 변경된 항목은 다음과 같습니다:- Leaderboard에 즉시 업데이트됨
- 클릭 가능한 상태로 유지되어 사이드 패널에서 기본 참조를 계속 열 수 있음
- Leaderboard 뷰가 사용되는 모든 곳에 자동으로 전파됨
Leaderboard 메트릭 행동 및 색상 설정
Edit Leaderboard 패널에서 각 메트릭에 대해 다음 여부를 지정할 수 있습니다:- Higher values are better (높은 값이 더 좋음), 또는
- Lower values are better (낮은 값이 더 좋음)
- 초록색은 더 나은 값을 강조합니다.
- 빨간색은 더 나쁜 값을 강조합니다.
- “higher is better”와 “lower is better” 사이를 전환하면 색상이 자동으로 반전됩니다.
Leaderboard 뷰 저장 및 재사용
Edit Leaderboard 패널에서 Save를 클릭하여 커스터마이징한 Leaderboard를 재사용 가능한 뷰로 저장할 수 있습니다. 저장된 Leaderboard 뷰는 다음을 캡처합니다:- 선택된 Models, Datasets, Scorers 및 메트릭
- 변경된 표시 레이블
- 메트릭 방향 설정 (높은 값 또는 낮은 값이 더 좋음)
- 적용된 필터
저장된 뷰 간 전환
Evaluations 페이지 제목 옆의 **메뉴 아이콘 (☰)**을 클릭하여 저장된 뷰를 엽니다. 다음을 수행할 수 있습니다:- default 뷰로 돌아가 전체 데이터셋을 확인합니다.
- 저장된 뷰를 다시 열어 모든 커스터마이징을 즉시 복원합니다.