메인 콘텐츠로 건너뛰기

eval 정리 시간이 오래 걸리는 경우

이 페이지에서는 대규모 데이터로 W&B Weave evaluations를 실행할 때 오래 걸리는 정리 시간을 줄이기 위해 함께 사용할 두 가지 방법을 설명합니다 …

쌍대 비교 평가는 무엇이며 어떻게 하나요?

Weave 평가에서 모델에 점수를 매길 때 절대 점수 메트릭(예를 들어, Model A는 9/10, Model B는 8/10) …