이것은 인터랙티브 노트북입니다. 로컬에서 실행하거나 아래 링크를 사용할 수 있습니다:
preprocess_model_input을 사용하여 evaluations에서 HuggingFace Datasets 활용하기
참고: 이것은 임시 해결책입니다
이 가이드는 Weave evaluations와 함께 HuggingFace Datasets를 사용하기 위한 해결 방법을 보여줍니다.
현재 이 프로세스를 간소화할 수 있는 더 원활한 인테그레이션을 개발하기 위해 적극적으로 노력하고 있습니다.
이 방식이 현재 작동하긴 하지만, 조만간 외부 Datasets 작업을 더 직관적으로 만들어 줄 개선 사항과 업데이트가 있을 예정입니다.
설정 및 임포트
먼저, Weave를 초기화하고 실험 트래킹을 위해 Weights & Biases에 연결합니다.HuggingFace dataset 로드 및 준비
- HuggingFace dataset을 로드합니다.
- 데이터셋 행을 참조하기 위한 인덱스 매핑을 생성합니다.
- 이 인덱스 접근 방식을 통해 원본 데이터셋에 대한 참조를 유지할 수 있습니다.
참고:
인덱스에서hf_hub_name과hf_id를 함께 인코딩하여 각 행이 고유한 식별자를 갖도록 합니다.
이 고유한 다이제스트 값은 evaluations 과정에서 특정 데이터셋 항목을 트래킹하고 참조하는 데 사용됩니다.
처리 및 evaluation 함수 정의
처리 파이프라인
preprocess_example: 인덱스 참조를 evaluation에 필요한 실제 데이터로 변환합니다.hf_eval: 모델 출력에 점수를 매기는 방법을 정의합니다.function_to_evaluate: 실제로 평가되는 함수 또는 모델입니다.
Evaluation 생성 및 실행
- hf_index의 각 인덱스에 대해:
preprocess_example이 HF 데이터셋에서 해당 데이터를 가져옵니다.- 전처리된 데이터가
function_to_evaluate로 전달됩니다. - 출력이
hf_eval을 사용하여 점수가 매겨집니다. - 결과가 Weave에서 트래킹됩니다.