これはインタラクティブなノートブックです。ローカルで実行することも、以下のリンクを利用することもできます:
評価で preprocess_model_input を使って HuggingFace Datasets を利用する
注: これは一時的な回避策です
このガイドでは、HuggingFace Datasets を Weave の評価で使用するための回避策を紹介します。
この手順をより簡単にする、シームレスなインテグレーションの開発を現在積極的に進めています。 この方法でも利用できますが、近いうちに改善や更新が行われ、外部データセットをより簡単に扱えるようになる予定です。
セットアップとインポート
HuggingFace データセットを読み込んで準備する
- HuggingFace データセットを読み込みます。
- データセットの各行を参照するためのインデックスを作成します。
- このインデックス方式により、元のデータセットへの参照を維持できます。
注:
インデックスでは、各行に一意の識別子を確実に付与するため、hf_hub_nameをhf_idとあわせてエンコードします。 この一意のダイジェスト値は、評価時に特定のデータセットエントリをトラッキングしたり参照したりするために使用されます。
処理関数と評価関数を定義する
処理パイプライン
preprocess_example: インデックス参照を、評価に必要な実データへ変換しますhf_eval: モデルの出力をどのように評価するかを定義しますfunction_to_evaluate: 実際に評価される関数/モデル
評価を作成して実行する
- hf_index の各インデックスについて:
preprocess_exampleが HF データセットから対応するデータを取得します。- 前処理したデータが
function_to_evaluateに渡されます。 - 出力は
hf_evalを使ってスコア付けされます。 - 結果は Weave でトラッキングされます。