Dataset を使うと、LLM アプリケーション評価用のサンプルを整理、収集、トラッキングし、バージョン管理して簡単に比較できます。Dataset はプログラムからも UI からも作成・操作できます。
このページでは、次の内容を説明します。
- Python と TypeScript での基本的な
Datasetの操作と、使い始める方法 - Weave の calls などのオブジェクトから、Python と TypeScript で
Datasetを作成する方法 - UI で
Datasetに対して実行できる操作
Dataset クイックスタート
Dataset 操作を行う方法を示します。SDK を使用すると、次のことができます。
Datasetを作成するDatasetを公開するDatasetを取得するDataset内の特定の例にアクセスする
- Python
- TypeScript
他のオブジェクトから Dataset を作成する
- Python
- TypeScript
Python では、次に、
Dataset は calls のような一般的な Weave オブジェクトや、pandas.DataFrame のような Python オブジェクトから作成することもできます。この機能は、特定のサンプルから例示用の Dataset を作成したい場合に便利です。Weave call
1 つ以上の Weave call からDataset を作成するには、call オブジェクトを取得し、from_calls method に list として渡します。Pandas DataFrame
Pandas のDataFrame object から Dataset を作成するには、from_pandas method を使用します。Dataset を Pandas に戻すには、to_pandas を使用します。Hugging Face Datasets
Hugging Face のdatasets.Dataset または datasets.DatasetDict object から Dataset を作成するには、まず必要な dependencies がインストールされていることを確認します。from_hf method を使用します。複数の split (‘train’、‘test’、‘validation’ など) を持つ DatasetDict を指定すると、Weave は自動的に ‘train’ split を使用し、警告を表示します。‘train’ split が存在しない場合はエラーになります。特定の split を直接指定することもできます (例: hf_dataset_dict['test']) 。weave.Dataset を Hugging Face の Dataset に戻すには、to_hf method を使用します。UI で Dataset を作成、編集、削除する
Dataset は UI で作成、編集、削除できます。Weave UI でデータセットを作成すると、コードを編集しなくても、あなたやチームの非エンジニアのメンバーが、例や質問、そのほかのエージェント テスト用データを含む共有可能なデータセットを作成し、キュレーションできます。
新しい Dataset を作成する
- 編集する Weave プロジェクトにアクセスします。
- サイドバーで Traces を選択します。
-
新しい
Datasetを作成する対象の call を1つ以上選択します。 - 右上のメニューで、Add selected rows to a dataset アイコン (ごみ箱アイコンの横にあります) をクリックします。
- Choose a dataset ドロップダウンで、Create new を選択します。Dataset name フィールドが表示されます。
-
Dataset name フィールドにデータセット名を入力します。Configure dataset fields のオプションが表示されます。
Dataset 名は英字または数字で始める必要があり、使用できるのは英字、数字、ハイフン、アンダースコアのみです。
- (任意) Configure dataset fields で、データセットに含める call のフィールドを選択します。
- 選択した各フィールドの列名はカスタマイズできます。
- 新しい
Datasetに含めるフィールドを一部だけ選択することも、すべてのフィールドの選択を解除することもできます。
-
データセットフィールドの設定が完了したら、Next をクリックします。新しい
Datasetのプレビューが表示されます。 - (任意) Dataset 内の編集可能なフィールドをクリックして、エントリを編集します。
- Create dataset をクリックします。新しいデータセットが作成されます。
-
確認ポップアップで、View the dataset をクリックして新しい
Datasetを表示します。別の方法として、Datasets タブに移動することもできます。
Dataset を編集する
-
編集する
Datasetが含まれている Weave プロジェクトにアクセスします。 -
サイドバーで Datasets を選択します。利用可能な
Datasetが表示されます。
-
Object 列で、編集する
Datasetの名前とバージョンをクリックします。名前、バージョン、作成者、Datasetの行などの情報が表示されたポップアウト モーダルが開きます。
-
モーダルの右上にある Edit dataset ボタン (鉛筆アイコン) をクリックします。モーダルの下部に + Add row ボタンが表示されます。

-
+ Add row をクリックします。既存の
Datasetの行の上に緑色の行が表示され、Datasetに新しい行を追加できることを示します。
-
新しい行にデータを追加するには、その行の追加先の列をクリックします。
Datasetの行にあるデフォルトの id 列は、Weave によって作成時に自動的に割り当てられるため、編集できません。編集モーダルが表示され、書式設定用の Text、Code、Diff オプションを選択できます。
-
新しい行でデータを追加する各列について、step 6 を繰り返します。

-
Datasetに追加する各行について、step 5 を繰り返します。 -
編集が完了したら、モーダルの右上にある Publish をクリックして
Datasetを公開します。変更を公開しない場合は、Cancel をクリックします。 公開後、更新された行を含む新しいバージョンの
Datasetを UI で利用できます。

Dataset を削除する
-
削除したい
Datasetが含まれる Weave プロジェクトにアクセスします。 -
サイドバーから Datasets を選択します。利用可能な
Datasetが表示されます。 -
Object 列で、削除する
Datasetの名前とバージョンをクリックします。名前、バージョン、作成者、Datasetの行などの情報を表示するポップアウト モーダルが開きます。 -
モーダルの右上にあるゴミ箱アイコンをクリックします。
Datasetの削除確認を求めるポップアップモーダルが表示されます。
-
ポップアップモーダルで、赤い Delete ボタンをクリックして
Datasetを削除します。削除したくない場合は、Cancel をクリックします。 これでDatasetは削除され、Weave ダッシュボードの Datasets タブには表示されなくなります。
Dataset に新しいサンプルを追加する
- 編集したい Weave プロジェクトにアクセスします。
- サイドバーで Traces を選択します。
-
新しいサンプルを作成したい
Datasetsを含む call を 1 つ以上選択します。 - 右上のメニューで、Add selected rows to a dataset アイコン (ごみ箱アイコンの横) をクリックします。必要に応じて Show latest versions をオフにすると、利用可能なすべてのデータセットの全バージョンが表示されます。
-
Choose a dataset ドロップダウンから、サンプルを追加する
Datasetを選択します。Configure field mapping オプションが表示されます。 - (任意) Configure field mapping では、call のフィールドを対応するデータセット列にどうマッピングするかを調整できます。
-
フィールドマッピングの設定が完了したら、Next をクリックします。新しい
Datasetのプレビューが表示されます。 - 空の行 (緑色) に、新しいサンプルの値を追加します。id フィールドは編集できず、Weave によって自動的に作成されることに注意してください。
- Add to dataset をクリックします。Configure field mapping 画面に戻るには、Back をクリックします。
-
確認ポップアップで、変更を確認するには View the dataset をクリックします。あるいは、Datasets タブにアクセスして
Datasetの更新を確認します。
その他のデータセット操作
- Python
- TypeScript