Dataset은 프로그래밍 방식과 UI를 통해 생성하고 사용할 수 있습니다.
이 페이지는 코드 또는 Weave UI를 통해 평가 데이터를 관리하려는 엔지니어와 팀 구성원을 위한 것입니다. 다음 내용을 설명합니다.
- Python 및 TypeScript에서
Dataset의 기본 오퍼레이션과 시작하는 방법 - Weave Call와 같은 객체에서 Python 및 TypeScript로
Dataset을 생성하는 방법 - UI에서
Dataset에 사용할 수 있는 오퍼레이션
데이터셋 퀵스타트
데이터셋 오퍼레이션을 수행하는 방법을 보여줍니다. SDK를 사용하면 다음을 수행할 수 있습니다.
데이터셋생성데이터셋게시데이터셋조회데이터셋의 특정 예시에 액세스
- Python
- TypeScript
다른 객체에서 dataset 만들기
Dataset을 구축하는 방법을 보여주므로, 예시를 수동으로 다시 입력할 필요가 없습니다.
- Python
- TypeScript
Python에서는 Call 같은 일반적인 Weave 객체나 그런 다음
pandas.DataFrame 같은 Python 객체로도 Dataset을 생성할 수 있습니다. 이 기능은 특정 예시들로 예시 Dataset을 만들고 싶을 때 유용합니다.Weave call
하나 이상의 Weave call에서Dataset을 만들려면 call 객체를 조회한 뒤, from_calls 메서드에 전달하는 목록에 추가합니다.Pandas DataFrame
PandasDataFrame 객체에서 Dataset을 만들려면 from_pandas 메서드를 사용합니다. 다시 Dataset을 DataFrame으로 변환하려면 to_pandas를 사용합니다.Hugging Face Datasets
Hugging Facedatasets.Dataset 또는 datasets.DatasetDict 객체에서 Dataset을 만들려면 먼저 필요한 의존성이 설치되어 있는지 확인합니다:from_hf 메서드를 사용합니다. 여러 split(train, test, validation 등)이 포함된 DatasetDict를 제공하면 Weave는 자동으로 train split을 사용하고 경고를 표시합니다. train split이 없으면 오류가 발생합니다. 특정 split을 직접 제공할 수도 있습니다(예: hf_dataset_dict['test']).weave.Dataset을 다시 Hugging Face Dataset으로 변환하려면 to_hf 메서드를 사용합니다.UI에서 데이터셋 생성, 수정 및 삭제
데이터셋을 생성, 수정 및 삭제할 수 있습니다. Weave UI에서 데이터셋을 생성하면 코드를 편집하지 않고도 귀하와 팀의 비엔지니어링 구성원이 예시, 질문 및 기타 에이전트 테스트 데이터가 포함된 공유 가능한 데이터셋을 만들고 큐레이션할 수 있습니다.
다음 절차에서는 UI에서 이러한 각 작업을 수행하는 방법을 안내합니다. 평가 데이터를 노트북이나 스크립트가 아니라, 해당 데이터가 나온 트레이스와 함께 관리하려면 이 절차를 사용하세요.
새 데이터셋 만들기
Dataset을 만듭니다. 완료하면 evaluation에서 참조하고 팀과 공유할 수 있는 게시된 Dataset이 생성됩니다.
- 수정하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새
Dataset을 만들 Call을 하나 이상 선택합니다. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 있음)을 클릭합니다.
- Choose a dataset 드롭다운에서 Create new를 선택합니다. 그러면 Dataset name 필드가 나타납니다.
-
Dataset name 필드에 데이터셋 이름을 입력합니다. 그러면 Configure dataset fields 옵션이 표시됩니다.
데이터셋 이름은 문자 또는 숫자로 시작해야 하며, 문자, 숫자, 하이픈(-), 밑줄(_)만 포함할 수 있습니다.
-
선택 사항: Configure dataset fields에서 데이터셋에 포함할 call의 필드를 선택합니다.
- 선택한 각 필드의 열 이름을 사용자 지정할 수 있습니다.
- 새
Dataset에 포함할 필드 일부만 선택하거나, 모든 필드의 선택을 해제할 수 있습니다.
-
데이터셋 필드 설정을 마치면 Next를 클릭합니다. 새
Dataset의 미리보기가 표시됩니다. - 선택 사항: Dataset에서 편집 가능한 필드를 클릭해 항목을 수정합니다.
- Create dataset을 클릭합니다. Weave가 새 데이터셋을 생성합니다.
-
확인 팝업에서 View the dataset을 클릭해 새
Dataset을 확인합니다. 또는 Datasets 탭으로 이동합니다.
데이터셋 편집
Dataset에 새 행을 추가하고 새 버전을 게시하세요. UI에서 편집하면 코드를 변경하지 않고도 평가 데이터를 확장하거나 수정할 때 유용합니다.
-
편집할
Dataset이 있는 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset이 표시됩니다.
-
객체 열에서 편집할
Dataset의 이름과 버전을 클릭합니다. 이름, 버전, 작성자,Dataset행 등Dataset정보가 표시되는 팝아웃 모달이 나타납니다.
-
모달 오른쪽 상단에서 Edit dataset 버튼(연필 아이콘)을 클릭합니다. 모달 하단에 + Add row 버튼이 표시됩니다.

-
+ Add row를 클릭합니다. 기존
Dataset행 위에 새 행이 표시되며,Dataset에 새 행을 추가할 수 있음을 나타냅니다.
-
새 행에 데이터를 추가하려면 해당 행에서 원하는 열을 클릭합니다.
Dataset행의 기본 id 열은 Weave가 생성 시 자동으로 할당하므로 편집할 수 없습니다. 서식 지정을 위한 Text, Code, Diff 옵션이 있는 편집 모달이 나타납니다.
-
새 행에서 데이터를 추가하려는 각 열에 대해 6단계를 반복합니다.

-
Dataset에 추가하려는 각 행에 대해 5단계를 반복합니다. -
편집이 끝나면 모달 오른쪽 상단의 Publish를 클릭해
Dataset을 게시합니다. 변경 사항을 게시하지 않으려면 Cancel을 클릭합니다. 게시가 완료되면 업데이트된 행이 포함된 새 버전의
Dataset을 UI에서 사용할 수 있습니다.

데이터셋 삭제
Dataset을 Weave 프로젝트에서 제거하려면 다음 절차를 따르세요.
-
수정하려는
Dataset이 있는 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset이 표시됩니다. -
객체 열에서 삭제하려는
Dataset의 이름과 버전을 클릭합니다. 이름, 버전, 작성자,Dataset행 등Dataset정보가 표시된 팝아웃 모달이 나타납니다. -
모달 오른쪽 상단에서 휴지통 아이콘을 클릭합니다.
Dataset삭제를 확인하는 팝업 모달이 나타납니다.
-
팝업 모달에서 Delete를 클릭해
Dataset을 삭제합니다.Dataset을 삭제하지 않으려면 Cancel을 클릭합니다.Dataset이 삭제되며, Weave 대시보드의 Datasets 탭에 더 이상 표시되지 않습니다.
데이터셋에 새 에이전트 트레이스 추가
Dataset에 추가하려면 다음 단계를 따르세요.
- wandb.ai 로 이동한 다음 프로젝트를 선택하세요.
- Weave 프로젝트 sidebar에서 Agents를 클릭하세요.
- 상단 탭 바에서 Conversations를 클릭하세요.
- Conversations 테이블에서 대화 행을 선택해 대화 세부정보 사이드 패널을 여세요. 대화 세부정보 사이드 패널 헤더에는 에이전트 이름과 UUID가 표시됩니다.
-
대화 세부정보 사이드 패널 헤더에서 오른쪽의 테이블 아이콘을 클릭해 Add example to dataset drawer를 여세요.

- Choose a dataset에서 드롭다운을 사용해 트레이스를 추가할 데이터셋을 선택하세요.
- Select context에서 데이터셋에 추가할 메시지를 선택하세요. Next를 클릭하세요.
- 선택 내용을 검토한 다음 Add to dataset을 클릭하세요.
데이터셋에 새 트레이스 추가
Dataset에 추가하려면:
- 편집하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새 예제를 만들
Datasets가 있는 call을 하나 이상 선택합니다. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 있음)을 클릭합니다. 필요하면 Show latest versions를 꺼서 사용 가능한 모든 데이터셋의 전체 버전을 표시합니다.
-
Choose a dataset 드롭다운에서 예제를 추가할
Dataset을 선택합니다. 그러면 Configure field mapping 옵션이 표시됩니다. - 선택 사항: Configure field mapping에서 call의 필드를 해당 데이터셋 열에 매핑하는 방식을 조정할 수 있습니다.
-
필드 매핑 구성을 마치면 Next를 클릭합니다. 새
Dataset의 미리보기가 표시됩니다. - 빈 행(초록색)에 새 예제 값을 추가합니다. id 필드는 편집할 수 없으며 Weave가 자동으로 생성합니다.
- Add to dataset을 클릭합니다. 또는 Configure field mapping 화면으로 돌아가려면 Back을 클릭합니다.
-
확인 팝업에서 View the dataset을 클릭해 변경 사항을 확인합니다. 또는 Datasets 탭으로 이동해
Dataset의 업데이트를 확인합니다.
기타 데이터셋 오퍼레이션
Dataset이 있을 때 유용한 추가 SDK 오퍼레이션을 다룹니다.
- Python
- TypeScript
행 선택
select 메서드를 사용하면 인덱스를 기준으로 Dataset에서 특정 행을 선택할 수 있습니다. 예를 들어 더 적은 수의 예시를 대상으로 평가하려는 경우처럼 데이터의 하위 집합을 만들 때 유용합니다.