Dataset은 프로그래밍 방식이나 UI를 통해 생성하고 상호작용할 수 있습니다.
이 페이지에서는 다음 내용을 설명합니다:
- Python 및 TypeScript에서의 기본적인
Dataset작업 및 시작 방법 - Weave calls와 같은 오브젝트로부터 Python 및 TypeScript에서
Dataset을 생성하는 방법 - UI에서
Dataset에 수행할 수 있는 작업
Dataset 퀵스타트
다음 코드 샘플은 Python 및 TypeScript를 사용하여 기본적인 Dataset 작업을 수행하는 방법을 보여줍니다. SDK를 사용하여 다음을 수행할 수 있습니다:
Dataset생성Dataset게시 (Publish)Dataset가져오기 (Retrieve)Dataset내의 특정 예시 엑세스
- Python
- TypeScript
다른 오브젝트로부터 Dataset 생성하기
- Python
- TypeScript
Python에서는 calls와 같은 일반적인 Weave 오브젝트나 그 다음,
pandas.DataFrame과 같은 Python 오브젝트로부터 Dataset을 구성할 수도 있습니다. 이 기능은 특정 예시들로부터 예시 Dataset을 만들고자 할 때 유용합니다.Weave call
하나 이상의 Weave calls로부터Dataset을 생성하려면, call 오브젝트를 가져와 from_calls 메소드의 리스트에 추가합니다.Pandas DataFrame
PandasDataFrame 오브젝트로부터 Dataset을 생성하려면 from_pandas 메소드를 사용합니다.Dataset을 다시 변환하려면 to_pandas를 사용합니다.Hugging Face Datasets
Hugging Facedatasets.Dataset 또는 datasets.DatasetDict 오브젝트로부터 Dataset을 생성하려면, 먼저 필요한 종속성이 설치되어 있는지 확인하세요:from_hf 메소드를 사용합니다. ‘train’, ‘test’, ‘validation’과 같이 여러 split이 포함된 DatasetDict를 제공하면, Weave는 자동으로 ‘train’ split을 사용하고 경고를 표시합니다. ‘train’ split이 없으면 에러가 발생합니다. 특정 split을 직접 제공할 수도 있습니다 (예: hf_dataset_dict['test']).weave.Dataset을 다시 Hugging Face Dataset으로 변환하려면 to_hf 메소드를 사용합니다.UI에서 Dataset 생성, 편집 및 삭제하기
UI에서 Dataset을 생성, 편집 및 삭제할 수 있습니다.
새 Dataset 생성하기
- 편집하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새
Dataset을 생성할 하나 이상의 call을 선택합니다. - 우측 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 위치)을 클릭합니다.
- Choose a dataset 드롭다운에서 Create new를 선택합니다. Dataset name 필드가 나타납니다.
-
Dataset name 필드에 데이터셋 이름을 입력합니다. Configure dataset fields 옵션이 나타납니다.
데이터셋 이름은 문자나 숫자로 시작해야 하며 문자, 숫자, 하이픈(-), 언더바(_)만 포함할 수 있습니다.
-
(선택 사항) Configure dataset fields에서 데이터셋에 포함할 call의 필드를 선택합니다.
- 선택한 각 필드의 컬럼 이름을 사용자 지정할 수 있습니다.
- 새
Dataset에 포함할 필드의 서브셋을 선택하거나 모든 필드 선택을 해제할 수 있습니다.
-
데이터셋 필드 구성을 마쳤으면 Next를 클릭합니다. 새
Dataset의 미리보기가 나타납니다. - (선택 사항) Dataset의 편집 가능한 필드를 클릭하여 항목을 수정합니다.
- Create dataset을 클릭합니다. 새로운 데이터셋이 생성됩니다.
-
확인 팝업에서 View the dataset을 클릭하여 새
Dataset을 확인합니다. 또는 Datasets 탭으로 이동할 수 있습니다.
Dataset 편집하기
-
편집하려는
Dataset이 포함된 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset목록이 표시됩니다.
-
Object 컬럼에서 편집하려는
Dataset의 이름과 버전을 클릭합니다. 이름, 버전, 작성자 및Dataset행(rows)과 같은 정보를 보여주는 팝아웃 모달이 표시됩니다.
-
모달의 우측 상단에서 Edit dataset 버튼(연필 아이콘)을 클릭합니다. 모달 하단에 + Add row 버튼이 나타납니다.

-
+ Add row를 클릭합니다. 기존
Dataset행 상단에 초록색 행이 나타나며, 이는Dataset에 새 행을 추가할 수 있음을 나타냅니다.
-
새 행에 데이터를 추가하려면 해당 행 내의 원하는 컬럼을 클릭합니다.
Dataset행의 기본 id 컬럼은 Weave가 생성 시 자동으로 할당하므로 편집할 수 없습니다. 서식 지정을 위한 Text, Code, Diff 옵션이 포함된 편집 모달이 나타납니다.
-
새 행에서 데이터를 추가하려는 각 컬럼에 대해 6단계를 반복합니다.

-
Dataset에 추가하려는 각 행에 대해 5단계를 반복합니다. -
편집이 끝나면 모달 우측 상단의 Publish를 클릭하여
Dataset을 게시합니다. 변경 사항을 게시하고 싶지 않다면 Cancel을 클릭합니다. 게시가 완료되면 업데이트된 행이 포함된 새로운 버전의
Dataset을 UI에서 확인할 수 있습니다.

Dataset 삭제하기
-
삭제하려는
Dataset이 포함된 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset목록이 표시됩니다. -
Object 컬럼에서 삭제하려는
Dataset의 이름과 버전을 클릭합니다.Dataset정보가 포함된 팝아웃 모달이 표시됩니다. -
모달의 우측 상단에서 휴지통 아이콘을 클릭합니다.
Dataset삭제 확인을 요청하는 팝업 모달이 나타납니다.
-
팝업 모달에서 빨간색 Delete 버튼을 클릭하여
Dataset을 삭제합니다. 삭제하지 않으려면 Cancel을 클릭합니다. 이제Dataset이 삭제되었으며 Weave 대시보드의 Datasets 탭에서 더 이상 보이지 않습니다.
Dataset에 새 예시 추가하기
- 편집하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새 예시를 추가하려는
Dataset과 관련된 하나 이상의 call을 선택합니다. - 우측 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 위치)을 클릭합니다. 선택적으로 Show latest versions를 꺼서 사용 가능한 모든 데이터셋의 모든 버전을 표시할 수 있습니다.
-
Choose a dataset 드롭다운에서 예시를 추가할
Dataset을 선택합니다. Configure field mapping 옵션이 나타납니다. - (선택 사항) Configure field mapping에서 call의 필드와 해당 데이터셋 컬럼 간의 매핑을 조정할 수 있습니다.
-
필드 매핑 구성을 마쳤으면 Next를 클릭합니다. 새
Dataset의 미리보기가 나타납니다. - 빈 행(초록색)에 새 예시 값을 추가합니다. id 필드는 편집할 수 없으며 Weave에 의해 자동으로 생성됩니다.
- Add to dataset을 클릭합니다. Configure field mapping 화면으로 돌아가려면 Back을 클릭합니다.
-
확인 팝업에서 View the dataset을 클릭하여 변경 사항을 확인합니다. 또는 Datasets 탭으로 이동하여
Dataset의 업데이트 내용을 확인할 수 있습니다.
기타 Dataset 작업
- Python
- TypeScript