Prodigy
Prodigy는 기계학습 모델, 오류 분석, 데이터 검사 및 정리를 위한 트레이닝 및 평가 데이터 생성용 어노테이션 툴입니다. W&B Tables를 사용하면 W&B 내에서 데이터셋(그리고 그 이상!)을 로그, 시각화, 분석 및 공유할 수 있습니다.
Prodigy와의 W&B 인테그레이션은 Prodigy로 어노테이션된 데이터셋을 W&B의 Tables와 함께 사용하기 위해 직접 업로드하는 간단하고 쉬운 기능을 추가합니다.
이와 같은 몇 줄의 코드를 실행하세요:
import wandb
from wandb.integration.prodigy import upload_dataset
with wandb.init(project="prodigy"):
upload_dataset("news_headlines_ner")
그리고 이와 같은 시각적이고, 인터랙티브하며, 공유 가능한 테이블을 얻을 수 있습니다:
퀵스타트
로컬 Prodigy 데이터베이스에서 직접 어노테이션된 Prodigy 데이터셋을 W&B의 Table 형식으로 업로드하려면 wandb.integration.prodigy.upload_dataset
을 사용하세요. Prodigy에 대한 더 자세한 정보, 설치 및 설정을 포함해서는 Prodigy 문서를 참조하세요.
W&B는 자동으로 이미지와 명명된 엔티티 필드를 각각 wandb.Image
와 wandb.Html
로 변환하려고 시도합니다. 이러한 시각화를 포함하기 위해 결과 테이블에 추가 열이 추가될 수 있습니다.
자세한 예제 읽어보기
W&B Prodigy 인테그레이션으로 생성된 예시 시각화를 탐색하려면 Visualizing Prodigy Datasets Using W&B Tables를 확인하세요.
spaCy도 사용하고 있나요?
W&B는 spaCy와도 인테그레이션이 있습니다. 여기 문서를 참조하세요.