はじめに
クイックスタート: LLM の入力と出力をトラッキングする
まずは LLM への基本的な call をトレースし、W&B アカウントでデータを確認します。
アプリの評価を始める
Weave scorer を使って評価パイプラインを構築し、アプリケーションのパフォーマンスをテストしてトラッキングする方法を学びます。
RAG アプリケーションを評価する
Weave と LLM judges を使用して RAG アプリケーションを構築・評価し、検索品質を測定します。
Weaveをインストール
- Python
- TypeScript