weave.scorers.default_models
これらのScorerが返すオブジェクトには、入力テキストが安全または高品質かどうかを示す passed という真偽値属性と、モデルの生のスコアなど、より詳細な情報を含む metadata 属性が含まれます。
ローカルScorerは CPU でも実行できますが、最高のパフォーマンスを得るには GPU の使用を推奨します。
ローカルScorerは Weave Python SDK でのみ利用できます。Weave TypeScript SDK ではまだ利用できません。TypeScript で Weave Scorerを使用するには、関数ベースのScorerを参照してください。
前提条件
Scorerを選択
| Scorer | Scenario |
|---|---|
| WeaveToxicityScorerV1 | ヘイトスピーチや脅迫などを含む、AI システムの入力および出力内の有害なコンテンツを特定します。 |
| WeaveBiasScorerV1 | AI システムの入力および出力内の偏見やステレオタイプを含むコンテンツを検出します。生成テキストに含まれる有害なバイアスを減らすのに適しています。 |
| WeaveHallucinationScorerV1 | 入力と提供されたコンテキストに基づき、RAG システムの出力にハルシネーションが含まれるかどうかを特定します。 |
| WeaveContextRelevanceScorerV1 | AI システムの出力が、入力および提供されたコンテキストに関連しているかどうかを測定します。 |
| WeaveCoherenceScorerV1 | AI システムの出力の一貫性と論理構造を評価します。 |
| WeaveFluencyScorerV1 | AI システムの出力が流暢かどうかを測定します。 |
| WeaveTrustScorerV1 | 毒性、ハルシネーション、コンテキスト関連性、流暢さ、一貫性の各Scorerを組み合わせた集約Scorerです。 |
| PresidioScorer | Microsoft の Presidio ライブラリを使用して、AI システムの入力および出力内の個人を特定できる情報 (PII) を検出します。 |
WeaveBiasScorerV1
- 人種と出身: 人種差別、および出身国や地域、移民ステータス、民族性などに対するバイアス。
- ジェンダーとセクシュアリティ: 性差別、女性差別、同性愛嫌悪、トランスジェンダー嫌悪、セクシュアルハラスメントなど。
WeaveBiasScorerV1 は、ファインチューニング済みの deberta-small-long-nli モデルを使用します。モデル、データセット、およびキャリブレーションプロセスの詳細については、WeaveBiasScorerV1 W&B Report を参照してください。
使用上の注意
scoremethod では、outputパラメーターに文字列を渡す必要があります。- score が高いほど、そのテキストにバイアスが含まれているという予測が強いことを意味します。
thresholdパラメーターは設定済みですが、初期化時に上書きすることもできます。
使用例
WeaveToxicityScorerV1
- 人種と出身: 人種差別や、出身国・地域、移民ステータス、民族性などに対する偏見。
- ジェンダーとセクシュアリティ: 性差別、女性蔑視、同性愛嫌悪、トランスジェンダー嫌悪、セクシュアルハラスメントなど。
- 宗教: 個人の宗教に対する偏見や固定観念。
- 能力: 身体的、精神的、または知的な能力や障害に関する偏見。
- 暴力と虐待: 過度に生々しい暴力描写、暴力の脅迫、または暴力の扇動。
WeaveToxicityScorerV1 は、PleIAs のオープンソースの Celadon モデルを使用します。詳細は、WeaveToxicityScorerV1 W&B Reportを参照してください。
使用上のメモ
scoremethod では、outputパラメーターに文字列を渡す必要があります。- モデルは、5 つの異なるカテゴリに対して
0から3のスコアを返します。- これらのスコアの合計が
total_threshold(デフォルト値は5) を超える場合、入力は有害であると判定されます。 - いずれか 1 つのカテゴリのスコアが
category_threshold(デフォルトは2) を超える場合、入力は有害であると判定されます。
- これらのスコアの合計が
- フィルタリングをより厳しくするには、初期化時に
category_thresholdまたはtotal_thresholdを上書きします。
- モデルは、5 つの異なるカテゴリに対して
使用例
WeaveHallucinationScorerV1
WeaveHallucinationScorerV1 は、Vectara のオープンソースの HHEM 2.1 モデル を使用します。詳細は、WeaveHallucinationScorerV1 W&B Reportをご覧ください。
使用時のメモ
scoremethod では、queryパラメーターとoutputパラメーターに値を渡す必要があります。- コンテキストは
outputパラメーターに渡します (文字列または文字列のリストとして) 。 - output のスコアが高いほど、その出力にハルシネーションが含まれている可能性が高いことを示します。
thresholdパラメーターにはデフォルト値が設定されていますが、初期化時に上書きできます。
- コンテキストは
使用例
WeaveContextRelevanceScorerV1
WeaveContextRelevanceScorerV1 は、tasksource のファインチューニング済み deberta-small-long-nli モデルを使用します。詳細は、WeaveContextRelevanceScorerV1 W&B Report を参照してください。
使用に関するメモ
scoremethod では、queryとoutputの値を指定する必要があります。- コンテキストは
outputパラメーターに渡します (文字列または文字列のリスト) 。 - スコアが高いほど、そのコンテキストがクエリに関連しているという予測がより強いことを意味します。
scoremethod にverbose=Trueを渡すと、チャンクごとのスコアを取得できます。
- コンテキストは
使用例
WeaveCoherenceScorerV1
WeaveCoherenceScorerV1 は、tasksource のファインチューニング済み deberta-small-long-nli モデルを使用します。詳細は、WeaveCoherenceScorerV1 W&B Reportを参照してください。
使用上のメモ
scoremethod は、queryパラメーターとoutputパラメーターにテキストが渡されることを想定しています。- 出力スコアが高いほど、一貫性が高いという予測がより強いことを示します。
使用例
WeaveFluencyScorerV1
WeaveFluencyScorerV1 は、AnswerDotAI のファインチューニング済み ModernBERT-base モデルを使用します。詳細は、WeaveFluencyScorerV1 W&B Reportを参照してください。
使用時のメモ
scoremethod には、outputパラメーターにテキストを渡します。- 出力スコアが高いほど、流暢であることを示します。
使用例
WeaveTrustScorerV1
WeaveTrustScorerV1 は、RAG システム向けの複合Scorerで、他のScorerを Critical と Advisory の 2 つのカテゴリに分類することで、モデル出力の信頼性を評価します。複合スコアに基づいて、次の信頼レベルを返します。
high: 問題は検出されないmedium: Advisory の問題のみが検出されるlow: Critical の問題が検出される、または入力が空である
low の信頼レベルになります。Advisory Scorerで失敗した場合は、medium になります。
- Critical:
-
WeaveToxicityScorerV1 -
WeaveHallucinationScorerV1 -
WeaveContextRelevanceScorerV1 -
Advisory:
WeaveFluencyScorerV1WeaveCoherenceScorerV1
-
使用上の注意
- この scorer は、RAG パイプラインの評価向けに設計されています。
- 正しくスコアリングを行うには、
query、context、outputのキーが必要です。
- 正しくスコアリングを行うには、
使用例
PresidioScorer
使用上のメモ
- メールアドレスや電話番号などの特定のエンティティタイプを指定するには、Presidio エンティティのリストを
selected_entitiesパラメーターに渡します。指定しない場合、Presidio はデフォルトのエンティティリストに含まれるすべてのエンティティタイプを検出します。- メールアドレスや電話番号などの特定のエンティティタイプを検出するには、リストを
selected_entitiesパラメーターに渡します。 custom_recognizersパラメーターには、presidio.EntityRecognizerインスタンスのリストとしてカスタム認識器を渡せます。- 英語以外の入力を処理するには、
languageパラメーターを使用して言語を指定します。
- メールアドレスや電話番号などの特定のエンティティタイプを検出するには、リストを