Together AI - Weights & Biases Documentation

Together AI は、生成 AI モデルの構築とファインチューニングのためのプラットフォームです。オープンソース LLM に注力しており、ユーザーは独自のモデルをファインチューニングしてホストできます。このガイドでは、Together の OpenAI SDK との互換性を使用して、Weave で Together AI のモデル呼び出しをトレースして評価する方法を説明します。オープンソース LLM の入力、出力、パフォーマンスを、Weave でトラッキングされる他の作業とあわせてモニターできます。

Weave による together Python パッケージの完全サポートは現在開発中です。

それまでの間、Together は OpenAI SDK との互換性をサポートしており、Weave はこれを自動的に検出して連携します。標準の OpenAI クライアントを使用して Together AI モデルを呼び出し、追加のセットアップなしで Weave の自動トレースを利用できます。 Together API に切り替えるには、api_key をお使いの Together API キーに、base_url を https://api.together.xyz/v1 に、model をチャットモデルのいずれかに設定します。次の例では、Weave を初期化してから、Together でホストされているモデルに対して Chat Completion を呼び出します。実行すると、その呼び出しは Weave プロジェクト内にトレースとして表示されます。

import os
import openai
import weave

weave.init('together-weave')

system_content = "You are a travel agent. Be descriptive and helpful."
user_content = "Tell me about San Francisco"

client = openai.OpenAI(
    api_key=os.environ.get("TOGETHER_API_KEY"),
    base_url="https://api.together.xyz/v1",
)
chat_completion = client.chat.completions.create(
    model="mistralai/Mixtral-8x7B-Instruct-v0.1",
    messages=[
        {"role": "system", "content": system_content},
        {"role": "user", "content": user_content},
    ],
    temperature=0.7,
    max_tokens=1024,
)
response = chat_completion.choices[0].message.content
print("Together response:\n", response)

これは使い始めるための例です。より複雑なユースケースで独自の関数を Weave に統合する方法について詳しくは、OpenAI ガイドを参照してください。

OpenRouter

OpenAI Realtime API

⌘I