로컬 모델 함수를 @weave.op()으로 감싸기
weave.init('<your-project-name>')로 Weave를 초기화한 다음, LLM Call을 weave.op()으로 감싸면 어떤 LLM이든 Weave와 통합할 수 있습니다. 자세한 내용은 Tracing 가이드를 참조하세요.
OpenAI SDK 코드가 로컬 모델을 사용하도록 업데이트하기
openai.OpenAI()를 초기화할 때 사용하는 base_url 매개변수입니다. 이 설정은 OpenAI SDK가 OpenAI hosted API 대신 로컬 서버로 요청을 보내도록 합니다.
api_key는 어떤 string 값이든 사용할 수 있지만, 반드시 직접 설정해야 합니다. 그렇지 않으면 OpenAI SDK가 환경 변수에서 해당 값을 읽어와 오류를 표시합니다.
지원되는 로컬 모델 러너
- Nomic GPT4All - Settings의 Local Server를 통해 지원(FAQ)
- LMStudio - Local Server의 OpenAI SDK 지원 문서
- Ollama - OpenAI SDK용 OpenAI 호환성
- llama-cpp-python - OpenAI SDK를 지원하는
llama.cpp실행용 Python 패키지 - llamafile - Llamafile을 실행하면
http://localhost:8080/v1에서 OpenAI SDK가 자동으로 지원됩니다