Skip to main content
서버 에러는 W&B Inference 서비스의 일시적인 문제를 나타냅니다.

에러 유형

500 - Internal Server Error

메시지: “The server had an error while processing your request” 이것은 서버 측의 일시적인 내부 에러입니다.

503 - Service Overloaded

메시지: “The engine is currently overloaded, please try again later” 서비스에 트래픽이 몰리고 있습니다.

서버 에러 해결 방법

  1. 재시도 전 대기
    • 500 에러: 30-60초 대기
    • 503 에러: 60-120초 대기
  2. 지수 백오프(Exponential backoff) 사용
    import time
    import openai
    
    def call_with_retry(client, messages, model, max_retries=5):
        for attempt in range(max_retries):
            try:
                return client.chat.completions.create(
                    model=model,
                    messages=messages
                )
            except Exception as e:
                if "500" in str(e) or "503" in str(e):
                    if attempt < max_retries - 1:
                        # 지수 백오프 적용
                        wait_time = min(60, (2 ** attempt))
                        time.sleep(wait_time)
                    else:
                        raise
                else:
                    raise
    
  3. 적절한 타임아웃 설정
    • HTTP 클라이언트의 타임아웃 값을 늘리세요.
    • 더 효율적인 처리를 위해 비동기(async) 작업을 고려하세요.

고객 지원에 문의해야 하는 경우

다음과 같은 경우 고객 지원팀에 문의하세요:
  • 에러가 10분 이상 지속될 때
  • 특정 시간대에 반복적으로 실패가 발생할 때
  • 에러 메시지에 추가 세부 정보가 포함되어 있을 때
제공 정보:
  • 에러 메시지 및 에러 코드
  • 에러 발생 시간
  • 사용 중인 코드조각 ( API 키 는 제거하세요)
  • W&B Entities 및 Projects 이름