> ## Documentation Index
> Fetch the complete documentation index at: https://docs.wandb.ai/llms.txt
> Use this file to discover all available pages before exploring further.

> W&B로 OpenAI 모델을 파인튜닝하여 트레이닝 메트릭을 로깅하고, 작업을 모니터링하며, 시간 경과에 따른 모델 성능을 비교합니다.

# OpenAI 파인튜닝

export const ColabLink = ({url}) => <a href={url} target="_blank" rel="noopener noreferrer" className="colab-link">
    <svg width="20" height="20" viewBox="0 0 24 24" fill="currentColor" xmlns="http://www.w3.org/2000/svg">
      <path d="M14.25.18l.9.2.73.26.59.3.45.32.34.34.25.34.16.33.1.3.04.26.02.2-.01.13V8.5l-.05.63-.13.55-.21.46-.26.38-.3.31-.33.25-.35.19-.35.14-.33.1-.3.07-.26.04-.21.02H8.77l-.69.05-.59.14-.5.22-.41.27-.33.32-.27.35-.2.36-.15.37-.1.35-.07.32-.04.27-.02.21v3.06H3.17l-.21-.03-.28-.07-.32-.12-.35-.18-.36-.26-.36-.36-.35-.46-.32-.59-.28-.73-.21-.88-.14-1.05-.05-1.23.06-1.22.16-1.04.24-.87.32-.71.36-.57.4-.44.42-.33.42-.24.4-.16.36-.1.32-.05.24-.01h.16l.06.01h8.16v-.83H6.18l-.01-2.75-.02-.37.05-.34.11-.31.17-.28.25-.26.31-.23.38-.2.44-.18.51-.15.58-.12.64-.1.71-.06.77-.04.84-.02 1.27.05zm-6.3 1.98l-.23.33-.08.41.08.41.23.34.33.22.41.09.41-.09.33-.22.23-.34.08-.41-.08-.41-.23-.33-.33-.22-.41-.09-.41.09zm13.09 3.95l.28.06.32.12.35.18.36.27.36.35.35.47.32.59.28.73.21.88.14 1.04.05 1.23-.06 1.23-.16 1.04-.24.86-.32.71-.36.57-.4.45-.42.33-.42.24-.4.16-.36.09-.32.05-.24.02-.16-.01h-8.22v.82h5.84l.01 2.76.02.36-.05.34-.11.31-.17.29-.25.25-.31.24-.38.2-.44.17-.51.15-.58.13-.64.09-.71.07-.77.04-.84.01-1.27-.04-1.07-.14-.9-.2-.73-.25-.59-.3-.45-.33-.34-.34-.25-.34-.16-.33-.1-.3-.04-.25-.02-.2.01-.13v-5.34l.05-.64.13-.54.21-.46.26-.38.3-.32.33-.24.35-.2.35-.14.33-.1.3-.06.26-.04.21-.02.13-.01h5.84l.69-.05.59-.14.5-.21.41-.28.33-.32.27-.35.2-.36.15-.36.1-.35.07-.32.04-.28.02-.21V6.07h2.09l.14.01.21.03zm-6.47 14.25l-.23.33-.08.41.08.41.23.33.33.23.41.08.41-.08.33-.23.23-.33.08-.41-.08-.41-.23-.33-.33-.23-.41-.08-.41.08z" />
    </svg>
    Colab에서 사용해 보기
  </a>;

<ColabLink url="https://wandb.me/openai-colab" />

OpenAI GPT-3.5 또는 GPT-4 모델의 파인튜닝 메트릭과 설정을 W\&B에 기록하세요. W\&B 에코시스템을 활용해 파인튜닝 실험, 모델, 데이터셋을 추적하고 결과를 동료들과 공유할 수 있습니다.

<Note>
  파인튜닝할 수 있는 모델 목록은 [OpenAI documentation](https://platform.openai.com/docs/guides/fine-tuning/which-models-can-be-fine-tuned)을 참조하세요.
</Note>

파인튜닝을 위해 OpenAI와 W\&B를 통합하는 방법에 대한 추가 정보는 OpenAI documentation의 [W\&B Integration](https://developers.openai.com/cookbook/examples/third_party/gpt_finetuning_with_wandb) 섹션을 참조하세요.

<div id="install-or-update-openai-python-api">
  ## OpenAI Python API 설치 또는 업데이트
</div>

W\&B OpenAI 파인튜닝 인테그레이션은 OpenAI 버전 1.0 이상을 지원합니다. 최신 버전은 [OpenAI Python API](https://pypi.org/project/openai/) 라이브러리의 PyPI 문서를 참조하세요.

OpenAI Python API를 설치하려면 다음을 실행하세요:

```python theme={null}
pip install openai
```

이미 OpenAI Python API가 설치되어 있다면, 다음 명령으로 업데이트할 수 있습니다:

```python theme={null}
pip install -U openai
```

<div id="sync-your-openai-fine-tuning-results">
  ## OpenAI 파인튜닝 결과 동기화하기
</div>

W\&B를 OpenAI의 파인튜닝 API와 통합하여 파인튜닝 메트릭과 설정을 W\&B에 기록하세요. 이렇게 하려면 `wandb.integration.openai.fine_tuning` 모듈의 `WandbLogger` 클래스를 사용하세요.

```python theme={null}
from wandb.integration.openai.fine_tuning import WandbLogger

# 파인튜닝 로직

WandbLogger.sync(fine_tune_job_id=FINETUNE_JOB_ID)
```

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/mVjDwbx0mC8gYx-b/images/integrations/open_ai_auto_scan.png?fit=max&auto=format&n=mVjDwbx0mC8gYx-b&q=85&s=6d152aaf27c90463e32ed3e85602f4a8" alt="OpenAI 자동 스캔" width="1600" height="779" data-path="images/integrations/open_ai_auto_scan.png" />
</Frame>

<div id="sync-your-fine-tunes">
  ### 파인튜닝 결과 동기화하기
</div>

스크립트의 결과를 동기화하세요

```python theme={null}
from wandb.integration.openai.fine_tuning import WandbLogger

# 한 줄 명령어
WandbLogger.sync()

# 선택 매개변수 전달
WandbLogger.sync(
    fine_tune_job_id=None,
    num_fine_tunes=None,
    project="OpenAI-Fine-Tune",
    entity=None,
    overwrite=False,
    model_artifact_name="model-metadata",
    model_artifact_type="model",
    **kwargs_wandb_init
)
```

<div id="reference">
  ### 레퍼런스
</div>

| Argument                | 설명                                                                                                                                                                                        |
| ----------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| fine\_tune\_job\_id     | `client.fine_tuning.jobs.create`를 사용해 파인튜닝 작업을 생성할 때 받는 OpenAI Fine-Tune ID입니다. 이 매개변수가 None(기본값)이면, 아직 동기화되지 않은 모든 OpenAI 파인튜닝 작업이 W\&B로 동기화됩니다.                                         |
| openai\_client          | 초기화된 OpenAI 클라이언트를 `sync`에 전달합니다. 클라이언트가 제공되지 않으면 로거가 직접 클라이언트를 초기화합니다. 기본값은 None입니다.                                                                                                     |
| num\_fine\_tunes        | ID를 제공하지 않으면 동기화되지 않은 모든 파인튜닝이 W\&B에 로깅됩니다. 이 매개변수를 사용하면 동기화할 최신 파인튜닝 개수를 선택할 수 있습니다. num\_fine\_tunes가 5이면 가장 최근 파인튜닝 5개를 선택합니다.                                                         |
| project                 | 파인튜닝 메트릭, 모델, 데이터 등이 로깅될 W\&B 프로젝트 이름입니다. 기본 프로젝트 이름은 `"OpenAI-Fine-Tune"`입니다.                                                                                                            |
| entity                  | run을 전송할 W\&B 사용자 이름 또는 팀 이름입니다. 기본적으로는 기본 entity가 사용되며, 일반적으로 사용자 이름입니다.                                                                                                                 |
| overwrite               | 동일한 파인튜닝 작업에 해당하는 기존 wandb run에 강제로 로깅하고 덮어씁니다. 기본값은 False입니다.                                                                                                                            |
| wait\_for\_job\_success | OpenAI 파인튜닝 작업이 시작되면 보통 완료까지 다소 시간이 걸립니다. 파인튜닝 작업이 끝나는 즉시 메트릭이 W\&B에 로깅되도록 이 설정은 60초마다 파인튜닝 작업의 status가 `succeeded`로 변경되었는지 확인합니다. 작업이 성공한 것으로 감지되면 메트릭이 자동으로 W\&B에 동기화됩니다. 기본값은 True입니다. |
| model\_artifact\_name   | 로깅되는 모델 artifact의 이름입니다. 기본값은 `"model-metadata"`입니다.                                                                                                                                      |
| model\_artifact\_type   | 로깅되는 모델 artifact의 유형입니다. 기본값은 `"model"`입니다.                                                                                                                                               |
| \*\*kwargs\_wandb\_init | [`wandb.init()`](/ko/models/ref/python/functions/init)에 직접 전달되는 추가 매개변수                                                                                                                   |

<div id="dataset-versioning-and-visualization">
  ## 데이터셋 버전 관리 및 시각화
</div>

<div id="versioning">
  ### 버전 관리
</div>

파인튜닝을 위해 OpenAI에 업로드한 트레이닝 및 검증 데이터는 더 쉽게 버전을 관리할 수 있도록 자동으로 W\&B Artifacts에 로깅됩니다. 아래는 Artifacts에서 트레이닝 파일을 표시한 뷰입니다. 여기에서 이 파일을 로깅한 W\&B run, 로깅된 시점, 이 데이터셋의 버전, 메타데이터, 그리고 트레이닝 데이터에서 학습된 모델까지의 DAG 리니지를 확인할 수 있습니다.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/mVjDwbx0mC8gYx-b/images/integrations/openai_data_artifacts.png?fit=max&auto=format&n=mVjDwbx0mC8gYx-b&q=85&s=dac293cde2af9b21a77c049a41fd18c7" alt="트레이닝 데이터셋이 있는 W&B Artifacts" width="3450" height="1166" data-path="images/integrations/openai_data_artifacts.png" />
</Frame>

<div id="visualization">
  ### 시각화
</div>

데이터셋은 W\&B Tables로 시각화되며, 이를 통해 데이터셋을 탐색하고 검색하며 상호작용할 수 있습니다. 아래에서 W\&B Tables로 시각화한 트레이닝 샘플을 확인하세요.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/mVjDwbx0mC8gYx-b/images/integrations/openai_data_visualization.png?fit=max&auto=format&n=mVjDwbx0mC8gYx-b&q=85&s=545f9a3355dfe483b87aa2dcb5e0b3f4" alt="OpenAI 데이터" width="2758" height="1294" data-path="images/integrations/openai_data_visualization.png" />
</Frame>

<div id="the-fine-tuned-model-and-model-versioning">
  ## 파인튜닝된 모델과 모델 버전 관리
</div>

OpenAI는 파인튜닝된 모델의 ID를 제공합니다. 모델 가중치에는 액세스할 수 없으므로 `WandbLogger`는 모델의 모든 세부 정보(하이퍼파라미터, 데이터 파일 ID 등)와 `fine_tuned_model`` ID가 포함된 `model\_metadata.json\` 파일을 생성하고, 이를 W\&B Artifact로 로깅합니다.

이 모델(메타데이터) Artifact는 [W\&B Registry](/ko/models/registry/)의 모델에 추가로 연결할 수 있습니다.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/mVjDwbx0mC8gYx-b/images/integrations/openai_model_metadata.png?fit=max&auto=format&n=mVjDwbx0mC8gYx-b&q=85&s=e39d37d961780edd14ce663b1b5c3d9e" alt="OpenAI 모델 메타데이터" width="3450" height="1512" data-path="images/integrations/openai_model_metadata.png" />
</Frame>

<div id="frequently-asked-questions">
  ## 자주 묻는 질문
</div>

<div id="how-do-i-share-my-fine-tune-results-with-my-team-in-wb">
  ### W\&B에서 내 fine-tune 결과를 팀과 공유하려면 어떻게 하나요?
</div>

다음을 사용해 fine-tune 작업을 팀 계정에 기록하세요:

```python theme={null}
WandbLogger.sync(entity="YOUR_TEAM_NAME")
```

<div id="how-can-i-organize-my-runs">
  ### run을 어떻게 정리할 수 있나요?
</div>

W\&B run은 자동으로 정리되며, 작업 유형, base model, 학습률, 트레이닝 파일 이름, 기타 하이퍼파라미터 등 모든 설정 파라미터를 기준으로 필터링하거나 정렬할 수 있습니다.

또한 run 이름을 바꾸고, notes를 추가하거나, tags를 만들어 그룹으로 묶을 수 있습니다.

원하는 대로 정리했다면 Workspace를 저장하고, 이를 사용해 run과 저장된 artifact(트레이닝/검증 파일)에서 데이터를 임포트하여 리포트를 만들 수 있습니다.

<div id="how-can-i-access-my-fine-tuned-model">
  ### 파인튜닝한 모델에 어떻게 액세스할 수 있나요?
</div>

파인튜닝한 모델 ID는 W\&B에 아티팩트(`model_metadata.json`)와 설정으로 로깅됩니다.

```python theme={null}
import wandb
    
with wandb.init(project="OpenAI-Fine-Tune", entity="YOUR_TEAM_NAME") as run:
    ft_artifact = run.use_artifact("ENTITY/PROJECT/model_metadata:VERSION")
    artifact_dir = ft_artifact.download()
```

여기서 `VERSION`은 다음 중 하나입니다:

* `v2`와 같은 버전 번호
* `ft-xxxxxxxxx`와 같은 파인튜닝 id
* `latest`처럼 자동으로 추가되었거나 수동으로 추가된 alias

그런 다음 다운로드한 `model_metadata.json` 파일을 읽어 `fine_tuned_model` id를 확인할 수 있습니다.

<div id="what-if-a-fine-tune-was-not-synced-successfully">
  ### 파인튜닝이 정상적으로 동기화되지 않았다면 어떻게 하나요?
</div>

파인튜닝이 W\&B에 정상적으로 로깅되지 않았다면 `overwrite=True`를 사용하고 파인튜닝 작업 ID를 전달하세요:

```python theme={null}
WandbLogger.sync(
    fine_tune_job_id="FINE_TUNE_JOB_ID",
    overwrite=True,
)
```

<div id="can-i-track-my-datasets-and-models-with-wb">
  ### W\&B로 데이터셋과 모델을 추적할 수 있나요?
</div>

트레이닝 및 검증 데이터는 W\&B에 아티팩트 형태로 자동 로깅됩니다. 파인튜닝된 모델의 ID를 포함한 메타데이터도 아티팩트로 로깅됩니다.

언제든지 `wandb.Artifact`, `wandb.Run.log` 같은 저수준 wandb API를 사용해 파이프라인을 제어할 수 있습니다. 이를 통해 데이터와 모델을 완전히 추적할 수 있습니다.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/mVjDwbx0mC8gYx-b/images/integrations/open_ai_faq_can_track.png?fit=max&auto=format&n=mVjDwbx0mC8gYx-b&q=85&s=df528635783bca105c81c18389b11781" alt="OpenAI 추적 FAQ" width="1088" height="260" data-path="images/integrations/open_ai_faq_can_track.png" />
</Frame>

<div id="resources">
  ## 리소스
</div>

* [OpenAI 파인튜닝 문서](https://platform.openai.com/docs/guides/fine-tuning/)는 매우 상세하고 유용한 팁도 많이 담고 있습니다
* [데모 Colab](https://wandb.me/openai-colab)
* [W\&B로 OpenAI GPT-3.5 및 GPT-4 모델을 파인튜닝하는 방법](https://wandb.me/openai-report) 리포트
