Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

53.9K 00

일반 소개

마에스트로는 누구나 자신만의 시각적 그랜드 모델을 훈련할 수 있도록 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하기 위해 Roboflow에서 개발한 툴입니다. 마에스트로는 플로렌스-2, 팔리젬마 2, 큐웬2.5-VL 등 인기 있는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공하며, 구성, 데이터 로드, 재현성 및 훈련 루프 설정을 다루는 핵심 모듈에 모범 사례를 캡슐화하여 사용자가 모델을 보다 효율적으로 미세 조정할 수 있도록 지원합니다.

기능 목록

구성 관리모델의 구성 파일을 자동으로 처리하여 설정 프로세스를 간소화합니다.
데이터 로드다양한 데이터 형식 지원, 자동화된 데이터 전처리 및 로딩.
교육 주기 설정교육 과정의 반복성을 보장하기 위해 표준화된 교육 주기를 제공합니다.
기성품 공식사용자가 직접 사용할 수 있는 모델에 대한 다양한 미세 조정 레시피를 제공합니다.
명령줄 인터페이스(CLI)미세 조정 프로세스는 간단한 명령줄 명령으로 시작됩니다.
Python API: 미세 조정 프로세스를 사용자 지정할 수 있는 유연한 Python 인터페이스를 제공합니다.
요리책사용자가 빠르게 시작할 수 있도록 도와주는 자세한 튜토리얼과 예제.

도움말 사용

설치 프로세스

가상 환경 만들기모델마다 상충되는 종속성이 있을 수 있으므로 각 모델에 대해 전용 Python 환경을 만드는 것이 좋습니다.

   python -m venv maestro_env
source maestro_env/bin/activate

종속성 설치필요에 따라 모델별 종속성을 설치합니다.

   pip install "maestro[paligemma_2]"

명령줄 인터페이스(CLI) 사용

미세 조정 시작명령줄 인터페이스를 사용하여 데이터 세트 위치, 학습 라운드 수, 배치 크기, 최적화 전략 및 평가 지표와 같은 주요 매개 변수를 지정하여 미세 조정 프로세스를 시작합니다.

   maestro paligemma_2 train \
--dataset "dataset/location" \
--epochs 10 \
--batch-size 4 \
--optimization_strategy "qlora" \
--metrics "edit_distance"

Python API 사용

교육 함수 가져오기: 해당 모듈에서 트레이닝 함수를 가져와 사전에서 구성을 정의합니다.

   from maestro.trainer.models.paligemma_2.core import train
config = {
"dataset": "dataset/location",
"epochs": 10,
"batch_size": 4,
"optimization_strategy": "qlora",
"metrics": ["edit_distance"]
}
train(config)