Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

최신 AI 리소스6개월 전 업데이트 AI 공유 서클
1.6K 00

일반 소개

마에스트로는 누구나 자신만의 시각적 그랜드 모델을 훈련할 수 있도록 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하기 위해 Roboflow에서 개발한 툴입니다. 마에스트로는 플로렌스-2, 팔리젬마 2, 큐웬2.5-VL 등 인기 있는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공하며, 구성, 데이터 로드, 재현성 및 훈련 루프 설정을 다루는 핵심 모듈에 모범 사례를 캡슐화하여 사용자가 모델을 보다 효율적으로 미세 조정할 수 있도록 지원합니다.

Maestro:简化主流开源视觉语言模型微调过程的工具

 

기능 목록

  • 구성 관리모델의 구성 파일을 자동으로 처리하여 설정 프로세스를 간소화합니다.
  • 데이터 로드다양한 데이터 형식 지원, 자동화된 데이터 전처리 및 로딩.
  • 교육 주기 설정교육 과정의 반복성을 보장하기 위해 표준화된 교육 주기를 제공합니다.
  • 기성품 공식사용자가 직접 사용할 수 있는 모델에 대한 다양한 미세 조정 레시피를 제공합니다.
  • 명령줄 인터페이스(CLI)미세 조정 프로세스는 간단한 명령줄 명령으로 시작됩니다.
  • Python API: 미세 조정 프로세스를 사용자 지정할 수 있는 유연한 Python 인터페이스를 제공합니다.
  • 요리책사용자가 빠르게 시작할 수 있도록 도와주는 자세한 튜토리얼과 예제.

 

도움말 사용

설치 프로세스

  1. 가상 환경 만들기모델마다 상충되는 종속성이 있을 수 있으므로 각 모델에 대해 전용 Python 환경을 만드는 것이 좋습니다.
   python -m venv maestro_env
source maestro_env/bin/activate
  1. 종속성 설치필요에 따라 모델별 종속성을 설치합니다.
   pip install "maestro[paligemma_2]"

명령줄 인터페이스(CLI) 사용

  1. 미세 조정 시작명령줄 인터페이스를 사용하여 데이터 세트 위치, 학습 라운드 수, 배치 크기, 최적화 전략 및 평가 지표와 같은 주요 매개 변수를 지정하여 미세 조정 프로세스를 시작합니다.
   maestro paligemma_2 train \
--dataset "dataset/location" \
--epochs 10 \
--batch-size 4 \
--optimization_strategy "qlora" \
--metrics "edit_distance"

Python API 사용

  1. 교육 함수 가져오기: 해당 모듈에서 트레이닝 함수를 가져와 사전에서 구성을 정의합니다.
   from maestro.trainer.models.paligemma_2.core import train
config = {
"dataset": "dataset/location",
"epochs": 10,
"batch_size": 4,
"optimization_strategy": "qlora",
"metrics": ["edit_distance"]
}
train(config)

쿡북 사용

예를 들어 Maestro는 사용자가 다양한 시각적 작업에서 다양한 VLM을 미세 조정하는 방법을 배울 수 있도록 자세한 쿡북을 제공합니다:

  • LoRA로 대상 감지를 위한 Florence-2 미세 조정하기
  • LoRA로 JSON 데이터 추출을 위한 PaliGemma 2 미세 조정하기
  • QLoRA로 미세 조정 Qwen2.5-VL JSON 데이터 추출 수행
© 저작권 정책
AiPPT

관련 게시물

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...