Инженерный институт искусственного интеллекта: 3Fine-tuning (тонкая настройка больших языковых моделей)

📚 Структура базы данных

Модели/каталогиОписание и содержание
АксолотльСистема для тонкой настройки языковых моделей
ДжеммаПоследняя реализация Большой языковой модели Google
finetune-gemma.ipynb - gemma-sft.py - Gemma_finetuning_notebook.ipynbДоработка блокнотов и сценариев
LLama2Большая языковая модель Meta с открытым исходным кодом
generate_response_stream.py - Llama2_finetuning_notebook.ipynb - Llama_2_Fine_Tuning_using_QLora.ipynbРекомендации по внедрению и тонкой настройке
Ллама3Предстоящие эксперименты с метаязыковым моделированием
Llama3_finetuning_notebook.ipynbНачальные эксперименты по тонкой настройке
LlamaFactoryФреймворк для обучения и развертывания больших языковых моделей
LLMArchitecture/ParameterCountТехнические детали архитектуры модели
Мистраль-7bМистраль ИИ Модель с 7 миллиардами параметров
LLM_evaluation_harness_for_Arc_Easy_and_SST.ipynb - Mistral_Colab_Finetune_ipynb_Colab_Final.ipynb - notebooks_chatml_inference.ipynb - notebooks_DPO_fine_tuning.ipynb - notebooks_SFTTrainer TRL.ipynb - SFT.pyВстроенный блокнот для оценки, доработки и рассуждений
MixtralЭкспертная модель смешивания Mixtral
Mixtral_fine_tuning.ipynbТонкая настройка реализации
VLMвизуальная модель языка
Florence2_finetuning_notebook.ipynb - PaliGemma_finetuning_notebook.ipynbРеализация модели визуального языка

🎯 Обзор модулей

1. архитектура LLM

  • Изучите следующие варианты реализации модели:
    • Llama2 (модель Meta с открытым исходным кодом)
    • Мистраль-7b (эффективная модель с 7 миллиардами параметров)
    • Mixtral (экспертная архитектура смесей)
    • Джемма (последний вклад Google)
    • Llama3 (предстоящий эксперимент)

2. 🛠️ Технология тонкой настройки

  • стратегия реализации
  • Методология LoRA (адаптация низкого ранга)
  • Передовые методы оптимизации

3. 🏗️ Анализ архитектуры модели

  • Углубленное изучение структуры модели
  • Метод расчета параметров
  • Соображения по масштабируемости

4. 🔧 Профессиональная самореализация

  • Code Llama для решения задач по программированию
  • Визуальное моделирование языка:
    • Флоренция2
    • PaliGemma

5. 💻 Практическое применение

  • Интегрированный блокнот Jupyter Notebook
  • Трубопровод для генерации ответов
  • Руководство по внедрению рассуждений

6. 🚀 Расширенные темы

  • DPO (прямая оптимизация предпочтений)
  • SFT (контролируемая тонкая настройка)
  • Методология оценки
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...