Инженерный институт искусственного интеллекта: 3Fine-tuning (тонкая настройка больших языковых моделей)

База знаний по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

44.7K 00

📚 Структура базы данных

Модели/каталоги	Описание и содержание
Аксолотль	Система для тонкой настройки языковых моделей
Джемма	Последняя реализация Большой языковой модели Google
- `finetune-gemma.ipynb` - `gemma-sft.py` - `Gemma_finetuning_notebook.ipynb`	Доработка блокнотов и сценариев
LLama2	Большая языковая модель Meta с открытым исходным кодом
- `generate_response_stream.py` - `Llama2_finetuning_notebook.ipynb` - `Llama_2_Fine_Tuning_using_QLora.ipynb`	Рекомендации по внедрению и тонкой настройке
Ллама3	Предстоящие эксперименты с метаязыковым моделированием
- `Llama3_finetuning_notebook.ipynb`	Начальные эксперименты по тонкой настройке
LlamaFactory	Фреймворк для обучения и развертывания больших языковых моделей
LLMArchitecture/ParameterCount	Технические детали архитектуры модели
Мистраль-7b	Мистраль ИИ Модель с 7 миллиардами параметров
- `LLM_evaluation_harness_for_Arc_Easy_and_SST.ipynb` - `Mistral_Colab_Finetune_ipynb_Colab_Final.ipynb` - `notebooks_chatml_inference.ipynb` - `notebooks_DPO_fine_tuning.ipynb` - `notebooks_SFTTrainer TRL.ipynb` - `SFT.py`	Встроенный блокнот для оценки, доработки и рассуждений
Mixtral	Экспертная модель смешивания Mixtral
- `Mixtral_fine_tuning.ipynb`	Тонкая настройка реализации
VLM	визуальная модель языка
- `Florence2_finetuning_notebook.ipynb` - `PaliGemma_finetuning_notebook.ipynb`	Реализация модели визуального языка

🎯 Обзор модулей

1. архитектура LLM

Изучите следующие варианты реализации модели:
- Llama2 (модель Meta с открытым исходным кодом)
- Мистраль-7b (эффективная модель с 7 миллиардами параметров)
- Mixtral (экспертная архитектура смесей)
- Джемма (последний вклад Google)
- Llama3 (предстоящий эксперимент)

2. 🛠️ Технология тонкой настройки

стратегия реализации
Методология LoRA (адаптация низкого ранга)
Передовые методы оптимизации

3. 🏗️ Анализ архитектуры модели

Углубленное изучение структуры модели
Метод расчета параметров
Соображения по масштабируемости

4. 🔧 Профессиональная самореализация

Code Llama для решения задач по программированию
Визуальное моделирование языка:
- Флоренция2
- PaliGemma

5. 💻 Практическое применение

Интегрированный блокнот Jupyter Notebook
Трубопровод для генерации ответов
Руководство по внедрению рассуждений

6. 🚀 Расширенные темы

DPO (прямая оптимизация предпочтений)
SFT (контролируемая тонкая настройка)
Методология оценки

База знаний по искусственному интеллекту

© заявление об авторских правах

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Похожие статьи

YouTube Scriptwriter：Prompt 创作引人注目的视频脚本

Сценарист YouTube: Prompt создает убедительные видеосценарии

Утилитарные команды искусственного интеллекта Код #

2 года назад

052.5K

将文档转换为 Mermaid 格式知识（事实关系）图谱

Преобразование документов в формат Mermaid для отображения знаний (фактических отношений)

Утилитарные команды искусственного интеллекта

1 год назад

051K

360的 DeepSeek-R1 与 DeepSeek 官网原版的区别

Различия между DeepSeek-R1 для 360 и оригинальной официальной версией DeepSeek

Ответы ИИ

1 год назад

056.8K

建立品牌定位——终极营销文案ChatGPT提示词

Построение позиционирования бренда - окончательный вариант маркетингового копирования ChatGPT Prompts

Утилитарные команды искусственного интеллекта

2 года назад

042.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

нет

Нет комментариев...