AI Engineering Institute : 3Fine-tuning (réglage fin de grands modèles linguistiques)

Base de connaissances sur l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

8.1K 00

📚 Structure de la base de données

Modèles/Catalogue	Description et contenu
Axolotl	Un cadre pour le réglage fin des modèles linguistiques
Gemma	La dernière mise en œuvre du Big Language Model par Google
- `finetune-gemma.ipynb` - `gemma-sft.py` - `Gemma_finetuning_notebook.ipynb`	Peaufiner les carnets de notes et les scripts
LLama2	Le modèle Open Source de Meta pour les grandes langues
- `generate_response_stream.py` - `Llama2_finetuning_notebook.ipynb` - `Llama_2_Fine_Tuning_using_QLora.ipynb`	Lignes directrices pour la mise en œuvre et la mise au point
Llama3	Expériences à venir en matière de modélisation linguistique à grande échelle (Meta Large Language Modelling)
- `Llama3_finetuning_notebook.ipynb`	Expériences initiales de mise au point
LlamaFactory	Un cadre pour la formation et le déploiement de grands modèles linguistiques
LLMArchitecture/ParameterCount	Détails techniques de l'architecture du modèle
Mistral-7b	Mistral AI Le modèle à 7 milliards de paramètres
- `LLM_evaluation_harness_for_Arc_Easy_and_SST.ipynb` - `Mistral_Colab_Finetune_ipynb_Colab_Final.ipynb` - `notebooks_chatml_inference.ipynb` - `notebooks_DPO_fine_tuning.ipynb` - `notebooks_SFTTrainer TRL.ipynb` - `SFT.py`	Carnet de notes intégré pour l'évaluation, la mise au point et le raisonnement
Mixtral	Le modèle de mélange expert de Mixtral
- `Mixtral_fine_tuning.ipynb`	Affiner la réalisation
VLM	modèle de langage visuel
- `Florence2_finetuning_notebook.ipynb` - `PaliGemma_finetuning_notebook.ipynb`	Mise en œuvre du modèle de langage visuel

🎯 Aperçu du module

1. architecture LLM

Examinez les mises en œuvre des modèles suivants :
- Llama2 (modèle open source de Meta)
- Mistral-7b (modèle efficace à 7 milliards de paramètres)
- Mixtral (Architecture experte des mélanges)
- Gemma (dernière contribution de Google)
- Llama3 (expérience à venir)

2. 🛠️ technologie de réglage fin

stratégie de mise en œuvre
Méthodologie LoRA (Low Rank Adaptation)
Méthodes d'optimisation avancées

3. 🏗️ analyse de l'architecture du modèle

Une étude approfondie de la structure du modèle
Méthode de calcul des paramètres
Considérations sur l'évolutivité

4. 🔧 L'épanouissement professionnel

Code Llama pour les tâches de programmation
Modélisation du langage visuel :
- Florence2
- PaliGemma

5. 💻 Applications pratiques

Bloc-notes Jupyter intégré
Pipeline de génération de réponses
Guide de mise en œuvre du raisonnement

6 🚀 Thèmes avancés

DPO (Optimisation des préférences directes)
SFT (réglage fin supervisé)
Méthodologie d'évaluation

Base de connaissances sur l'IA

© déclaration de droits d'auteur

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Cursor 提示 User is unauthorized，Unauthorized request

Invite du curseur L'utilisateur n'est pas autorisé, Demande non autorisée

Il y a 7 mois

012.7K

数字服务产品介绍——终极营销文案ChatGPT提示词

Introduction d'un produit de services numériques - L'ultime copie marketing ChatGPT Prompts

Commandes d'utilitaires AI

il y a 1 an

08.3K

免费使用 Gemini 2.0 将语音转换为多发言人字幕

Convertissez la parole en sous-titres pour plusieurs locuteurs avec Gemini 2.0 gratuitement !

Commandes d'utilitaires AI

Il y a 6 mois

011.4K

娱乐：扮演CIA根据ChatGPT记忆信息分析用户风险特性的提示词

DIVERTISSEMENT : La CIA analyse les profils de risque des utilisateurs sur la base des informations fournies par les mèmes du ChatGPT

Commandes d'utilitaires AI

Il y a 10 mois

010.6K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

aucun

Pas de commentaires...