AI Engineering Institute: 3Fine-tuning (Feinabstimmung von großen Sprachmodellen)

AI-WissensdatenbankAktualisiert vor 9 Monaten AI-Austauschkreis

8.1K 00

📚 Aufbau der Datenbank

Modelle/Katalog	Beschreibung und Inhalt
Axolotl	Ein Rahmen für die Feinabstimmung von Sprachmodellen
Gemma	Googles neueste Implementierung des Big Language Model
- `finetune-gemma.ipynb` - `gemma-sft.py` - `Gemma_finetuning_notebook.ipynb`	Feinabstimmung von Notizbüchern und Skripten
LLama2	Metas Open-Source-Modell für große Sprachen
- `generate_response_stream.py` - `Llama2_finetuning_notebook.ipynb` - `Llama_2_Fine_Tuning_using_QLora.ipynb`	Leitlinien für die Umsetzung und Feinabstimmung
Llama3	Kommende Experimente mit Meta Large Language Modelling
- `Llama3_finetuning_notebook.ipynb`	Erste Versuche zur Feinabstimmung
LlamaFactory	Ein Rahmen für das Training und den Einsatz großer Sprachmodelle
LLMArchitektur/ParameterZahl	Technische Details der Modellarchitektur
Mistral-7b	Mistral AI Das Modell mit 7 Milliarden Parametern
- `LLM_evaluation_harness_for_Arc_Easy_and_SST.ipynb` - `Mistral_Colab_Finetune_ipynb_Colab_Final.ipynb` - `notebooks_chatml_inference.ipynb` - `notebooks_DPO_fine_tuning.ipynb` - `notebooks_SFTTrainer TRL.ipynb` - `SFT.py`	Integriertes Notizbuch für Bewertung, Feinabstimmung und Argumentation
Mixtral	Mixtrals Modell der Expertenmischung
- `Mixtral_fine_tuning.ipynb`	Feinabstimmung der Umsetzung
VLM	visuelles Sprachmodell
- `Florence2_finetuning_notebook.ipynb` - `PaliGemma_finetuning_notebook.ipynb`	Implementierung des visuellen Sprachmodells

🎯 Modulübersicht

1. die LLM-Architektur

Untersuchen Sie die folgenden Modellimplementierungen:
- Llama2 (das quelloffene Modell von Meta)
- Mistral-7b (effizientes Modell mit 7 Milliarden Parametern)
- Mixtral (Expert Mixture Architecture)
- Gemma (der neueste Beitrag von Google)
- Llama3 (bevorstehendes Experiment)

2. 🛠️ Feinabstimmungstechnologie

Umsetzungsstrategie
LoRA-Methodik (Low Rank Adaptation)
Fortgeschrittene Optimierungsmethoden

3. 🏗️ Analyse der Modellarchitektur

Eine eingehende Untersuchung der Struktur des Modells
Methode zur Berechnung der Parameter
Überlegungen zur Skalierbarkeit

4. 🔧 Berufliche Entfaltung

Code Llama für Programmieraufgaben
Visuelle Sprachmodellierung:
- Florenz2
- PaliGemma

5. 💻 Praktische Anwendungen

Integriertes Jupyter-Notebook
Pipeline zur Erzeugung von Reaktionen
Leitfaden zur Implementierung von Reasoning

6. 🚀 Erweiterte Themen

DPO (Optimierung der Direktpräferenz)
SFT (überwachte Feinabstimmung)
Methodik der Bewertung

AI-Wissensdatenbank

© urheberrechtliche Erklärung

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Ähnliche Artikel

Cursor 提示 User is unauthorized，Unauthorized request

Cursor-Prompt Benutzer ist unberechtigt, Unberechtigte Anfrage

vor 7 Monaten

012.7K

数字服务产品介绍——终极营销文案ChatGPT提示词

Digitale Dienstleistungen Produkteinführung - Der ultimative Marketingtext ChatGPT Prompts

AI-Utility-Befehle

vor 1 Jahr

08.3K

免费使用 Gemini 2.0 将语音转换为多发言人字幕

Konvertieren Sie Sprache in Untertitel für mehrere Sprecher mit Gemini 2.0 - kostenlos!

AI-Utility-Befehle

vor 6 Monaten

011.4K

娱乐：扮演CIA根据ChatGPT记忆信息分析用户风险特性的提示词

ENTERTAINMENT: Die CIA analysiert die Risikoprofile von Nutzern auf der Grundlage von ChatGPT-Memes

AI-Utility-Befehle

vor 10 Monaten

010.6K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

keine

Keine Kommentare...