Тонкая настройка большой модели

Всего 28 статей
расставлять по порядку
ModelScope Swift:高效微调和部署大模型的轻量级基础设施。

ModelScope Swift: легковесная инфраструктура для эффективной тонкой настройки и развертывания больших моделей.

Всеобъемлющее введение ModelScope Swift (сокращенно MS-Swift) - это эффективная облегченная инфраструктура, предназначенная для тонкой настройки, обоснования, оценки и развертывания больших моделей (LLM) и мультимодальных больших моделей (MLLM). Фреймворк поддерживает более 400 LLM...
9 месяцев назад
012.8K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris: Стабильная диффузия с FLUX.1 Model Training Toolkit

Общее представление AI Toolkit by Ostris - это набор инструментов ИИ с открытым исходным кодом, ориентированный на поддержку моделей Stable Diffusion и FLUX.1 для задач обучения и генерации изображений. Инструментарий создан и поддерживается разработчиком Ostris, тор...
6 месяцев назад
011.4K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: инструмент с открытым исходным кодом для эффективной тонкой настройки и обучения больших языковых моделей

Всеобъемлющее введение Unsloth - это проект с открытым исходным кодом, предназначенный для предоставления эффективных инструментов для тонкой настройки и обучения больших языковых моделей (LLM). Проект поддерживает множество известных моделей, включая Llama, Mistral, Phi и Gemma.Unsloth...
7 месяцев назад
011.1K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: Простой инструмент для тонкой настройки LLM-моделей и синтеза данных, 0 кодовая база для тонкой настройки ваших собственных мини-моделей!

Всеобъемлющее введение Kiln - это инструмент с открытым исходным кодом, ориентированный на тонкую настройку больших языковых моделей (LLM), генерацию синтетических данных и совместную работу с наборами данных. Он предоставляет интуитивно понятные настольные приложения с поддержкой систем Windows, MacOS и Linux, позволяя пользователям реализовать нулевой код для реализации Ll...
7 месяцев назад
010.2K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
5 месяцев назад
010.1K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
6 месяцев назад
010K
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

One Shot LoRA: универсальная платформа для быстрого создания видеомоделей LoRA

Общее представление One Shot LoRA - это платформа, ориентированная на создание высококачественных видео LoRA-моделей из видео. Пользователи могут быстро и легко обучать бутиковые модели LoRA на основе видео, не регистрируясь и не сохраняя приватные данные. Платформа поддерживает Hunyua...
7 месяцев назад
09.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: самый быстрый способ запускать и настраивать LLM локально!

Общее представление LlamaEdge - это проект с открытым исходным кодом, разработанный для упрощения процесса запуска и тонкой настройки больших языковых моделей (LLM) на локальных или пограничных устройствах. Проект поддерживает семейство моделей Llama2 и предоставляет API-сервисы, совместимые с OpenAI, которые позволяют пользователям легко создавать и запускать...
7 месяцев назад
09.4K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...
5 месяцев назад
09.4K
Forefront AI:机器学习模型调优平台|AI聊天助手

Forefront AI: платформа для настройки моделей машинного обучения | AI Chat Assistant

Всеобъемлющее введение Forefront AI - это передовая платформа ИИ, ориентированная на настройку и развертывание моделей с открытым исходным кодом. Пользователи могут выбирать и настраивать различные мощные модели ИИ, такие как GPT-4, GPT-3.5 и т. д., для решения различных задач. Платформа поддерживает загрузку PD...
9 месяцев назад
09.2K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Petals: распределенный совместный запуск на GPU и тонкая настройка больших языковых моделей, совместное использование ресурсов GPU подобно сети BitTorrent

Общее представление Petals - это проект с открытым исходным кодом, разработанный BigScience Workshop для запуска больших языковых моделей (LLM) с помощью распределенного вычислительного подхода. Пользователи могут запускать LLM у себя дома, используя графические процессоры потребительского класса или Google Co...
9 месяцев назад
09K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
5 месяцев назад
08.9K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: инструмент для упрощения процесса тонкой настройки моделей основных визуальных языков с открытым исходным кодом

Всеобъемлющее введение Maestro - это инструмент, разработанный компанией Roboflow для упрощения и ускорения процесса тонкой настройки мультимодальных моделей, чтобы каждый мог обучать свои собственные визуальные макромодели. Он предоставляет готовые рецепты для тонкой настройки популярных визуальных языковых моделей (ВЯМ), таких как F...
7 месяцев назад
08.8K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
5 месяцев назад
08.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: Мультимодальный инструмент обучения с подкреплением для изучения визуального мышления

Всеобъемлющее введение MM-EUREKA - это проект с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта, Шанхайским университетом Цзяо Тун и другими участниками. Он расширяет возможности текстовых рассуждений на мультимодальные сценарии с помощью методов обучения с подкреплением на основе правил, помогающих моделям обрабатывать изображения и текстовую информацию. Ядро этого инструмента...
5 месяцев назад
08.7K
LLaMA Factory:高效微调百余种开源大模型,轻松实现模型定制

LLaMA Factory: эффективная тонкая настройка более сотни макромоделей с открытым исходным кодом, легкая настройка моделей

Общее представление LLaMA-Factory - это единый и эффективный фреймворк для тонкой настройки, который поддерживает гибкую настройку и эффективное обучение более 100 больших языковых моделей (LLM). Благодаря встроенному веб-интерфейсу LLaMA Board пользователям не нужно писать код для завершения моделирования...
9 месяцев назад
08.7K
Bakery:轻松微调和货币化开源AI模型

Bakery: легкая настройка и монетизация моделей ИИ с открытым исходным кодом

Общее представление Bakery - это платформа, разработанная для стартапов, инженеров машинного обучения и исследователей в области искусственного интеллекта для предоставления простых и эффективных услуг по тонкой настройке и монетизации моделей искусственного интеллекта. Пользователи могут получить доступ к базам данных сообщества через Bakery, создать или загрузить свои собственные базы данных, произвести тонкую настройку моделей...
7 месяцев назад
08.6K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...
5 месяцев назад
08.6K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
5 месяцев назад
08.6K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
6 месяцев назад
08.6K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: инструмент с открытым исходным кодом для обнаружения уязвимостей LLM и обеспечения безопасности генеративного ИИ

Всеобъемлющее введение NVIDIA Garak - это инструмент с открытым исходным кодом, специально разработанный для обнаружения уязвимостей в больших языковых моделях (LLM). Он проверяет модель на наличие множества слабых мест, таких как иллюзии, утечка данных, внедрение подсказок, генерация сообщений об ошибках, генерация вредоносного содержимого и т.д. с помощью статического, динамического и адаптивного зондирования...
9 месяцев назад
08.6K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
4 месяца назад
08.5K
DeepCoder-14B-Preview:擅长代码生成的的开源模型

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...
5 месяцев назад
08.4K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: ИИ-фреймворк, в котором можно ввести вопрос и обучить модель выдавать результаты в режиме реального времени

Общее введение TPO-LLM-WebUI - это инновационный проект, открытый компанией Airmomo на GitHub, который позволяет оптимизировать большие языковые модели (LLM) в режиме реального времени с помощью интуитивно понятного веб-интерфейса. Он использует TPO (Test-Time Pr...
6 месяцев назад
08.3K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
5 месяцев назад
08.1K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: платформа для обучения с открытым исходным кодом для крупномасштабного обучения с применением подкрепления

Общее введение Open-Reasoner-Zero - это проект с открытым исходным кодом, ориентированный на исследования в области обучения с подкреплением (RL), разработанный командой Open-Reasoner-Zero на GitHub. Его цель - обеспечить эффективное, масштабируемое и простое в использовании обучение ...
6 месяцев назад
08K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Полнокровный дистилляционный набор данных DeepSeek-R1 на китайской основе, поддерживает китайский дистилляционный набор данных SFT R1

Всеобъемлющее введение Китайский набор данных DeepSeek-R1 distillation - это китайский набор данных с открытым исходным кодом, содержащий 110 тыс. единиц данных и предназначенный для поддержки исследований в области машинного обучения и обработки естественного языка. Набор данных выпущен командой NLP Конга Лю. Набор данных содержит не только математические данные, но и большое количество общих типов...
6 месяцев назад
07.5K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: эффективные крупномасштабные решения для обучения моделей ИИ

Всеобъемлющее введение ColossalAI - это платформа с открытым исходным кодом, разработанная компанией HPC-AI Technologies и призванная обеспечить эффективное и экономичное решение для обучения и вывода крупномасштабных моделей ИИ. Благодаря поддержке множества параллельных стратегий, гетерогенному управлению памятью и обучению со смешанной точностью, ColossalAI...
6 месяцев назад
06.5K