Тонкая настройка большой модели

Всего 28 статей
расставлять по порядку
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
7 месяцев назад
036.3K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
8 месяцев назад
031.5K
DeepCoder-14B-Preview:擅长代码生成的的开源模型

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...
8 месяцев назад
031.4K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
8 месяцев назад
039.8K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...
8 месяцев назад
041.7K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
8 месяцев назад
034.9K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
9 месяцев назад
031.2K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
9 месяцев назад
037.1K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...
9 месяцев назад
040.5K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: Мультимодальный инструмент обучения с подкреплением для изучения визуального мышления

Всеобъемлющее введение MM-EUREKA - это проект с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта, Шанхайским университетом Цзяо Тун и другими участниками. Он расширяет возможности текстовых рассуждений на мультимодальные сценарии с помощью методов обучения с подкреплением на основе правил, помогающих моделям обрабатывать изображения и текстовую информацию. Ядро этого инструмента...
9 месяцев назад
034.8K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris: Стабильная диффузия с FLUX.1 Model Training Toolkit

Общее представление AI Toolkit by Ostris - это набор инструментов ИИ с открытым исходным кодом, ориентированный на поддержку моделей Stable Diffusion и FLUX.1 для задач обучения и генерации изображений. Инструментарий создан и поддерживается разработчиком Ostris, тор...
9 месяцев назад
060.4K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
9 месяцев назад
031.2K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
9 месяцев назад
037.4K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: ИИ-фреймворк, в котором можно ввести вопрос и обучить модель выдавать результаты в режиме реального времени

Общее введение TPO-LLM-WebUI - это инновационный проект, открытый компанией Airmomo на GitHub, который позволяет оптимизировать большие языковые модели (LLM) в режиме реального времени с помощью интуитивно понятного веб-интерфейса. Он использует TPO (Test-Time Pr...
10 месяцев назад
035.7K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: платформа для обучения с открытым исходным кодом для крупномасштабного обучения с применением подкрепления

Общее введение Open-Reasoner-Zero - это проект с открытым исходным кодом, ориентированный на исследования в области обучения с подкреплением (RL), разработанный командой Open-Reasoner-Zero на GitHub. Его цель - обеспечить эффективное, масштабируемое и простое в использовании обучение ...
10 месяцев назад
031.3K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Полнокровный дистилляционный набор данных DeepSeek-R1 на китайской основе, поддерживает китайский дистилляционный набор данных SFT R1

Всеобъемлющее введение Китайский набор данных DeepSeek-R1 distillation - это китайский набор данных с открытым исходным кодом, содержащий 110 тыс. единиц данных и предназначенный для поддержки исследований в области машинного обучения и обработки естественного языка. Набор данных выпущен командой NLP Конга Лю. Набор данных содержит не только математические данные, но и большое количество общих типов...
10 месяцев назад
033.6K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: эффективные крупномасштабные решения для обучения моделей ИИ

Всеобъемлющее введение ColossalAI - это платформа с открытым исходным кодом, разработанная компанией HPC-AI Technologies и призванная обеспечить эффективное и экономичное решение для обучения и вывода крупномасштабных моделей ИИ. Благодаря поддержке множества параллельных стратегий, гетерогенному управлению памятью и обучению со смешанной точностью, ColossalAI...
10 месяцев назад
031.3K
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

One Shot LoRA: универсальная платформа для быстрого создания видеомоделей LoRA

Общее представление One Shot LoRA - это платформа, ориентированная на создание высококачественных видео LoRA-моделей из видео. Пользователи могут быстро и легко обучать бутиковые модели LoRA на основе видео, не регистрируясь и не сохраняя приватные данные. Платформа поддерживает Hunyua...
10 месяцев назад
043.3K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: Простой инструмент для тонкой настройки LLM-моделей и синтеза данных, 0 кодовая база для тонкой настройки ваших собственных мини-моделей!

Всеобъемлющее введение Kiln - это инструмент с открытым исходным кодом, ориентированный на тонкую настройку больших языковых моделей (LLM), генерацию синтетических данных и совместную работу с наборами данных. Он предоставляет интуитивно понятные настольные приложения с поддержкой систем Windows, MacOS и Linux, позволяя пользователям реализовать нулевой код для реализации Ll...
10 месяцев назад
041.4K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: инструмент для упрощения процесса тонкой настройки моделей основных визуальных языков с открытым исходным кодом

Всеобъемлющее введение Maestro - это инструмент, разработанный компанией Roboflow для упрощения и ускорения процесса тонкой настройки мультимодальных моделей, чтобы каждый мог обучать свои собственные визуальные макромодели. Он предоставляет готовые рецепты для тонкой настройки популярных визуальных языковых моделей (ВЯМ), таких как F...
10 месяцев назад
035.2K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: самый быстрый способ запускать и настраивать LLM локально!

Общее представление LlamaEdge - это проект с открытым исходным кодом, разработанный для упрощения процесса запуска и тонкой настройки больших языковых моделей (LLM) на локальных или пограничных устройствах. Проект поддерживает семейство моделей Llama2 и предоставляет API-сервисы, совместимые с OpenAI, которые позволяют пользователям легко создавать и запускать...
11 месяцев назад
039K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: инструмент с открытым исходным кодом для эффективной тонкой настройки и обучения больших языковых моделей

Всеобъемлющее введение Unsloth - это проект с открытым исходным кодом, предназначенный для предоставления эффективных инструментов для тонкой настройки и обучения больших языковых моделей (LLM). Проект поддерживает множество известных моделей, включая Llama, Mistral, Phi и Gemma.Unsloth...
10 месяцев назад
043.8K
Bakery:轻松微调和货币化开源AI模型

Bakery: легкая настройка и монетизация моделей ИИ с открытым исходным кодом

Общее представление Bakery - это платформа, разработанная для стартапов, инженеров машинного обучения и исследователей в области искусственного интеллекта для предоставления простых и эффективных услуг по тонкой настройке и монетизации моделей искусственного интеллекта. Пользователи могут получить доступ к базам данных сообщества через Bakery, создать или загрузить свои собственные базы данных, произвести тонкую настройку моделей...
11 месяцев назад
030.8K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: инструмент с открытым исходным кодом для обнаружения уязвимостей LLM и обеспечения безопасности генеративного ИИ

Всеобъемлющее введение NVIDIA Garak - это инструмент с открытым исходным кодом, специально разработанный для обнаружения уязвимостей в больших языковых моделях (LLM). Он проверяет модель на наличие множества слабых мест, таких как иллюзии, утечка данных, внедрение подсказок, генерация сообщений об ошибках, генерация вредоносного содержимого и т.д. с помощью статического, динамического и адаптивного зондирования...
1 год назад
041.5K
ModelScope Swift:高效微调和部署大模型的轻量级基础设施。

ModelScope Swift: легковесная инфраструктура для эффективной тонкой настройки и развертывания больших моделей.

Всеобъемлющее введение ModelScope Swift (сокращенно MS-Swift) - это эффективная облегченная инфраструктура, предназначенная для тонкой настройки, обоснования, оценки и развертывания больших моделей (LLM) и мультимодальных больших моделей (MLLM). Фреймворк поддерживает более 400 LLM...
1 год назад
054.3K
LLaMA Factory:高效微调百余种开源大模型,轻松实现模型定制

LLaMA Factory: эффективная тонкая настройка более сотни макромоделей с открытым исходным кодом, легкая настройка моделей

Общее представление LLaMA-Factory - это единый и эффективный фреймворк для тонкой настройки, который поддерживает гибкую настройку и эффективное обучение более 100 больших языковых моделей (LLM). Благодаря встроенному веб-интерфейсу LLaMA Board пользователям не нужно писать код для завершения моделирования...
1 год назад
037K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Petals: распределенный совместный запуск на GPU и тонкая настройка больших языковых моделей, совместное использование ресурсов GPU подобно сети BitTorrent

Общее представление Petals - это проект с открытым исходным кодом, разработанный BigScience Workshop для запуска больших языковых моделей (LLM) с помощью распределенного вычислительного подхода. Пользователи могут запускать LLM у себя дома, используя графические процессоры потребительского класса или Google Co...
1 год назад
039.4K
Forefront AI:机器学习模型调优平台|AI聊天助手

Forefront AI: платформа для настройки моделей машинного обучения | AI Chat Assistant

Всеобъемлющее введение Forefront AI - это передовая платформа ИИ, ориентированная на настройку и развертывание моделей с открытым исходным кодом. Пользователи могут выбирать и настраивать различные мощные модели ИИ, такие как GPT-4, GPT-3.5 и т. д., для решения различных задач. Платформа поддерживает загрузку PD...
1 год назад
033.1K