Тонкая настройка большой модели

Всего 28 статей

расставлять по порядку

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели График знаний #

11 месяцев назад

061.9K

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

063.2K

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

056.3K

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

073.6K

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

080.1K

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели # Desktop Automation Intelligence

1 год назад

062.5K

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

054K

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI Помощник по повышению эффективности жизни # Тонкая настройка крупной модели

1 год назад

070.7K

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

068.8K

MM-EUREKA: Мультимодальный инструмент обучения с подкреплением для изучения визуального мышления

Всеобъемлющее введение MM-EUREKA - это проект с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта, Шанхайским университетом Цзяо Тун и другими участниками. Он расширяет возможности текстовых рассуждений на мультимодальные сценарии с помощью методов обучения с подкреплением на основе правил, помогающих моделям обрабатывать изображения и текстовую информацию. Ядро этого инструмента...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

058.3K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris: Стабильная диффузия с FLUX.1 Model Training Toolkit

Общее представление AI Toolkit by Ostris - это набор инструментов ИИ с открытым исходным кодом, ориентированный на поддержку моделей Stable Diffusion и FLUX.1 для задач обучения и генерации изображений. Инструментарий создан и поддерживается разработчиком Ostris, тор...

Последние ресурсы по искусственному интеллекту # AI Средства создания изображений # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

0151.4K

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

052K

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

064K

TPO-LLM-WebUI: ИИ-фреймворк, в котором можно ввести вопрос и обучить модель выдавать результаты в режиме реального времени

Общее введение TPO-LLM-WebUI - это инновационный проект, открытый компанией Airmomo на GitHub, который позволяет оптимизировать большие языковые модели (LLM) в режиме реального времени с помощью интуитивно понятного веб-интерфейса. Он использует TPO (Test-Time Pr...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

056.1K

Open-Reasoner-Zero: платформа для обучения с открытым исходным кодом для крупномасштабного обучения с применением подкрепления

Общее введение Open-Reasoner-Zero - это проект с открытым исходным кодом, ориентированный на исследования в области обучения с подкреплением (RL), разработанный командой Open-Reasoner-Zero на GitHub. Его цель - обеспечить эффективное, масштабируемое и простое в использовании обучение ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

057.1K

Полнокровный дистилляционный набор данных DeepSeek-R1 на китайской основе, поддерживает китайский дистилляционный набор данных SFT R1

Всеобъемлющее введение Китайский набор данных DeepSeek-R1 distillation - это китайский набор данных с открытым исходным кодом, содержащий 110 тыс. единиц данных и предназначенный для поддержки исследований в области машинного обучения и обработки естественного языка. Набор данных выпущен командой NLP Конга Лю. Набор данных содержит не только математические данные, но и большое количество общих типов...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

055.1K

ColossalAI: эффективные крупномасштабные решения для обучения моделей ИИ

Всеобъемлющее введение ColossalAI - это платформа с открытым исходным кодом, разработанная компанией HPC-AI Technologies и призванная обеспечить эффективное и экономичное решение для обучения и вывода крупномасштабных моделей ИИ. Благодаря поддержке множества параллельных стратегий, гетерогенному управлению памятью и обучению со смешанной точностью, ColossalAI...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

054.5K

One Shot LoRA: универсальная платформа для быстрого создания видеомоделей LoRA

Общее представление One Shot LoRA - это платформа, ориентированная на создание высококачественных видео LoRA-моделей из видео. Пользователи могут быстро и легко обучать бутиковые модели LoRA на основе видео, не регистрируясь и не сохраняя приватные данные. Платформа поддерживает Hunyua...

Последние ресурсы по искусственному интеллекту # AI Средства создания изображений # Тонкая настройка крупной модели

1 год назад

074.1K

Kiln: Простой инструмент для тонкой настройки LLM-моделей и синтеза данных, 0 кодовая база для тонкой настройки ваших собственных мини-моделей!

Всеобъемлющее введение Kiln - это инструмент с открытым исходным кодом, ориентированный на тонкую настройку больших языковых моделей (LLM), генерацию синтетических данных и совместную работу с наборами данных. Он предоставляет интуитивно понятные настольные приложения с поддержкой систем Windows, MacOS и Linux, позволяя пользователям реализовать нулевой код для реализации Ll...

Последние ресурсы по искусственному интеллекту # Тонкая настройка крупной модели

1 год назад

070.7K

Maestro: инструмент для упрощения процесса тонкой настройки моделей основных визуальных языков с открытым исходным кодом

Всеобъемлющее введение Maestro - это инструмент, разработанный компанией Roboflow для упрощения и ускорения процесса тонкой настройки мультимодальных моделей, чтобы каждый мог обучать свои собственные визуальные макромодели. Он предоставляет готовые рецепты для тонкой настройки популярных визуальных языковых моделей (ВЯМ), таких как F...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

061.5K

LlamaEdge: самый быстрый способ запускать и настраивать LLM локально!

Общее представление LlamaEdge - это проект с открытым исходным кодом, разработанный для упрощения процесса запуска и тонкой настройки больших языковых моделей (LLM) на локальных или пограничных устройствах. Проект поддерживает семейство моделей Llama2 и предоставляет API-сервисы, совместимые с OpenAI, которые позволяют пользователям легко создавать и запускать...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

068.7K

Unsloth: инструмент с открытым исходным кодом для эффективной тонкой настройки и обучения больших языковых моделей

Всеобъемлющее введение Unsloth - это проект с открытым исходным кодом, предназначенный для предоставления эффективных инструментов для тонкой настройки и обучения больших языковых моделей (LLM). Проект поддерживает множество известных моделей, включая Llama, Mistral, Phi и Gemma.Unsloth...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

077.3K

Bakery: легкая настройка и монетизация моделей ИИ с открытым исходным кодом

Общее представление Bakery - это платформа, разработанная для стартапов, инженеров машинного обучения и исследователей в области искусственного интеллекта для предоставления простых и эффективных услуг по тонкой настройке и монетизации моделей искусственного интеллекта. Пользователи могут получить доступ к базам данных сообщества через Bakery, создать или загрузить свои собственные базы данных, произвести тонкую настройку моделей...

Последние ресурсы по искусственному интеллекту # AI Side Hustle Money Making Project # Тонкая настройка крупной модели

1 год назад

050.7K

NVIDIA Garak: инструмент с открытым исходным кодом для обнаружения уязвимостей LLM и обеспечения безопасности генеративного ИИ

Всеобъемлющее введение NVIDIA Garak - это инструмент с открытым исходным кодом, специально разработанный для обнаружения уязвимостей в больших языковых моделях (LLM). Он проверяет модель на наличие множества слабых мест, таких как иллюзии, утечка данных, внедрение подсказок, генерация сообщений об ошибках, генерация вредоносного содержимого и т.д. с помощью статического, динамического и адаптивного зондирования...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Тонкая настройка крупной модели

1 год назад

072K

ModelScope Swift: легковесная инфраструктура для эффективной тонкой настройки и развертывания больших моделей.

Всеобъемлющее введение ModelScope Swift (сокращенно MS-Swift) - это эффективная облегченная инфраструктура, предназначенная для тонкой настройки, обоснования, оценки и развертывания больших моделей (LLM) и мультимодальных больших моделей (MLLM). Фреймворк поддерживает более 400 LLM...

Последние ресурсы по искусственному интеллекту # Тонкая настройка крупной модели

1 год назад

0100.6K

LLaMA Factory: эффективная тонкая настройка более сотни макромоделей с открытым исходным кодом, легкая настройка моделей

Общее представление LLaMA-Factory - это единый и эффективный фреймворк для тонкой настройки, который поддерживает гибкую настройку и эффективное обучение более 100 больших языковых моделей (LLM). Благодаря встроенному веб-интерфейсу LLaMA Board пользователям не нужно писать код для завершения моделирования...

Последние ресурсы по искусственному интеллекту # Тонкая настройка крупной модели

1 год назад

067.5K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Petals: распределенный совместный запуск на GPU и тонкая настройка больших языковых моделей, совместное использование ресурсов GPU подобно сети BitTorrent

Общее представление Petals - это проект с открытым исходным кодом, разработанный BigScience Workshop для запуска больших языковых моделей (LLM) с помощью распределенного вычислительного подхода. Пользователи могут запускать LLM у себя дома, используя графические процессоры потребительского класса или Google Co...

Последние ресурсы по искусственному интеллекту # Тонкая настройка крупной модели # Локально развернутый инструмент с открытым исходным кодом для создания крупных моделей

1 год назад

066K

Forefront AI: платформа для настройки моделей машинного обучения | AI Chat Assistant

Всеобъемлющее введение Forefront AI - это передовая платформа ИИ, ориентированная на настройку и развертывание моделей с открытым исходным кодом. Пользователи могут выбирать и настраивать различные мощные модели ИИ, такие как GPT-4, GPT-3.5 и т. д., для решения различных задач. Платформа поддерживает загрузку PD...

Последние ресурсы по искусственному интеллекту # AI Open Services Интегрированная многомодельная диалоговая платформа # AI # Тонкая настройка крупной модели

1 год назад

058.3K

Дело не в этом.