Ajuste fino de modelos grandes

Total de 28 artigos

organizar em ordem

GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos

Introdução abrangente O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, com foco na otimização do ajuste fino supervisionado de modelos de linguagem grande (LLMs), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele foi desenvolvido a partir de ...

4 meses atrás

011K

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

Introdução geral O MiniMind-V é um projeto de código aberto, hospedado no GitHub, criado para ajudar os usuários a treinar um modelo de linguagem visual (VLM) leve com apenas 26 milhões de parâmetros em menos de uma hora. Ele se baseia no modelo de linguagem MiniMind, com novos recursos visuais...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

010.5K

DeepCoder-14B-Preview: um modelo de código aberto que se destaca na geração de código

Introdução geral O DeepCoder-14B-Preview é um modelo de geração de código-fonte aberto desenvolvido pela equipe da Agentica e lançado na plataforma Hugging Face. Ele é baseado no modelo DeepSeek-R1-Distilled-Q...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

09.8K

WeClone: treinamento de doppelgangers digitais com registros de bate-papo e vozes do WeChat

Introdução abrangente O WeClone é um projeto de código aberto que usa registros de bate-papo e mensagens de voz do WeChat, combinados com grandes modelos de linguagem e tecnologia de síntese de fala, para permitir que os usuários criem doppelgangers digitais personalizados. O projeto pode analisar os hábitos de bate-papo do usuário para treinar o modelo, mas também um pequeno número de amostras de voz para gerar sons realistas...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

012.5K

Search-R1: Aprendizado por reforço para treinar modelos grandes para pesquisa e raciocínio

Introdução geral O Search-R1 é um projeto de código aberto, desenvolvido por PeterGriffinJin no GitHub, com base na estrutura veRL. Ele treina modelos de linguagem grandes (LLMs) por meio de técnicas de aprendizagem por reforço (RL), permitindo que os modelos aprendam de forma autônoma...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

011.7K

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: Compute...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande # Inteligência de automação de desktop

5 meses atrás

010.8K

Bonsai: um modelo de linguagem ponderada de três valores adequado para operação em dispositivos de borda

Introdução geral O Bonsai é um modelo de linguagem de código aberto desenvolvido pela deepgrove-ai com um tamanho de parâmetro de 500 milhões, usando pesos ternários. Ele se baseia na arquitetura Llama e no classificador Mistral...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

011.3K

Second Me: doppelgangers de IA treinados localmente com memórias e hábitos pessoais

O Second Me é um projeto de código aberto desenvolvido pela equipe do Mindverse que permite criar uma IA em seu computador que atua como um "sósia digital", aprendendo seus padrões e hábitos de fala por meio de suas palavras e memórias e tornando-se uma pessoa inteligente que entende suas...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Assistente de eficiência de vida de IA # Ajuste fino do modelo grande

5 meses atrás

011.8K

Easy Dataset: uma ferramenta fácil para criar grandes conjuntos de dados com ajuste fino de modelos

Introdução abrangente O Easy Dataset é uma ferramenta de código aberto projetada especificamente para o ajuste fino de modelos grandes (LLMs), hospedada no GitHub. Ela oferece uma interface fácil de usar que permite que os usuários carreguem arquivos, segmentem automaticamente o conteúdo, gerem perguntas e respostas e, por fim, produzam um modelo adequado...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

5 meses atrás

012.5K

MM-EUREKA: uma ferramenta de aprendizagem por reforço multimodal para explorar o raciocínio visual

Introdução abrangente O MM-EUREKA é um projeto de código aberto desenvolvido pelo Shanghai Artificial Intelligence Laboratory, pela Shanghai Jiao Tong University e por outras partes. Ele amplia os recursos de raciocínio textual para cenários multimodais por meio de técnicas de aprendizagem por reforço baseadas em regras para ajudar os modelos a processar informações de imagem e texto. O núcleo dessa ferramenta...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

011K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

Kit de ferramentas de IA da Ostris: Difusão estável com o kit de ferramentas de treinamento de modelos FLUX.1

Introdução geral O AI Toolkit da Ostris é um conjunto de ferramentas de IA de código aberto voltado para o suporte aos modelos Stable Diffusion e FLUX.1 para tarefas de treinamento e geração de imagens. O conjunto de ferramentas foi criado e é mantido pelo desenvolvedor Ostris, tor...

Recursos mais recentes de IA # AI Auxiliares de geração de imagens # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

013.5K

X-R1: Treinamento de baixo custo de modelos de 0,5B em dispositivos comuns

Introdução geral O X-R1 é uma estrutura de aprendizagem por reforço de código aberto no GitHub pela equipe dhcode-cpp, com o objetivo de fornecer aos desenvolvedores uma ferramenta eficiente e de baixo custo para modelos de treinamento com base na aprendizagem por reforço de ponta a ponta. O projeto é apoiado pelo DeepSeek...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

010.9K

OpenManus-RL: ajuste fino de modelos grandes para aprimorar o raciocínio e a tomada de decisões de corpos inteligentes

Introdução geral O OpenManus-RL é um projeto de código aberto desenvolvido pelo UIUC-Ulab em conjunto com a equipe OpenManus da comunidade MetaGPT, hospedado no GitHub. O projeto aprimora a modelagem de linguagem em larga escala (LLM) por meio de técnicas de aprendizagem por reforço (RL)...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

012.3K

TPO-LLM-WebUI: uma estrutura de IA em que você pode inserir perguntas para treinar um modelo em tempo real e gerar os resultados.

Introdução geral O TPO-LLM-WebUI é um projeto inovador de código aberto da Airmomo no GitHub que permite a otimização em tempo real de modelos de idiomas grandes (LLMs) por meio de uma interface da Web intuitiva. Ele usa o TPO (Test-Time Pr...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

010.4K

Open-Reasoner-Zero: plataforma de treinamento de aprendizado por reforço de raciocínio em larga escala de código aberto

Introdução geral O Open-Reasoner-Zero é um projeto de código aberto voltado para a pesquisa de aprendizagem por reforço (RL), desenvolvido pela equipe do Open-Reasoner-Zero no GitHub. Seu objetivo é fornecer treinamento eficiente, dimensionável e fácil de usar ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

09.7K

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, compatível com o conjunto de dados SFT de destilação R1 chinês

Introdução abrangente O conjunto de dados chinês de destilação DeepSeek-R1 é um conjunto de dados chinês de código aberto que contém 110 mil dados projetados para dar suporte à pesquisa de aprendizado de máquina e processamento de linguagem natural. O conjunto de dados foi lançado pela equipe de NLP de Cong Liu e contém não apenas dados matemáticos, mas também um grande número de tipos gerais...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

09.3K

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Introdução abrangente O ColossalAI é uma plataforma de código aberto desenvolvida pela HPC-AI Technologies, com o objetivo de fornecer uma solução eficiente e econômica para treinamento e inferência de modelos de IA em grande escala. Ao oferecer suporte a várias estratégias paralelas, gerenciamento de memória heterogênea e treinamento de precisão mista, o ColossalAI...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

6 meses atrás

08.9K

One Shot LoRA: a plataforma completa para geração rápida de modelos de LoRA em vídeo

Introdução geral O One Shot LoRA é uma plataforma voltada para a geração de modelos de LoRA de vídeo de alta qualidade a partir de vídeos. Os usuários podem treinar modelos de LoRA de boutique de forma rápida e fácil a partir de vídeos sem fazer login ou armazenar dados privados. A plataforma é compatível com Hunyua...

Recursos mais recentes de IA # AI Auxiliares de geração de imagens # Ajuste fino do modelo grande

7 meses atrás

011.9K

Kiln: ferramenta simples de síntese de dados e ajuste fino de modelos LLM, base de código 0 para ajustar seus próprios minimodelos!

Introdução abrangente O Kiln é uma ferramenta de código aberto que se concentra no ajuste fino de LLMs (Large Language Models), na geração de dados sintéticos e na colaboração de conjuntos de dados. Ele fornece aplicativos de desktop intuitivos com suporte para sistemas Windows, MacOS e Linux, permitindo que os usuários obtenham uma implementação de código zero de modelos de l...

Recursos mais recentes de IA # Ajuste fino do modelo grande

7 meses atrás

012.8K

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código aberto

Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como o F...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

7 meses atrás

010.9K

LlamaEdge: a maneira mais rápida de executar e ajustar o LLM localmente!

Introdução geral O LlamaEdge é um projeto de código aberto desenvolvido para simplificar o processo de execução e ajuste fino de grandes modelos de linguagem (LLMs) em dispositivos locais ou de borda. O projeto oferece suporte à família de modelos Llama2 e fornece serviços de API compatíveis com OpenAI que permitem aos usuários criar e executar facilmente...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

7 meses atrás

011.9K

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de linguagem grandes

Introdução abrangente O Unsloth é um projeto de código aberto criado para fornecer ferramentas eficientes para o ajuste fino e o treinamento de grandes modelos de linguagem (LLMs). O projeto oferece suporte a vários modelos conhecidos, incluindo Llama, Mistral, Phi e Gemma.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

7 meses atrás

013.7K

Bakery: ajuste e monetize facilmente modelos de IA de código aberto

Introdução geral O Bakery é uma plataforma projetada para startups de IA, engenheiros de aprendizado de máquina e pesquisadores para fornecer serviços simples e eficientes de ajuste fino e monetização de modelos de IA. Os usuários podem acessar conjuntos de dados orientados pela comunidade por meio do Bakery, criar ou carregar seus próprios conjuntos de dados, ajustar modelos...

Recursos mais recentes de IA # Projeto de ganho de dinheiro com a IA # Ajuste fino do modelo grande

7 meses atrás

011K

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução abrangente O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem ampla (LLMs). Ela verifica o modelo quanto a vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo prejudicial etc., por meio de sondagem estática, dinâmica e adaptativa...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

9 meses atrás

010.8K

ModelScope Swift: uma infraestrutura leve para o ajuste fino e a implantação de modelos grandes com eficiência.

Introdução abrangente O ModelScope Swift (MS-Swift, para abreviar) é uma infraestrutura leve e eficiente projetada para ajuste fino, raciocínio, avaliação e implantação de modelos grandes (LLMs) e modelos grandes multimodais (MLLMs). A estrutura oferece suporte a mais de 400 modelos LLM...

Recursos mais recentes de IA # Ajuste fino do modelo grande

9 meses atrás

015.4K

LLaMA Factory: ajuste fino eficiente de mais de cem macromodelos de código aberto, fácil personalização de modelos

Introdução geral O LLaMA-Factory é uma estrutura de ajuste fino unificada e eficiente que oferece suporte à personalização flexível e ao treinamento eficiente de mais de 100 modelos de idiomas grandes (LLMs). Com a interface da Web integrada do LLaMA Board, os usuários não precisam escrever código para concluir a modelagem...

Recursos mais recentes de IA # Ajuste fino do modelo grande

9 meses atrás

010.9K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Petals: execução distribuída de GPU compartilhada e ajuste fino de grandes modelos de linguagem, compartilhando recursos de GPU como uma rede BitTorrent

Introdução geral O Petals é um projeto de código aberto desenvolvido pelo BigScience Workshop para executar modelos de linguagem grandes (LLMs) por meio de uma abordagem de computação distribuída. Os usuários podem executar LLMs em casa usando GPUs de nível de consumidor ou o Google Co...

Recursos mais recentes de IA # Ajuste fino do modelo grande # Ferramenta de modelo grande de código aberto implantada localmente

9 meses atrás

011.7K

Forefront AI: Plataforma de ajuste de modelos de aprendizado de máquina | Assistente de bate-papo com IA

Introdução abrangente O Forefront AI é uma plataforma avançada de IA que se concentra na personalização e na implementação de modelos de código aberto. Os usuários podem selecionar e ajustar uma variedade de modelos avançados de IA, como GPT-4, GPT-3.5, etc., para atender a diferentes requisitos de tarefas. A plataforma suporta o upload de modelos de PD...

Recursos mais recentes de IA # Serviços abertos de IA Plataforma de diálogo multimodelo integrada de IA ## Ajuste fino do modelo grande

9 meses atrás

011.8K

Não é isso.