Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 17 artigos

Tags: grande modelo ajuste fino

X-R1: treinamento de modelos de 0,5 bilhão em dispositivos comuns a baixo custo - Chief AI Sharing Circle

X-R1: Treinamento de baixo custo de modelos de 0,5B em dispositivos comuns

Introdução geral O X-R1 é uma estrutura de aprendizagem por reforço de código aberto no GitHub pela equipe dhcode-cpp, com o objetivo de fornecer aos desenvolvedores uma ferramenta eficiente e de baixo custo para modelos de treinamento com base na aprendizagem por reforço de ponta a ponta. O projeto é inspirado no DeepSeek-R1 e no open-r1 e se concentra na criação de...

OpenManus-RL: ajuste fino de modelos grandes para fortalecer o raciocínio e a tomada de decisões de corpos inteligentes - Chief AI Sharing Circle

OpenManus-RL: ajuste fino de modelos grandes para aprimorar o raciocínio e a tomada de decisões de corpos inteligentes

Introdução geral O OpenManus-RL é um projeto de código aberto desenvolvido em conjunto pelo UIUC-Ulab e pela equipe do OpenManus da comunidade MetaGPT, hospedado no GitHub. O projeto aprimora os recursos de raciocínio e tomada de decisão das inteligências do Large Language Model (LLM) por meio de técnicas de Aprendizado por Reforço (RL), com base no Deepseek-R1, QwQ-32B ...

TPO-LLM-WebUI: uma estrutura de IA que permite inserir perguntas para treinar modelos em tempo real e gerar resultados - Chief AI Sharing Circle

TPO-LLM-WebUI: uma estrutura de IA em que você pode inserir perguntas para treinar um modelo em tempo real e gerar os resultados.

Introdução abrangente O TPO-LLM-WebUI é um projeto inovador de código aberto da Airmomo no GitHub que permite a otimização em tempo real de LLMs (Large Language Models) por meio de uma interface da Web intuitiva. Ele usa a estrutura TPO (Test-Time Prompt Optimisation) para dizer adeus completamente ao tedioso processo de ajuste fino tradicional...

Open-Reasoner-Zero: plataforma de treinamento de aprendizado por reforço de raciocínio em larga escala de código aberto - Chief AI Sharing Circle

Open-Reasoner-Zero: plataforma de treinamento de aprendizado por reforço de raciocínio em larga escala de código aberto

Introdução geral O Open-Reasoner-Zero é um projeto de código aberto voltado para a pesquisa de aprendizagem por reforço (RL), desenvolvido pela equipe do Open-Reasoner-Zero no GitHub. Seu objetivo é acelerar o processo de pesquisa no campo da inteligência artificial, fornecendo uma estrutura de treinamento eficiente, escalonável e fácil de usar, especialmente para os pass...

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, suporte ao conjunto de dados SFT de destilação R1 chinês - Chief AI Sharing Circle

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, compatível com o conjunto de dados SFT de destilação R1 chinês

Introdução abrangente O conjunto de dados chinês de destilação DeepSeek-R1 é um conjunto de dados chinês de código aberto que contém 110 mil itens de dados projetados para dar suporte à pesquisa de aprendizado de máquina e processamento de linguagem natural. O conjunto de dados foi lançado pela equipe de NLP de Cong Liu e contém não apenas dados matemáticos, mas também um grande número de tipos gerais de dados, como raciocínio lógico...

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala - Chief AI Sharing Circle

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Introdução abrangente O ColossalAI é uma plataforma de código aberto desenvolvida pela HPC-AI Technologies para fornecer uma solução eficiente e econômica para treinamento e inferência de modelos de IA em grande escala. Ao oferecer suporte a várias estratégias paralelas, gerenciamento de memória heterogênea e treinamento de precisão mista, o ColossalAI é capaz de reduzir significativamente o treinamento e a inferência de modelos...

One Shot LoRA: a plataforma completa para geração rápida de modelos de vídeo LoRA - Chief AI Sharing Circle

One Shot LoRA: a plataforma completa para geração rápida de modelos de LoRA em vídeo

Introdução geral O One Shot LoRA é uma plataforma voltada para a geração de modelos de LoRA de vídeo de alta qualidade a partir de vídeos. Os usuários podem treinar de forma rápida e fácil modelos LoRA de alta qualidade a partir de vídeos sem fazer login ou armazenar dados privados. A plataforma é compatível com Hunyuan Video, FLUX e SDXL...

Kiln: ferramentas simples de síntese de dados e ajuste fino do modelo LLM, base de código 0 para ajustar seus próprios modelos pequenos - Chief AI Sharing Circle

Kiln: ferramenta simples de síntese de dados e ajuste fino de modelos LLM, base de código 0 para ajustar seus próprios minimodelos!

Introdução abrangente O Kiln é uma ferramenta de código aberto que se concentra no ajuste fino de modelos de linguagem ampla (LLMs), na geração de dados sintéticos e na colaboração de conjuntos de dados. Ele fornece um aplicativo de desktop intuitivo com suporte para Windows, MacOS e Linux, permitindo que os usuários implementem modelos como Llama, GPT4o e Mixtral com código zero...

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos principais modelos de linguagem visual de código aberto - Chief AI Sharing Circle

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código aberto

Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como Florence-2, PaliGemma ...

LlamaEdge: a maneira mais rápida de executar e ajustar o LLM localmente - Chief AI Sharing Circle

LlamaEdge: a maneira mais rápida de executar e ajustar o LLM localmente!

Introdução geral O LlamaEdge é um projeto de código aberto desenvolvido para simplificar o processo de execução e ajuste fino de grandes modelos de linguagem (LLMs) em dispositivos locais ou de borda. O projeto é compatível com a família de modelos Llama2 e fornece serviços de API compatíveis com OpenAI que permitem aos usuários criar e executar facilmente aplicativos de raciocínio LLM.

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de idiomas grandes - Chief AI Sharing Circle

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de linguagem grandes

Introdução abrangente O Unsloth é um projeto de código aberto criado para fornecer ferramentas eficientes para o ajuste fino e o treinamento de grandes modelos de linguagem (LLMs). O projeto oferece suporte a uma ampla variedade de modelos conhecidos, incluindo Llama, Mistral, Phi e Gemma, etc. Os principais recursos do Unsloth são a capacidade de reduzir significativamente o uso da memória e acelerar o treinamento...

Bakery: ajuste e monetize facilmente modelos de IA de código aberto - Chief AI Sharing Circle

Bakery: ajuste e monetize facilmente modelos de IA de código aberto

Introdução geral O Bakery é uma plataforma projetada para startups de IA, engenheiros de aprendizado de máquina e pesquisadores para fornecer serviços simples e eficientes de ajuste fino e monetização de modelos de IA. Com o Bakery, os usuários podem acessar conjuntos de dados orientados pela comunidade, criar ou carregar seus próprios conjuntos de dados, ajustar as configurações do modelo e comercializar...

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa - Chief AI Sharing Circle

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução abrangente O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem ampla (LLMs). Ela verifica o modelo quanto a vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo prejudicial etc., por meio de sondagem estática, dinâmica e adaptativa.

ModelScope Swift: uma infraestrutura leve para o ajuste fino e a implantação de modelos grandes com eficiência. -Chefe do Círculo de Compartilhamento de IA

ModelScope Swift: uma infraestrutura leve para o ajuste fino e a implantação de modelos grandes com eficiência.

Introdução abrangente O ModelScope Swift (MS-Swift) é uma infraestrutura leve e eficiente projetada para ajuste fino, raciocínio, avaliação e implantação de modelos grandes (LLMs) e modelos multimodais grandes (MLLMs). A estrutura oferece suporte a mais de 400 LLMs e mais de 100 MLLMs, fornecendo tudo, desde treinamento de modelos, avaliação...

LLaMA Factory: ajuste fino eficiente de mais de uma centena de modelos grandes de código aberto para facilitar a personalização do modelo-Chief AI Sharing Circle

LLaMA Factory: ajuste fino eficiente de mais de cem macromodelos de código aberto, fácil personalização de modelos

Introdução geral O LLaMA-Factory é uma estrutura de ajuste fino unificada e eficiente que oferece suporte à personalização flexível e ao treinamento eficiente de mais de 100 modelos de linguagem grandes (LLMs). Por meio da interface da Web integrada do LLaMA Board, os usuários podem fazer o ajuste fino de seus modelos sem escrever código. A estrutura integra uma variedade de treinamentos avançados...

Petals: execução de GPU compartilhada distribuída e ajuste fino de grandes modelos de linguagem, compartilhando recursos de GPU como uma rede BitTorrent - Chief AI Sharing Circle

Petals: execução distribuída de GPU compartilhada e ajuste fino de grandes modelos de linguagem, compartilhando recursos de GPU como uma rede BitTorrent

Introdução geral O Petals é um projeto de código aberto desenvolvido pelo BigScience Workshop para executar modelos de linguagem grandes (LLMs) por meio de uma abordagem de computação distribuída. Os usuários podem executar e ajustar os LLMs em casa usando GPUs de nível de consumidor ou o Google Colab, como Llama 3.1, Mixtral, F...

Forefront AI: Plataforma de ajuste de modelos de aprendizado de máquina | Assistente de bate-papo com IA - Círculo de compartilhamento de IA principal

Forefront AI: Plataforma de ajuste de modelos de aprendizado de máquina | Assistente de bate-papo com IA

Introdução abrangente O Forefront AI é uma plataforma avançada de IA que se concentra na personalização e na implementação de modelos de código aberto. Os usuários podem selecionar e ajustar uma variedade de modelos avançados de IA, como GPT-4, GPT-3.5, etc., para atender a diferentes requisitos de tarefas. A plataforma suporta o upload de documentos como PDF, Word, PPT, etc., com IA...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil