Gran ajuste del modelo

Total 28 artículos

ordenar

ModelScope Swift: una infraestructura ligera para ajustar y desplegar eficazmente modelos de gran tamaño.

Introducción completa ModelScope Swift (MS-Swift para abreviar) es una infraestructura ligera eficiente diseñada para afinar, razonar, evaluar y desplegar grandes modelos (LLM) y grandes modelos multimodales (MLLM). El marco admite más de 400 LLM...

Últimos recursos sobre IA # Ajuste del modelo grande

hace 11 meses

030.8K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit de Ostris: Difusión estable con FLUX.1 Kit de herramientas de formación de modelos

Introducción general AI Toolkit de Ostris es un conjunto de herramientas de IA de código abierto centrado en el soporte de los modelos Stable Diffusion y FLUX.1 para tareas de entrenamiento y generación de imágenes. El conjunto de herramientas es creado y mantenido por el desarrollador Ostris, tor...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

028.9K

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

028.3K

One Shot LoRA: la plataforma todo en uno para la generación rápida de modelos LoRA de vídeo

Introducción general One Shot LoRA es una plataforma centrada en la generación de modelos LoRA de vídeo de alta calidad a partir de vídeos. Los usuarios pueden entrenar rápida y fácilmente modelos LoRA boutique a partir de vídeos sin necesidad de iniciar sesión ni almacenar datos privados. La plataforma es compatible con Hunyua...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes # Ajuste del modelo grande

hace 8 meses

027.2K

OpenManus-RL: ajuste de grandes modelos para mejorar el razonamiento corporal inteligente y la toma de decisiones

Introducción general OpenManus-RL es un proyecto de código abierto desarrollado por UIUC-Ulab junto con el equipo OpenManus de la comunidad MetaGPT, alojado en GitHub. El proyecto mejora el modelado lingüístico a gran escala (LLM) mediante técnicas de aprendizaje por refuerzo (RL)....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

025.8K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Pétalos: ejecución y puesta a punto de grandes modelos lingüísticos en la GPU compartida y distribuida, compartiendo los recursos de la GPU como una red BitTorrent.

Introducción general Petals es un proyecto de código abierto desarrollado por BigScience Workshop para ejecutar grandes modelos lingüísticos (LLM) mediante un enfoque de computación distribuida. Los usuarios pueden ejecutar LLMs en casa utilizando GPUs de consumo o Google Co...

Últimos recursos sobre IA # Ajuste del modelo grande # Herramienta de modelos de gran tamaño de código abierto desplegada localmente

hace 11 meses

025.6K

Kiln: herramienta sencilla de ajuste de modelos LLM y síntesis de datos, ¡código base 0 para ajustar sus propios minimodelos!

Introducción exhaustiva Kiln es una herramienta de código abierto centrada en el ajuste fino de grandes modelos lingüísticos (LLM), la generación de datos sintéticos y la colaboración en conjuntos de datos. Proporciona aplicaciones de escritorio intuitivas compatibles con los sistemas Windows, MacOS y Linux, que permiten a los usuarios lograr una implementación de código cero de Ll...

Últimos recursos sobre IA # Ajuste del modelo grande

hace 8 meses

025.4K

Easy Dataset: una herramienta sencilla para crear grandes conjuntos de datos de modelos afinados

Introducción exhaustiva Easy Dataset es una herramienta de código abierto diseñada específicamente para el ajuste fino de grandes modelos (LLM), alojada en GitHub. Ofrece una interfaz fácil de usar que permite a los usuarios cargar archivos, segmentar automáticamente el contenido, generar preguntas y respuestas y, en última...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

025.3K

NVIDIA Garak: herramienta de código abierto para detectar vulnerabilidades LLM y asegurar la IA generativa

Introducción completa NVIDIA Garak es una herramienta de código abierto diseñada específicamente para detectar vulnerabilidades en Large Language Models (LLMs). Comprueba el modelo en busca de múltiples debilidades como ilusiones, fugas de datos, inyección de pistas, generación de mensajes de error, generación de contenido dañino, etc. mediante sondeos estáticos, dinámicos y adaptativos....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 11 meses

025.2K

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 6 meses

024.8K

Second Me: dobles de IA entrenados localmente con recuerdos y hábitos personales.

Second Me es un proyecto de código abierto desarrollado por el equipo Mindverse que te permite crear una IA en tu ordenador que actúa como un "doble digital", aprendiendo tus patrones y hábitos de habla a través de tus palabras y recuerdos, y convirtiéndose en una persona inteligente que entiende tus...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Asistente de Eficiencia Vital # Ajuste del modelo grande

hace 7 meses

024.7K

LlamaEdge: ¡la forma más rápida de ejecutar y ajustar LLM localmente!

Introducción general LlamaEdge es un proyecto de código abierto diseñado para simplificar el proceso de ejecución y puesta a punto de grandes modelos lingüísticos (LLM) en dispositivos locales o edge. El proyecto es compatible con la familia de modelos Llama2 y proporciona servicios API compatibles con OpenAI que permiten a los usuarios crear y ejecutar fácilmente...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 9 meses

024.1K

Search-R1: Aprendizaje por refuerzo para entrenar grandes modelos de búsqueda y razonamiento

Introducción general Search-R1 es un proyecto de código abierto, desarrollado por PeterGriffinJin en GitHub, basado en el framework veRL. Entrena grandes modelos lingüísticos (LLM) mediante técnicas de aprendizaje por refuerzo (RL), lo que permite a los modelos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 6 meses

024K

Forefront AI: Plataforma de ajuste de modelos de aprendizaje automático | AI Chat Assistant

Introducción completa Forefront AI es una plataforma de IA avanzada que se centra en la personalización y el despliegue de modelos de código abierto. Los usuarios pueden seleccionar y ajustar una gran variedad de potentes modelos de IA, como GPT-4, GPT-3.5, etc., para satisfacer diferentes requisitos de tareas. La plataforma permite cargar PD...

Últimos recursos sobre IA # AI Servicios abiertos Plataforma de diálogo multimodelo integrada # AI # Ajuste del modelo grande

hace 11 meses

023.9K

Maestro: una herramienta para simplificar el proceso de ajuste de modelos de los principales lenguajes visuales de código abierto

Introducción Maestro es una herramienta desarrollada por Roboflow para simplificar y acelerar el proceso de ajuste fino de modelos multimodales, de modo que todo el mundo pueda entrenar sus propios macromodelos visuales. Proporciona recetas ya preparadas para el ajuste fino de modelos de lenguaje visual (VLM) populares como F...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

022.5K

Fábrica LLaMA: ajuste eficaz de más de cien macromodelos de código abierto, fácil personalización de modelos

Introducción general LLaMA-Factory es un marco unificado y eficiente de ajuste fino que soporta la personalización flexible y el entrenamiento eficiente de más de 100 Large Language Models (LLMs). Con la interfaz web incorporada LLaMA Board, los usuarios no necesitan escribir código para completar el modelado....

Últimos recursos sobre IA # Ajuste del modelo grande

hace 11 meses

022.4K

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande # Inteligencia de automatización de escritorio

hace 6 meses

022.3K

Bakery: afinar y monetizar fácilmente modelos de IA de código abierto

Introducción general Bakery es una plataforma diseñada para startups de IA, ingenieros de aprendizaje automático e investigadores para proporcionar servicios sencillos y eficientes de ajuste y monetización de modelos de IA. Los usuarios pueden acceder a conjuntos de datos de la comunidad a través de Bakery, crear o cargar sus propios conjuntos de datos,...

Últimos recursos sobre IA # AI Side Hustle Proyecto para ganar dinero # Ajuste del modelo grande

hace 9 meses

022.1K

GraphGen: ajuste de modelos lingüísticos mediante grafos de conocimiento para generar datos sintéticos

Introducción general GraphGen es un marco de código abierto desarrollado por OpenScienceLab, un laboratorio de IA de Shanghái, alojado en GitHub, que se centra en optimizar el ajuste fino supervisado de grandes modelos lingüísticos (LLM) guiando la generación de datos sintéticos a través de grafos de conocimiento. Se desarrolló a partir de ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande # Gráfico del conocimiento

hace 5 meses

022K

X-R1: Formación de modelos 0,5B en dispositivos comunes a bajo coste

Introducción general X-R1 es un marco de aprendizaje por refuerzo de código abierto en GitHub por el equipo dhcode-cpp, con el objetivo de proporcionar a los desarrolladores una herramienta eficiente y de bajo coste para el entrenamiento de modelos basados en el aprendizaje por refuerzo de extremo a extremo. El proyecto cuenta con el apoyo de DeepSeek...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

022K

Bonsai: un modelo lingüístico ponderado de tres valores apto para funcionar en dispositivos de borde

Introducción general Bonsai es un modelo lingüístico de código abierto desarrollado por deepgrove-ai con un tamaño de parámetros de 500 millones, que utiliza pesos ternarios. Se basa en la arquitectura Llama y el clasificador Mistral....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

021.7K

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

021.7K

TPO-LLM-WebUI: un marco de IA en el que se pueden introducir preguntas para entrenar un modelo en tiempo real y obtener los resultados.

Introducción general TPO-LLM-WebUI es un proyecto innovador de código abierto de Airmomo en GitHub que permite la optimización en tiempo real de grandes modelos lingüísticos (LLM) a través de una interfaz web intuitiva. Utiliza TPO (Test-Time Pr...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

021.6K

MM-EUREKA: una herramienta multimodal de aprendizaje por refuerzo para explorar el razonamiento visual

Introducción general MM-EUREKA es un proyecto de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai, la Universidad Jiao Tong de Shanghai y otras partes. Amplía las capacidades de razonamiento textual a escenarios multimodales mediante técnicas de aprendizaje por refuerzo basadas en reglas para ayudar a los modelos a procesar información de imágenes y texto. El núcleo de esta herramienta...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 7 meses

021.2K

MiniMind-V: 1 hora de entrenamiento de un modelo de lenguaje visual de 26 millones de parámetros

Introducción general MiniMind-V es un proyecto de código abierto, alojado en GitHub, diseñado para ayudar a los usuarios a entrenar un modelo de lenguaje visual (VLM) ligero con solo 26 millones de parámetros en menos de una hora. Se basa en el modelo de lenguaje MiniMind, con nuevos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 6 meses

020.6K

DeepCoder-14B-Preview: un modelo de código abierto que destaca en la generación de código

Introducción general DeepCoder-14B-Preview es un modelo de generación de código abierto desarrollado por el equipo de Agentica y publicado en la plataforma Hugging Face. Se basa en el modelo DeepSeek-R1-Distilled-Q...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 6 meses

020.2K

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

019.4K

ColossalAI: soluciones eficaces de formación de modelos de IA a gran escala

Introducción ColossalAI es una plataforma de código abierto desarrollada por HPC-AI Technologies, con el objetivo de proporcionar una solución eficiente y rentable para el entrenamiento y la inferencia de modelos de IA a gran escala. Al soportar múltiples estrategias paralelas, gestión de memoria heterogénea y entrenamiento de precisión mixta, ColossalAI...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Ajuste del modelo grande

hace 8 meses

019.2K

No es eso.