Últimos recursos sobre IA

共 2972 篇文章
Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型

Fun-Audio-Chat-8B: el macromodelo de código abierto de Ali Tongyi para la interacción verbal de extremo a extremo

Fun-Audio-Chat-8B es un gran modelo de voz integral de 8.000 millones de parámetros de código abierto creado por el equipo de Ali Tongyi, con entrada directa de voz y salida de voz, sin necesidad de empalme ASR+LLM+TTS, bilingüe fluido en chino e inglés, con baja latencia y timbre natural. Utiliza LLM compartido de doble resolución con 25 Hz...
hace 3 meses
022.7K
PromptFill - 开源的结构化提示词生成AI工具,专为AI绘画设计

PromptFill - Herramienta de código abierto de generación de palabras clave estructuradas diseñada para la pintura de IA

PromptFill es una herramienta de generación de indicaciones estructurada diseñada para el dibujo de IA, que ayuda a los usuarios a crear, gestionar e iterar rápidamente indicaciones complejas mediante interacciones visuales de "rellenar los espacios en blanco", mejorando la eficacia y la calidad de la generación de imágenes de IA.Las características principales de PromptFill...
hace 3 meses
023.3K
GLM-4.7 - 智谱AI开源的最新一代旗舰大模型

GLM-4.7 - La última generación de modelos de gran tamaño de Wisdom Spectrum AI Open Source

GLM-4.7 es la última generación del buque insignia Grand Model lanzado y de código abierto por Smart Spectrum AI, que está profundamente optimizado para la programación de IA, el razonamiento complejo y las tareas corporales inteligentes. El modelo admite una longitud de contexto de 200k y una salida máxima de 128k, con codificación multilingüe, planificación de tareas de largo alcance y capacidades de colaboración de herramientas...
hace 3 meses
038.2K
NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen: el modelo de IA para juegos de código abierto de NVIDIA en colaboración con Stanford, Caltech y otros.

NitroGen es un modelo de IA para juegos de código abierto desarrollado por NVIDIA en colaboración con la Universidad de Stanford, Caltech y otras instituciones, capaz de ejecutar más de 1.000 tipos de juegos diferentes. El modelo se basa en la arquitectura GROOT N1.5 y se obtiene mediante el análisis de 40.000 horas de datos de vídeo de juegos (incluida la anotación del funcionamiento del joystick)....
hace 3 meses
030.4K
Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered - Modelo de edición de imágenes por IA de código abierto por el equipo de Ali

Qwen-Image-Layered es un modelo de edición de imágenes de AI de código abierto del equipo Ali que descompone de forma inteligente imágenes ordinarias en capas transparentes independientes para lograr una edición de precisión similar a la de Photoshop. El modelo es de código abierto mediante el protocolo Apache 2.0 y admite un control flexible de las capas...
hace 3 meses
032.8K
T5Gemma 2 - 谷歌开源的新一代编码器-解码器模型

T5Gemma 2: el modelo de codificador-decodificador de próxima generación de código abierto de Google

T5Gemma 2 es un modelo de codificador-decodificador de nueva generación de código abierto de Google, basado en la arquitectura Gemma 3 mejorada con capacidades de procesamiento multimodal y de contextos largos. Admite una amplia gama de tipos de datos, incluidos texto e imágenes, y es capaz de manejar contextos muy largos (hasta 128K) en la generación de...
hace 3 meses
025.7K
FunctionGemma - 谷歌开源专为函数调用优化的轻量级AI模型

FunctionGemma - Modelo de IA ligero de código abierto de Google optimizado para llamadas a funciones

FunctionGemma es un modelo ligero de IA optimizado para llamadas a funciones de Google, desarrollado a partir del modelo base Gemma 3 de 270 millones de parámetros, que convierte el lenguaje natural en instrucciones de API ejecutables en tiempo real en teléfonos móviles, navegadores y otros dispositivos. La característica principal es la compatibilidad con...
hace 3 meses
025K
TRELLIS.2 - 微软开源的大型3D生成模型

TRELLIS.2 - Modelos generativos 3D a gran escala de código abierto de Microsoft

TRELLIS.2 es el modelo generativo 3D a gran escala de código abierto de Microsoft con 4.000 millones de parámetros, centrado en la generación de imágenes 3D de alta fidelidad. Utilizando la innovadora estructura de vóxel disperso "O-Voxel", puede manejar eficientemente la topología compleja y las características nítidas, para generar información 3D de alta calidad con material PBR completo ...
hace 3 meses
033.1K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - Protocolo declarativo de código abierto de Google para interfaces de interacción de usuario basadas en agentes

A2UI (Agent-to-User Interface) es el protocolo de interfaz de código abierto de Google impulsado por agentes que aborda los retos de la generación de interfaces interactivas complejas para agentes de IA. A través de un formato JSON declarativo que permite a los agentes de IA describir la estructura de la interfaz de usuario , las aplicaciones cliente...
hace 3 meses
038.9K
MiMo-V2-Flash - 小米发布的开源MoE架构大模型

MiMo-V2-Flash - Un gran modelo de la arquitectura MoE de código abierto lanzado por Xiaomi

MiMo-V2-Flash es un gran modelo de arquitectura MoE de código abierto lanzado por Xiaomi, con 309.000 millones de parámetros totales y 15.000 millones de parámetros activos, centrado en el razonamiento eficiente y las aplicaciones corporales inteligentes. El modelo adopta una arquitectura de atención híbrida y tecnología de meta-predicción multi-palabra, con una velocidad de inferencia de 150 tokens/segundo, en...
hace 3 meses
028.7K
Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move: el marco de código abierto de Ali Tongyi para la generación de vídeo con inteligencia artificial, en colaboración con Tsinghua y otros organismos.

Wan-Move es un marco de generación de vídeo de IA de código abierto desarrollado conjuntamente por Ali Tongyi Labs, la Universidad de Tsinghua y otras instituciones, centrado en la composición de vídeo de alta calidad mediante una tecnología precisa de control del movimiento. La tecnología central es la "guía de trayectoria potencial", que puede añadir sin problemas el control de movimiento a nivel de punto al modelo existente de imagen a vídeo...
hace 3 meses
026.1K
Kaleido - 智谱AI联合清华大学等开源的多主体参考视频生成模型

Kaleido - Un modelo de generación de vídeo de referencia multisujeto de código abierto creado por Smart Spectrum AI en colaboración con la Universidad de Tsinghua y otras instituciones.

Kaleido es un modelo de generación de vídeo de referencia multisujeto de código abierto desarrollado conjuntamente por la Universidad Tecnológica de Hefei, la Universidad de Tsinghua y Smart Spectrum AI. Genera vídeos coherentes con el sujeto a través de múltiples imágenes de referencia, resolviendo las deficiencias de los modelos existentes en cuanto a coherencia multisujeto y desacoplamiento del fondo.Kaleido genera vídeos a través de un...
hace 3 meses
026.4K
Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA

Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....
hace 3 meses
026.8K
RealVideo - 智谱 AI 开源的实时流式视频生成系统

RealVideo - Sistema de generación de vídeo en tiempo real de código abierto de Wisdom Spectrum AI

RealVideo es un sistema de generación de vídeo en tiempo real de código abierto de Smart Spectrum AI que puede generar rápidamente respuestas de vídeo naturales y fluidas en 2 o 3 segundos. Los usuarios solo tienen que subir una foto e introducir un texto, y el sistema genera la voz y el vídeo correspondientes, lo que permite dialogar en tiempo real con personajes de IA....
hace 3 meses
022K
KoalaQA - 开源的AI售后服务系统,帮企业快速搭建问答平台

KoalaQA - Sistema de AI de código abierto para el servicio postventa que ayuda a las empresas a crear rápidamente plataformas de preguntas y respuestas

KoalaQA es un sistema de servicio posventa inteligente de código abierto desarrollado por el equipo de Chaitin. Basado en el modelo de IA, proporciona funciones de servicio al cliente de IA, búsqueda de IA y gestión de base de conocimientos para ayudar a las empresas a crear rápidamente una plataforma inteligente de preguntas y respuestas. El sistema permite responder en tiempo real 24/7 ...
hace 3 meses
023K
VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 - Modelado de texto a voz de código abierto de extremo a extremo de Faceted Intelligence

VoxCPM 1.5 es un modelo de generación de voz de código abierto publicado por Facade Intelligence, basado en la tecnología de conversión de texto a voz (TTS) sin necesidad de divisor, con varias innovaciones y mejoras. Adoptando una arquitectura autorregresiva de difusión de extremo a extremo, genera formas de onda de habla continua directamente a partir del texto, evitando las limitaciones de los métodos tradicionales de segmentación...
hace 3 meses
032.4K
Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe - Asistente de código de línea de comandos de código abierto de Mistral AI

Mistral Vibe es un asistente de codificación de línea de comandos de código abierto de Mistral AI, desarrollado basado en el modelo Devstral, que soporta la interacción del lenguaje natural para completar la búsqueda de código, manipulación de archivos, control de versiones y otras tareas. Puede escanear automáticamente la estructura del proyecto y el estado de Git a través del símbolo @...
hace 3 meses
024.7K
GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS - Sistema de síntesis de voz industrial de código abierto de Smart Spectrum AI

GLM-TTS es un sistema de síntesis de voz industrial de código abierto con potentes funciones de síntesis de voz. Adopta una arquitectura de generación en dos etapas: la primera convierte el texto en secuencias de tokens de voz y la segunda convierte las secuencias de tokens en audio de alta calidad. El sistema admite sólo 3 segundos de muestras de voz para completar la...
hace 3 meses
024.2K
OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM - Modelo de agente de IA de código abierto para teléfonos móviles de Smart Spectrum AI

OpenAutoGLM es un modelo corporal inteligente de código abierto con capacidad de "uso del teléfono móvil", que puede comprender el contenido de la pantalla del teléfono móvil mediante la percepción multimodal, y generar automáticamente el flujo de operaciones para completar las tareas especificadas por el usuario. Los usuarios sólo tienen que utilizar el lenguaje natural para describir las necesidades, como "abrir Meituan para buscar una olla caliente cercana...".
hace 3 meses
027.9K
SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense - Herramientas de código abierto para la investigación en IA y la gestión del conocimiento, Las pintas más fuertes de NotebookLM

SurfSense es una herramienta de investigación y gestión del conocimiento de IA de código abierto. Altamente personalizable, puede conectarse a motores de búsqueda, Slack, Jira, Notion, YouTube, GitHub y muchas otras fuentes de datos externas para facilitar la integración de la información. Los usuarios pueden cargar...
hace 3 meses
026K
InkSight - Google开源的AI手写识别工具

InkSight - Herramienta de Google de código abierto para el reconocimiento de la escritura a mano con inteligencia artificial

InkSight es la herramienta de reconocimiento de escritura AI de código abierto de Google que convierte notas manuscritas en papel en archivos digitales editables con tinta (por ejemplo, en formato SVG). A diferencia de OCR tradicional , puede reconocer el contenido del texto , puede restaurar el estilo de escritura a mano , la estructura del párrafo y la marca de enfoque , soporte para el procesamiento multi-idioma .
hace 3 meses
022K
LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - Modelo de generación y edición de imágenes de código abierto del grupo estadounidense LongCat team

LongCat-Image es un modelo de generación y edición de imágenes de código abierto lanzado por el equipo LongCat de Meituan. Utilizando una arquitectura híbrida de columna vertebral (MM-DiT+Single-DiT), combinada con un codificador condicional de modelo de lenguaje visual (VLM), es capaz de lograr imágenes generadas por texto y múltiples rondas de edición de imágenes....
hace 3 meses
021.1K
Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - Herramienta de desarrollo de flujos de trabajo de IA de código abierto por Magic Hitch y el equipo Wooli WULI

Flowra es el motor de ejecución de gráficos de código abierto y las herramientas de desarrollo de paquetes de nodos de ModelScope joint woo mile WULI team, es el componente central de FlowBench. A través del flujo de trabajo de organización de grafo acíclico dirigido (DAG) , con almacenamiento en caché inteligente , programación paralela , soporte distribuido ...
hace 3 meses
021.6K
RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - Un conjunto de datos de robots reales de doble brazo de código abierto creado por Wisdom Source en colaboración con varias universidades.

RoboCOIN es el primer conjunto de datos de máquinas reales de robots de doble brazo a gran escala del mundo, de código abierto, creado por el Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín en colaboración con varias empresas y universidades. Contiene 15 tipos de plataformas robóticas, 180.000 trayectorias de operaciones reales y 421 tipos de escenarios de tareas. Su mayor característica es la adopción de un sistema de anotación jerárquica para desmontar la tarea...
hace 3 meses
020.9K
MemMachine - MemVerge推出的开源AI记忆系统

MemMachine - Sistema de memoria de IA de código abierto de MemVerge

MemMachine es un sistema de memoria de IA de código abierto desarrollado por MemVerge, diseñado para modelos e inteligencias de IA, que puede almacenar y recuperar datos de interacción como el cerebro humano, resolviendo el problema de la "pérdida de memoria sin estado" de la IA. Adopta una arquitectura en capas (memoria a corto plazo, memoria a largo plazo, imagen de usuario...
hace 3 meses
026K
Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - Comprensión multimodal de vídeo y generación de grandes modelos de código abierto de ByteHop

Vidi2 es un gran modelo de generación y comprensión de vídeo multimodal de segunda generación de código abierto de ByteDance, centrado en la comprensión, el análisis y la creación de contenidos de vídeo. Admite la entrada conjunta de modalidades de texto, vídeo y audio, y puede comprender simultáneamente contenido de imagen, información de sonido y comandos de lenguaje natural para lograr una interacción intermodal y empujar...
hace 3 meses
023K
Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

Alpamayo-R1 - Modelo de visión-lenguaje-acción de código abierto de NVIDIA con capacidad de razonamiento

Alpamayo-R1 es un modelo Visión-Lenguaje-Acción (VLA) desarrollado por NVIDIA con capacidad de razonamiento, diseñado para mejorar la capacidad de toma de decisiones de la conducción autónoma en escenarios complejos. Mediante la introducción de un mecanismo de razonamiento de cadena causal, el vehículo es capaz de analizar la causalidad del escenario (por ejemplo, "debido a...
hace 3 meses
032.1K
悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Wujie-Emu3.5 - Wisdom Source Research Institute gran modelo multimodal del mundo de código abierto

Wujie-Emu3.5 es un macromodelo de mundo multimodal de código abierto del Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín, con 34.000 millones de referencias y capacidad de modelado de mundo nativo. Entrenado con 10 billones de Token multimodales (incluidos 790 años de datos de vídeo), puede simular las leyes de la física y lograr la generación de gráficos, la guía visual...
hace 3 meses
023K
Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Depth Anything 3 - Modelos de reconstrucción visual 3D de código abierto por Bitmap Seed

Depth Anything 3 (DA3) es un modelo de reconstrucción visual 3D desarrollado y de código abierto por el equipo de Byte Jump Seed. A través de una única arquitectura Transformer para lograr la reconstrucción de la geometría espacial en cualquier punto de vista, sólo tiene que predecir el mapa de profundidad y mapa de rayos puede restaurar la escena 3D, en comparación con...
hace 3 meses
031.5K
ViMax - 香港大学开源的多智能体视频生成框架

ViMax - Marco de generación de vídeo corporal multiinteligente de código abierto en la Universidad de Hong Kong

ViMax es un marco de generación de vídeo corporal multiinteligente de código abierto del Data Science Laboratory de la Universidad de Hong Kong, que puede automatizar todo el proceso, desde la entrada creativa hasta la salida de vídeo. La integración de funciones de generación de guiones, diseño de escenas, planificación de tomas y renderización de vídeo permite a los usuarios generar vídeos coherentes de calidad cinematográfica y televisiva mediante la descripción en lenguaje natural ...
hace 3 meses
039.4K
Fara-7B - 微软开源的计算机操作Agent助手模型

Fara-7B - Modelo de asistente informático de código abierto de Microsoft

Fara-7B es una versión de código abierto de Microsoft de un modelo de agente operado por ordenador (CUA) a escala de 7.000 millones de parámetros basado en la arquitectura Qwen 2.5-VL-7B. Al analizar visualmente capturas de pantalla de páginas web y realizar clics, entradas, etc. en la pantalla, no necesita depender de árboles de accesibilidad adicionales ni de múltiples modelos de gran tamaño...
hace 3 meses
027.8K
HunyuanOCR - 腾讯混元开源的光学字符识别专家模型

HunyuanOCR - Modelo experto de código abierto de Tencent para el reconocimiento óptico de caracteres

HunyuanOCR es un modelo de reconocimiento óptico de caracteres de alto rendimiento de código abierto creado por el equipo híbrido de Tencent, con sólo 1.000 millones de referencias. Desarrollado sobre la base de la arquitectura multimodal híbrida, adopta un diseño integral y puede gestionar eficazmente tareas de detección y reconocimiento de texto y análisis sintáctico de documentos. El modelo obtuvo 94,1 puntos en la prueba de documentos complejos, superando...
hace 3 meses
029.9K
Supertonic - 开源的高性能AI 文本转语音系统,极速离线运行

Supertonic - Sistema AI de conversión de texto en voz de código abierto y alto rendimiento que funciona offline a velocidades de vértigo.

Supertonic es un sistema de texto a voz (TTS) de código abierto y alto rendimiento centrado en la generación rápida de voz en dispositivos locales. Gracias a la tecnología ONNX Runtime, puede ejecutarse en dispositivos como teléfonos móviles, ordenadores e incluso Raspberry Pi, admite 23 idiomas y clones de voz, y no requiere red....
hace 4 meses
025K
Parallax - Gradient开源的全球首个全自主AI操作系统

Parallax - El primer sistema operativo de inteligencia artificial totalmente autónomo del mundo, con código abierto de Gradient

Parallax es el primer "sistema operativo de IA totalmente autónomo" del mundo, de código abierto, creado por Gradient, un laboratorio de IA distribuida. Admite el despliegue multiplataforma de grandes modelos en Mac, Windows y otros dispositivos heterogéneos, lo que permite a los usuarios controlar totalmente el modelo, los datos y la memoria de la IA. El sistema es consciente de la red ...
hace 4 meses
073.1K
Awex - 蚂蚁集团开源的高性能权重交换框架

Awex - Marco de intercambio de pesos de código abierto y alto rendimiento del Grupo Ant

Awex es el marco de intercambio de pesos de alto rendimiento y código abierto de Ant Group, diseñado para la sincronización de parámetros a gran escala en el aprendizaje por refuerzo. Puede completar terabytes de intercambio de parámetros en segundos, mejorando significativamente la eficiencia del entrenamiento y la inferencia.Awex tiene un rendimiento de sincronización muy rápido, en un clúster de mil tarjetas, los modelos de parámetros de trillones se pueden completar en 6 segundos de la cantidad total de...
hace 4 meses
071.1K
LoopTool - 上海交大联合小红书开源的自动化工具调用数据进化框架

LoopTool - Herramienta automatizada de código abierto de la Universidad Jiaotong de Shanghai y Little Red Book para llamar al marco de evolución de datos.

LoopTool es un marco automatizado de evolución de datos de llamada a herramientas de código abierto creado por la Universidad Jiao Tong de Shanghai y el equipo del Pequeño Libro Rojo, diseñado para mejorar la capacidad de llamada a herramientas de grandes modelos lingüísticos. Optimiza la generación de datos y la formación de modelos mediante la iteración en bucle cerrado, utilizando modelos de código abierto (por ejemplo, Qwen3-32B) como...
hace 4 meses
071.9K
AgentEvolver - 阿里通义实验室开源的智能体进化系统

AgentEvolver - Sistema de código abierto de Ali Tongyi Lab para inteligencias en evolución

AgentEvolver es un sistema de evolución del cuerpo inteligente de código abierto de Alibaba Tongyi Lab. Mediante los tres mecanismos de autocuestionamiento, autonavegación y autoatribución, consigue el aprendizaje autónomo y la evolución de las inteligencias.AgentEvolver adopta una arquitectura orientada a servicios que combina el sandbox ambiental, LLM y sc...
hace 4 meses
077.5K
MemOS - 开源的AI记忆管理与调度平台,共享长期记忆

MemOS - Plataforma de código abierto de gestión y programación de la memoria de la IA para compartir recuerdos a largo plazo

MemOS es un marco de programación y gestión de memoria de código abierto para grandes modelos de lenguaje (LLM) como MemTensor. Considerando la memoria como un recurso tan importante como la potencia aritmética, unifica la gestión del texto plano, el estado de activación y la memoria de parámetros mediante unidades de memoria MemCube estandarizadas.
hace 4 meses
073.4K
WithAnyone - 复旦联合阶跃星辰开源的AI合照生成模型

WithAnyone - Fudan salto conjunto estrella de código abierto AI modelo de generación de fotos

WithAnyone es un modelo de generación de fotos de IA desarrollado conjuntamente por la Universidad de Fudan y StepStar, que resuelve el problema habitual de "copiar y pegar" en la generación de imágenes de IA tradicional y consigue una generación de imágenes multipersona más natural y controlable. El modelo se basa en el conjunto de datos a gran escala MultiID-2M ...
hace 4 meses
072.7K
ChatTutor - 开源的AI教学辅助工具,可视化互动学习

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

ChatTutor es un código abierto AI ayuda a la enseñanza, centrándose en el aprendizaje interactivo visual en las materias STEM. A través de la arquitectura del cuerpo multi-inteligente para lograr el diálogo Q & A y la función de dibujo dinámico, se puede dibujar en la pizarra en tiempo real gráficos matemáticos, circuitos de física o mapas mentales, para ayudar a los usuarios a entender intuitivamente el general abstracto....
hace 4 meses
020.5K
EverMemOS - 盛大团队推出的开源长期记忆操作系统

EverMemOS - Sistema operativo de memoria a largo plazo de código abierto por Team Shanda

EverMemOS es un sistema operativo de memoria a largo plazo de código abierto lanzado por el equipo de Shanda dirigido por Chen Tianqiao, diseñado para que las inteligencias artificiales resuelvan el problema de la rotura de memoria causada por la ventana de contexto fija de los grandes modelos de lenguaje. El sistema se basa en el mecanismo de memoria del cerebro humano, utilizando una arquitectura de cuatro capas (capa de agente, capa de memoria, capa de índice...
hace 4 meses
031.5K
Astron Agent - 科大讯飞开源的企业级智能工作流开发平台

Astron Agent - Plataforma de desarrollo de flujos de trabajo inteligentes de código abierto para empresas de KDDI

Astron Agent es una plataforma de desarrollo de flujo de trabajo inteligente de grado empresarial de código abierto de KDDI , centrándose en ayudar a las empresas a construir rápidamente una aplicación de agente AI aterrizable . Utilizando la pila de tecnología Java + Spring Boot , soporte para el despliegue privado ligero (configuración mínima de 2 núcleos 4G) , incorporado ...
hace 4 meses
026.2K
Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee - Proyecto de modelo multimodal de gran tamaño de código abierto Tencent Mixed Meta y Tsinghua

Bee es una solución de big model multimodal de código abierto de pila completa lanzada conjuntamente por el equipo de Tencent Mixed Element y la Universidad de Tsinghua para reducir la brecha de rendimiento entre los modelos de código abierto y los de código cerrado mediante la mejora de la calidad de los datos. El proyecto contiene tres logros fundamentales: el conjunto de datos CoT de dos capas de alta calidad a escala de 15 millones Honey-Data...
hace 4 meses
023.7K
InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - Marco de generación de vídeo autorregresivo espaciotemporal unificado de código abierto Byte

InfinityStar es un marco autorregresivo espaciotemporal unificado de código abierto de ByteDance, diseñado para la generación de imágenes y vídeos de alta resolución. Utilizando un enfoque autorregresivo discreto, puede gestionar simultáneamente tareas de texto a imagen, texto a vídeo e imagen a vídeo en un único modelo. El marco se evalúa en VBench ...
hace 4 meses
024.7K
Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina: plataforma descentralizada de aprendizaje automático de código abierto desarrollada por la Universidad Técnica de Múnich en colaboración con la Universidad de Michigan.

Koina es una plataforma de aprendizaje automático descentralizada y de código abierto cuyo objetivo es simplificar el análisis de datos proteómicos. Ha sido desarrollada por un equipo de la Universidad Técnica de Múnich (Alemania) y la Universidad de Michigan (EE.UU.). La plataforma integra más de 30 modelos principales (por ejemplo, ProSIT, MS²PIP) a través de una interfaz estandarizada y admite...
hace 4 meses
025.1K
BestBlogs - 开源的AI内容聚合平台,精选优质技术内容

BestBlogs - Plataforma de agregación de contenidos de AI de código abierto con una selección de contenidos técnicos de calidad.

BestBlogs es una plataforma centrada en ofrecer contenidos de alta calidad a profesionales de la tecnología, emprendedores, gestores de productos, etc. Recopila artículos, podcasts, vídeos y otros contenidos multiformato de más de 400 blogs de alta calidad a través de canales RSS y tecnología de rastreo. Su punto fuerte es el uso de la inteligencia...
hace 4 meses
022.5K
LazyCraft - 开源AI Agent应用开发与管理平台,基于LazyLLM构建

LazyCraft - Plataforma de desarrollo y gestión de aplicaciones de agentes de IA de código abierto, basada en LazyLLM

LazyCraft es una plataforma de desarrollo y gestión de aplicaciones de agentes de IA de código abierto creada por Shangtang basada en el marco de código abierto LazyLLM, que proporciona soluciones integrales de desarrollo de aplicaciones de IA para empresas y desarrolladores. Ayuda a los desarrolladores a construir y lanzar rápidamente grandes aplicaciones modelo con bajo umbral y bajo coste....
hace 4 meses
030.1K
Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong - Nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI

Kosong es un nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI, que proporciona a los desarrolladores un soporte subyacente ligero, flexible y altamente escalable para crear aplicaciones de cuerpos inteligentes de próxima generación. Con un motor de programación de herramientas asíncrono que programa eficientemente múltiples herramientas...
hace 4 meses
025.7K
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - Una familia de grandes modelos de inteligencia espacial de código abierto de ShangTang Technology

SenseNova-SI es un gran modelo de inteligencia espacial de código abierto lanzado por ShangTech, que se centra en mejorar la capacidad de la IA para la comprensión y el razonamiento espaciales. El modelo destaca en seis dimensiones básicas, como la medición espacial, la reconstrucción, el juicio de relaciones, la transformación de perspectivas, el análisis de deformaciones y el razonamiento espacial, superando...
hace 4 meses
021.7K
Glow - 开源的命令行工具,支持在终端渲染Markdown文件

Glow - herramienta de línea de comandos de código abierto que permite renderizar archivos Markdown en el terminal

Glow es una herramienta de línea de comandos de código abierto para la representación elegante de archivos Markdown en el terminal. La herramienta permite resaltar bloques de código , fórmulas matemáticas y otros elementos complejos , proporcionando una gran cantidad de características tales como estilos personalizados , visualización de paginación , soporte de ratón y así sucesivamente.
hace 4 meses
028.4K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - Plataforma de desarrollo de IA sin código, gratuita y de código abierto, para crear aplicaciones de forma visual.

NocoBase se basa en la plataforma de desarrollo sin código de código abierto impulsado por IA , el apoyo a la rápida construcción de sistemas de negocio , sin programación se puede completar a través de la configuración del desarrollo de aplicaciones . El proyecto utiliza el protocolo Apache-2.0 , proporciona despliegue privado y escalabilidad flexible , adecuado para la gestión empresarial , plataformas de colaboración y otros campos ...
hace 4 meses
025.1K
UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - Una nueva generación de modelos de edición de imágenes lanzada por RabbitShow Intelligence y la Universidad de Pekín

UniWorld V2 es un modelo de edición de imágenes de nueva generación lanzado conjuntamente por RabbitZhan Intelligence y el equipo UniWorld de la Universidad de Pekín. Presenta ventajas significativas en el campo de la edición de imágenes, especialmente en la comprensión del chino y la ejecución de comandos complejos. El modelo puede representar con precisión fuentes chinas artísticas y...
hace 4 meses
026.9K
SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - Herramienta de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos con inteligencia artificial

SmartResume es la herramienta inteligente de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos que extrae eficazmente información estructurada, como datos básicos, formación y experiencia laboral, de documentos PDF, imágenes u Office. Mediante la integración de tecnología OCR y metadatos PDF...
hace 4 meses
028.5K
Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - El primer gran modelo de edición de audio de código abierto a nivel LLM de Step-Star

Step-Audio-EditX es un macromodelo de edición de audio de código abierto, desarrollado por el equipo Step-Star, que se centra en la manipulación precisa del contenido de audio mediante tecnología de inteligencia artificial. El modelo puede ajustar dinámicamente el estado de ánimo del audio, el estilo de habla (como petulante, acento de anciano, etc.) y los elementos paralingüísticos (como risas, suspiros...
hace 4 meses
027.8K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes

Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.
hace 4 meses
023.8K
ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit: NVIDIA y la Universidad de Toronto abren un marco de edición de imágenes basado en IA

ChronoEdit, un marco de edición de imágenes de IA de código abierto desarrollado conjuntamente por NVIDIA y la Universidad de Toronto, redefine la tarea de edición de imágenes como una tarea de generación de vídeo para garantizar que los resultados de la edición sean coherentes temporal y físicamente. Mediante la destilación de un modelo de generación de vídeo preentrenado con 14B...
hace 4 meses
029.6K