Círculo de intercambio de inteligencia artificial

Puesta en común diaria de los últimos productos, proyectos, marcos, interpretaciones de documentos, etc.~ sobre IA.
通义DeepResearch - 阿里通义开源的深度研究智能体

Tongyi DeepResearch - Cuerpo de inteligencia de investigación profunda de código abierto Ali Tongyi

Tongyi DeepResearch (Tongyi Investigación Profunda) es un organismo inteligente de código abierto lanzado por Alibaba, diseñado para la recuperación profunda de información y el razonamiento de tareas complejas, con 30.000 millones de parámetros, compatible con múltiples modos de razonamiento, incluidos el modo ReAct y el modo de profundidad...
hace 2 meses
024.2K
OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

Guía en PDF de OpenAI para mantenerse a la vanguardia en la era de la IA - con enlaces de descarga

Staying ahead in the age of AI es una guía de liderazgo en IA de OpenAI que ayuda a los líderes empresariales a mantener una ventaja competitiva en la era de la IA. La guía señala el rápido crecimiento de la IA, con lanzamientos de modelos más rápidos, costes más bajos y una adopción empresarial más rápida....
hace 2 meses
020.8K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

PDF gratuito de Fundamentos de grandes modelos de la Universidad de Zhejiang - con enlace de descarga

Fundamentos de los grandes modelos ofrece un análisis en profundidad de las tecnologías básicas y las vías prácticas de los grandes modelos lingüísticos (LLM). Partiendo de la teoría fundamental de la modelización lingüística, explica sistemáticamente los principios del diseño de modelos basados en arquitecturas estadísticas, de redes neuronales recurrentes (RNN) y Transformer, centrándose en los tres grandes modelos lingüísticos....
hace 2 meses
021.4K
LLaSO - 逻辑智能推出的业界首个全面开源的语音模型

LLaSO: el primer modelo de voz de código abierto de Logic Intelligence

LLaSO es un modelo del habla de código abierto lanzado por Beijing Depth Logic Intelligence Technology Co. Ltd, que resuelve los problemas de dispersión de datos e insuficiente cobertura de tareas en el campo del modelado del lenguaje del habla a gran escala integrando datos del habla y del texto y proporcionando conjuntos de datos de alineación, conjuntos de datos de ajuste de comandos y puntos de referencia de evaluación.
hace 2 meses
014K
混元3D 3.0 - 腾讯推出的3D生成模型,支持超高清建模

Hybrid 3D 3.0: modelos generados en 3D de Tencent compatibles con UHD

Hybrid 3D 3.0 es un modelo avanzado de generación 3D de Tencent, basado en la tecnología de esculpido jerárquico 3D-DiT, con una resolución geométrica de hasta 1536³, capaz de generar modelos 3D de ultra alta definición y ricos en detalles, y de destacar en el modelado de personajes, con capacidad para modelar con precisión los cinco sentidos y la forma del cuerpo.
hace 2 meses
024.3K
Mini-o3 - 字节、港大联合开源的视觉推理模型

Mini-o3 - Bytes, modelo conjunto de razonamiento visual de código abierto de la HKU

Mini-o3 es un modelo de código abierto lanzado conjuntamente por ByteDance y la Universidad de Hong Kong, centrado en la resolución de problemas complejos de búsqueda visual. El modelo tiene una potente capacidad de razonamiento interactivo multirronda y puede localizar un objetivo mediante exploración profunda y ensayo-error.
hace 2 meses
018.1K
GPT-5-Codex - OpenAI推出的最强编程模型

GPT-5-Codex: el modelo de programación más sólido introducido por OpenAI

GPT-5-Codex es un potente modelo de optimización de programación de OpenAI, mejorado por GPT-5 y diseñado para ingenieros de software. El modelo genera código de alta calidad con rapidez, es compatible con múltiples lenguajes de programación y optimiza el código existente para mejorar el rendimiento.
hace 2 meses
015.8K
MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 - ¡El último modelo de generación de música por IA de MiniMax!

MiniMax Music 1.5 es una herramienta avanzada de generación de música por IA que permite generar hasta 4 minutos de música a partir de la descripción en lenguaje natural del usuario. El modelo es compatible con una amplia gama de estilos musicales y personalización del estado de ánimo, y genera tonos vocales naturales y completos, transiciones suaves y arreglos ricamente estratificados....
hace 2 meses
019.3K
AnyI2V - 复旦联合阿里达摩院等开源的智能图像动画生成框架

AnyI2V - Fudan y Ali Dharma Institute y otro marco de generación de animación de imágenes inteligente de código abierto

AnyI2V es un marco de generación de animaciones de imágenes lanzado conjuntamente por la Universidad de Fudan, Alibaba Darmo Academy y otras entidades, que permite convertir imágenes condicionales estáticas (por ejemplo, cuadrículas, nubes de puntos, etc.) en vídeos dinámicos sin necesidad de un complejo proceso de formación y una gran cantidad de datos.
hace 2 meses
016.9K
SRPO - 腾讯混元推出的文本到图像生成模型

SRPO - Modelo de generación de texto a imagen lanzado por Tencent Hybrid

SRPO (Semantic Relative Preference Optimization) es un modelo de generación de texto a imagen introducido por Tencent Mixed Meta, que optimiza el mecanismo de recompensa a través de señales condicionales textuales para lograr el ajuste en línea de las recompensas y reducir la dependencia del ajuste fuera de línea.
hace 2 meses
028.7K