Últimos recursos sobre IA

共 3143 篇文章

Información sobre el curso Últimos recursos sobre IA Base de conocimientos de IA Noticias AI

ordenar

hojear Marcador (Internet)

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl: aplicación de Google para pruebas virtuales con inteligencia artificial

Doppl es una aplicación de pruebas virtuales de inteligencia artificial de Google. Después de que el usuario sube una foto de cuerpo entero, la aplicación admite la imagen de la ropa o la captura de pantalla "desgaste" en la versión digital de su propio cuerpo, y se puede convertir de imágenes estáticas a vídeo generado por IA, por lo que los usuarios pueden sentir más verdaderamente el efecto de la ropa en el cuerpo.

Últimos recursos sobre IA

hace 1 año

062.2K

悟能 - 商汤科技最新推出的具身智能平台

Wuneng, la última plataforma de inteligencia corporal de ShangTech

Wuneng es una plataforma de inteligencia incorporada diseñada para robots y dispositivos inteligentes. Basada en el modelo del mundo "Iluminado" y en la tecnología de grandes modelos multimodales, Wuneng integra entradas multisensoriales como la visión, la voz, el tacto, etc., y posee potentes capacidades de percepción, toma de decisiones y acción.

Últimos recursos sobre IA

hace 1 año

062.1K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - Modelo de análisis sintáctico de documentos de código abierto del Laboratorio de Inteligencia Artificial de Shanghai y la Universidad de Pekín

MinerU2.5 es un modelo de lenguaje visual desacoplado desarrollado conjuntamente por el Laboratorio de Inteligencia Artificial de Shanghai y el equipo de la Universidad de Pekín, centrado en el procesamiento eficiente del análisis sintáctico de imágenes de documentos de alta resolución. La principal innovación radica en el diseño en dos fases de la "detección de la disposición global seguida del reconocimiento del contenido local": la primera fase...

Últimos recursos sobre IA

hace 9 meses

062.1K

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit 是小红书 Super Intelligence 团队开源的通用图像编辑模型，基于扩散 Transformer 架构，在 GEdit、ImgEdit 等多个权威评测...

Últimos recursos sobre IA

hace 5 meses

062.1K

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain是跨维智能推出的开源具身智能开发平台，专注于解决具身智能模型训练中数据稀缺的问题。通过数据引擎实现大规模场景相关数据生成、Real2Sim 数据轨迹映射和多模态数据扩增，从根本上...

Últimos recursos sobre IA

hace 6 meses

062.1K

Molmo 2 - Ai2开源的多模态视频图像理解模型系列

Molmo 2 - Familia de modelos de comprensión multimodal de imágenes de vídeo de código abierto Ai2

Molmo 2 es un modelo multimodal de código abierto lanzado por el Allen Institute for AI (Ai2) para mejorar la comprensión de vídeos e imágenes múltiples. Incluye tres variantes: Molmo 2 (8B), Molmo 2 (4B) y Molmo 2-O...

Últimos recursos sobre IA

hace 8 meses

062K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Macromodelado del habla de código abierto Step-Star

Step-Audio 2 mini es un macromodelo del habla integral de código abierto de Step-Audio. Rompe con la estructura tradicional del modelo del habla y adopta una verdadera arquitectura multimodal de extremo a extremo, que transforma directamente la entrada de audio sin procesar en salida de respuesta del habla, con menor latencia, y comprende la información paralingüística y las señales no vocales.

Últimos recursos sobre IA

hace 11 meses

062K

EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - Modelo de razonamiento híbrido de LG

EXAONE 4.0 es un gran modelo híbrido de razonamiento de LG AI Research (Corea) que combina el procesamiento del lenguaje natural de uso general con funciones avanzadas de razonamiento. El modelo es compatible con coreano, inglés y español y se divide en una versión profesional de 32B y una versión final de 1,2B. La versión profesional es adecuada para los sectores jurídico, contable...

Últimos recursos sobre IA

hace 1 año

062K

OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

Guía en PDF de OpenAI para mantenerse a la vanguardia en la era de la IA - con enlaces de descarga

Staying ahead in the age of AI es una guía de liderazgo en IA de OpenAI que ayuda a los líderes empresariales a mantener una ventaja competitiva en la era de la IA. La guía señala el rápido crecimiento de la IA, con lanzamientos de modelos más rápidos, costes más bajos y una adopción empresarial más rápida....

Últimos recursos sobre IA Información sobre el curso

hace 11 meses

061.9K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1 - Modelo de inferencia de IA de DeepSeek, rendimiento alineado con la versión OpenAI o1

DeepSeek-R1 es un modelo de inferencia de IA de alto rendimiento lanzado por DeepSeek, con sede en Hangzhou, que se compara con la versión oficial o1 de OpenAI. El modelo está post-entrenado sobre la base de técnicas de aprendizaje por refuerzo a gran escala y solo requiere una cantidad muy pequeña de datos etiquetados para razonar en matemáticas, código y lenguaje natural....

Últimos recursos sobre IA

hace 1 año

061.8K

Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5 - Serie de modelos híbridos de traducción de código abierto de Tencent

Tencent-HY-MT1.5 es la versión 1.5 del modelo de traducción híbrido de código abierto de Tencent, que incluye dos modelos, 1.8B y 7B, y admite 33 idiomas internacionales y 5 tipos de traducción de chino y chino/dialecto.El modelo 1.8B está especialmente optimizado para teléfonos móviles y otros dispositivos de...

Últimos recursos sobre IA

hace 7 meses

061.8K

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1: un modelo multimodal de IA unificada lanzado por Ali

Ovis-U1 es un modelo unificado multimodal introducido por el equipo Ovis de Alibaba Group con una escala de parámetros de 3.000 millones. El modelo cuenta con tres capacidades básicas de comprensión multimodal, generación de texto a imagen y edición de imágenes, y con un diseño arquitectónico avanzado y métodos de formación colaborativos y unificados, apoya la realización de...

Últimos recursos sobre IA

hace 1 año

061.8K

全球首个量子 AI 模型问世！SECQAI 发布 QLLM 即将进入 Beta 测试

SECQAI lanza QLLM para pruebas beta: ¡el primer modelo de inteligencia artificial cuántica del mundo!

SECQAI, una empresa británica de hardware y software ultraseguros, ha anunciado el lanzamiento del primer Modelo Cuántico de Lenguaje Grande (QLLM) del mundo, que integra la tecnología de computación cuántica en los modelos tradicionales de IA para mejorar la eficiencia computacional y la capacidad de resolución de problemas. Mecánica cuántica + IA = ¿una IA más potente? ...

Últimos recursos sobre IA

hace 1 año

061.7K

Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI - Modelos de la serie de agentes de IA de código abierto de Step-Star

Step-GUI es la serie de modelos de agentes de IA de código abierto de Step-Star, que incluye el modelo en la nube Step-GUI, el primer protocolo MCP para agentes GUI, y el primer modelo de código abierto del sector Step-GUI Edge para...

Últimos recursos sobre IA

hace 7 meses

061.7K

OpenScreen - 开源免费的屏幕录制工具，支持Mac和Windows双系统

OpenScreen - Herramienta de grabación de pantalla gratuita y de código abierto para Mac y Windows.

OpenScreen es una herramienta de grabación de pantalla de código abierto y gratuita que proporciona a los usuarios una alternativa fácil de usar y funcional a Screen Studio. Es compatible tanto con Mac como con Windows, es totalmente gratuita y sigue el protocolo del MIT, y puede utilizarse para grabaciones individuales de...

Últimos recursos sobre IA

hace 8 meses

061.5K

AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Un modelo cuadrático de generación de imágenes de Toast AI y otros

AnimaTensor es un modelo cuadrático de generación de imágenes del equipo CagliostroLab en colaboración con TensorArt, basado en una innovadora técnica V-Prediction que optimiza la programación del ruido mediante la predicción de la "velocidad" del proceso de generación de imágenes....

Últimos recursos sobre IA

hace 1 año

061.5K

Klic Studio - AI音视频翻译配音工具，一键部署全流程

Klic Studio - Herramienta de traducción y doblaje de audio/vídeo con IA, despliegue de todo el proceso con un solo clic

Klic Studio (antes Krillin AI) es una herramienta de traducción de vídeo, doblaje y clonación de voz basada en IA diseñada para creadores de vídeo y exportadores de contenidos. Es compatible con la implementación de un solo clic de todo el proceso, que puede completar el vídeo desde la descarga hasta la salida terminada en un solo clic, y se adapta a Jittery, Xiaohongshu, B...

Últimos recursos sobre IA

hace 1 año

061.4K

ChartAI - AI数据分析工具，智能推荐适合的图表类型

ChartAI - Herramienta de análisis de datos de IA que recomienda de forma inteligente los tipos de gráficos adecuados.

ChartAI es una eficaz herramienta de visualización de datos que analiza automáticamente los datos basándose en tecnología de IA para generar gráficos intuitivos que ayudan a los usuarios a comprender rápidamente información compleja.ChartAI admite la importación de múltiples formatos de datos (por ejemplo, Excel, CSV), y admite la recomendación inteligente del gráfico más adecuado....

Últimos recursos sobre IA

hace 1 año

061.4K

AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - Modelo de IA de sonido para generación de texto de código abierto KU Xunfei

AudioFly es un modelo de IA de código abierto para generar efectos de sonido a partir de texto de KDDI. Basado en la arquitectura del modelo de difusión potencial, con mil millones de parámetros, entrenado en conjuntos de datos de texto de audio diversos y a gran escala, que abarcan conjuntos de datos públicos como AudioSet, AudioCaps, TUT e internos....

Últimos recursos sobre IA

hace 10 meses

061.4K

商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi: Shangtang Technology lanza una plataforma de producción de vídeo humano digital con IA

Shangtang Ruying es una plataforma de producción de vídeo humano digital con IA lanzada por Shangtang Technology. Basada en la tecnología de grandes modelos, la plataforma permite crear imágenes humanas digitales de gran realismo y personalizarlas, incluidos los rasgos faciales, la ropa, los peinados, etc. La plataforma está equipada con clonación de sonido, generación de vídeo, anotación automática de datos, interacción en tiempo real y otras funciones...

Últimos recursos sobre IA

hace 1 año

061.4K

Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides - La Universidad de Hong Kong convierte documentos académicos de código abierto en diapositivas Herramientas de IA

Paper2Slides es una herramienta de IA de código abierto del Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong que convierte documentos académicos en diapositivas o pósters profesionales en un solo clic. Utiliza la tecnología RAG (Retrieval Augmented Generation), analizando directamente el contenido del documento en lugar de basarse en información de la red, para garantizar que el PPT generado sea altamente coherente con el original....

Últimos recursos sobre IA

hace 8 meses

061.3K

优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

Elegante YOYA - Sinotech Winko lanza una plataforma de creación de contenidos de audio y vídeo basados en IA

Elegant YOYA es una plataforma de vídeo multimodal alfabetizada lanzada por Zhongke Wenge, la plataforma se basa en la tecnología multimodal AI para potenciar toda la cadena de creación de contenidos de vídeo. Los usuarios sólo tienen que introducir los requisitos del tema, la plataforma puede generar rápidamente secuencias de comandos, imágenes, vídeos, y puede completar la edición inteligente, síntesis de voz y la unidad de la boca de caracteres y otras operaciones, la salida...

Últimos recursos sobre IA

hace 1 año

061.3K

FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - Hugging Face lanza un conjunto de datos de código abierto sobre el lenguaje visual

FineVision es el conjunto de datos de lenguaje visual de código abierto de Hugging Face para el entrenamiento de modelos avanzados de lenguaje visual. Contiene 17,3 millones de imágenes, 24,3 millones de muestras, 88,9 millones de rondas de diálogo y 9.500 millones de tokens de respuesta. El conjunto de datos...

Últimos recursos sobre IA

hace 11 meses

061.3K

json-render - Vercel Labs开源的AI生成UI的工具

json-render - Vercel Labs开源的AI生成UI的工具

json-render是Vercel Labs开源的AI生成UI的工具，通过“AI → JSON → UI”的流程实现结构化、可控的界面生成。要求AI仅输出符合预定义Schema的JSON数据，前端再...

Últimos recursos sobre IA

hace 6 meses

061.2K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - El modelo de generación y edición de imágenes más potente de Google

Gemini 2.5 Flash Image (nombre en clave nano banana) es un modelo de generación y edición de imágenes de última generación de Google que mantiene la coherencia de los caracteres en todas las escenas y admite la edición precisa de imágenes mediante lenguaje natural, como el desenfoque de fondos y la eliminación de manchas.

Últimos recursos sobre IA

hace 11 meses

061.2K

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2是DeepSeek团队开源的新一代OCR模型，核心创新在于采用DeepEncoder V2架构，将传统固定栅格扫描的视觉编码方式升级为基于语义推理的动态处理。模型通过因果流...

Últimos recursos sobre IA

hace 6 meses

061.1K

DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Modelos de síntesis de voz sin muestras de Microsoft

DragonV2.1 es un avanzado modelo de conversión de texto a voz (TTS) de muestra cero de Microsoft. Basado en la arquitectura Transformer, el modelo admite la clonación de voz en varios idiomas y sin muestras, y genera un habla natural y expresiva con solo 5-90 segundos de indicaciones de voz.

Últimos recursos sobre IA

hace 1 año

061.1K

Higress MCP - 今日投资推出的MCP服务平台

Higress MCP - Invest Today lanza una plataforma de servicios MCP

Higress MCP es una plataforma innovadora lanzada por Invest Today que soporta la rápida transformación de APIs de datos financieros tradicionales en modernos servicios MCP.Higress MCP permite la transformación de APIs REST a MCP Server basándose en una sencilla configuración sin necesidad de codificación....

Últimos recursos sobre IA

hace 1 año

061K

Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - Agente de IA de código abierto de Microsoft para la colaboración entre humanos y ordenadores

Magentic-UI es la herramienta de investigación de código abierto de Microsoft para la colaboración entre humanos y ordenadores. Magentic-UI se basa en el trabajo en estrecha colaboración con los usuarios para facilitar tareas web complejas como la navegación web, la ejecución de código y la manipulación de archivos. La herramienta hace hincapié en la planificación colaborativa, permitiendo a los usuarios plantear...

Últimos recursos sobre IA

hace 1 año

061K

企鹅读伴 - 腾讯推出的中小学生AI阅读助手

Penguin Reading Companion: el asistente de lectura inteligente de Tencent para estudiantes de primaria y secundaria

Penguin Reading Companion es un asistente de lectura con inteligencia artificial diseñado por Tencent para estudiantes de primaria y secundaria. Penguin Reading Companion se basa en el gran modelo híbrido y la plataforma de metamáquinas de Tencent, combinados con el Programa Curricular de Lenguas de Educación Obligatoria y los Estándares Curriculares (Edición 2022), para ofrecer a los estudiantes recomendaciones de lectura personalizadas, múltiples modos de lectura (concentración, lectura en voz alta, escucha...

Últimos recursos sobre IA

hace 1 año

060.9K

FactSnap - 新一代AI信息核查工具

FactSnap - Herramienta de verificación de información de IA de nueva generación

FactSnap es una herramienta de verificación de información de IA de nueva generación que ayuda a los usuarios a verificar rápidamente la autenticidad de la información de la web. Mediante la integración de múltiples modelos y motores de búsqueda, realiza la verificación en tiempo real del texto seleccionado mientras el usuario navega por la web.

Últimos recursos sobre IA

hace 1 año

060.9K

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 - Modelado de texto a voz de código abierto de extremo a extremo de Faceted Intelligence

VoxCPM 1.5 es un modelo de generación de voz de código abierto publicado por Facade Intelligence, basado en la tecnología de conversión de texto a voz (TTS) sin necesidad de divisor, con varias innovaciones y mejoras. Adoptando una arquitectura autorregresiva de difusión de extremo a extremo, genera formas de onda de habla continua directamente a partir del texto, evitando las limitaciones de los métodos tradicionales de segmentación...

Últimos recursos sobre IA

hace 8 meses

060.9K

Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered - Modelo de edición de imágenes por IA de código abierto por el equipo de Ali

Qwen-Image-Layered es un modelo de edición de imágenes de AI de código abierto del equipo Ali que descompone de forma inteligente imágenes ordinarias en capas transparentes independientes para lograr una edición de precisión similar a la de Photoshop. El modelo es de código abierto mediante el protocolo Apache 2.0 y admite un control flexible de las capas...

Últimos recursos sobre IA

hace 7 meses

060.9K

通义DeepResearch - 阿里通义开源的深度研究智能体

Tongyi DeepResearch - Cuerpo de inteligencia de investigación profunda de código abierto Ali Tongyi

Tongyi DeepResearch (Tongyi Investigación Profunda) es un organismo inteligente de código abierto lanzado por Alibaba, diseñado para la recuperación profunda de información y el razonamiento de tareas complejas, con 30.000 millones de parámetros, compatible con múltiples modos de razonamiento, incluidos el modo ReAct y el modo de profundidad...

Últimos recursos sobre IA

hace 11 meses

060.8K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - Asistente de programación de IA de código abierto para empresas

MonkeyCode es un asistente de programación de IA nativo, de código abierto y de nivel empresarial diseñado para equipos de desarrollo preocupados por la privacidad y la seguridad.MonkeyCode admite el despliegue privado y el uso sin conexión para garantizar la seguridad de los datos del código. MonkeyCode soporta el despliegue privado y el uso fuera de línea para garantizar la seguridad de los datos de código ...

Últimos recursos sobre IA

hace 1 año

060.8K

Why My Wife Yelling At Me：模拟婚姻沟通的互动工具

Por qué me grita mi mujer: una herramienta interactiva para simular la comunicación conyugal

Introducción general "Por qué me grita mi mujer" es un sitio web único de simulación de relaciones matrimoniales diseñado para ayudar a los usuarios a comprender las reacciones emocionales y los patrones de comunicación de su pareja mediante inteligencia artificial. Los usuarios pueden introducir diferentes escenarios y experimentar las reacciones de su pareja virtual, simulando...

Últimos recursos sobre IA

hace 1 año

060.8K

QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - Ali Tongyi lanza un modelo de razonamiento visual

QVQ-Max es un modelo de razonamiento visual avanzado de Alitonix, una versión mejorada del QVQ-72B-Preview, que puede "leer" imágenes y contenido de vídeo y combinarlos con información para el análisis y la resolución de problemas. QVQ-Max es un modelo avanzado de razonamiento visual que puede "leer" imágenes y contenido de vídeo y combinar la información para el análisis, razonamiento y resolución de problemas.Las principales características de QVQ-Max incluyen análisis sintáctico de imágenes, análisis de vídeo...

Últimos recursos sobre IA

hace 1 año

060.7K

Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO - Un gran modelo multimodal de código abierto del Laboratorio de Inteligencia Artificial de Shanghai y Huawei Rise

Lumina-DiMOO es un modelo unificado de nueva generación para la generación y comprensión multimodal lanzado por el Laboratorio de Inteligencia Artificial de Shanghái (SAL) junto con Huawei Rise en la Conferencia Mundial sobre Inteligencia Artificial 2025. Basado en la plataforma básica de hardware y software Rise AI y en el conjunto de grandes modelos multimodales MindSpeed MM, completa la...

Últimos recursos sobre IA

hace 11 meses

060.7K

RedOne - 小红书最新推出的社交大模型

RedOne: el último megamodelo social de Little Red Book

RedOne es un gran modelo lingüístico adaptado a las redes sociales presentado por Little Red Book. El modelo se entrena mediante una estrategia de formación en tres fases que incorpora conocimientos sociales y culturales, refuerza las capacidades multitarea y alinea las preferencias humanas.RedOne supera significativamente al modelo base en rendimiento de tareas sociales, en detección de contenidos nocivos y navegación...

Últimos recursos sobre IA

hace 1 año

060.7K

CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - CRIC lanza el primer agente de IA para el sector inmobiliario chino

CRIC Depth Intelligence es el primer organismo inteligente de IA del sector inmobiliario chino desarrollado de forma independiente por CRIC, basado en los 20 años de experiencia y acumulación de datos de CRIC en el sector inmobiliario y en la tecnología de grandes modelos multimodales, que abre toda la cadena desde la integración de datos, el análisis inteligente hasta la generación de contenidos.

Últimos recursos sobre IA

hace 1 año

060.6K

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1是字节跳动开源的实时交互数字人视频生成框架，能通过单张参考图和音频流式生成无限时长的高保真全身动态视频。核心创新在于分块流式生成技术，将视频拆解为0.5秒一小段接力处理，配合结构化...

Últimos recursos sobre IA

hace 6 meses

060.6K

Hyprnote - 开源的本地优先AI会议笔记工具

Hyprnote - Herramienta de código abierto para tomar notas de conferencias con inteligencia artificial en primer lugar local

Hyprnote es una herramienta AI de código abierto para tomar notas en reuniones, diseñada para que los profesionales protejan la privacidad de los usuarios y mejoren la eficiencia de las reuniones. Adoptando el principio de "lo local primero", todo el almacenamiento y procesamiento de datos se realiza en el dispositivo local del usuario para garantizar la seguridad de los datos y permitir el funcionamiento sin conexión.

Últimos recursos sobre IA

hace 11 meses

060.6K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

Kandinsky 5.0 - Serie de modelos de generación de vídeo de código abierto del equipo ruso de IA

Kandinsky 5.0 es la última serie de modelos de generación de vídeo desarrollada por el equipo ruso de IA, centrada en un diseño ligero y un alto rendimiento. El primer modelo de la serie, Kandinsky 5.0 Video Lite, solo tiene 2.000 millones de parámetros, pero supera a modelos similares de 14B, especialmente...

Últimos recursos sobre IA

hace 10 meses

060.5K

分析 civitai 226K 得到的常用正负面提示词

Análisis de indicios positivos y negativos comunes obtenidos de civitai 226K

Lista de recursos Top 10 1000 fichas más comunes 1000 fichas negativas más comunes 20 muestreadores más comunes 100 pasos más comunes 100 dimensiones más comunes 50...

Últimos recursos sobre IA # AI Ayudas para la generación de imágenes

hace 2 años

060.5K

Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

Confucius3-Math - NetEase.com lanza un modelo de razonamiento de código abierto centrado en la enseñanza de las matemáticas

Confucius3-Math es el primer modelo de razonamiento de código abierto nacional centrado en la educación matemática de código abierto por NetEaseYouDao. Con 14.000 millones de parámetros, optimizado para escenarios de educación matemática K-12, puede ejecutarse eficientemente en una sola GPU de consumo (por ejemplo, RTX 4090D), con un rendimiento de inferencia de...

Últimos recursos sobre IA

hace 1 año

060.4K

Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - Un modelo unificado de comprensión y generación multimodal de Tongyi Qianqian

Qwen VLo es un modelo multimodal unificado de comprensión y generación presentado por el equipo de Tongyiqianqian. Qwen VLo puede "entender" el mundo y recrearlo con alta calidad basándose en su comprensión, realizando el salto de la percepción a la generación. VLo puede comprender con precisión el contenido de las imágenes y, a partir de ahí, llevar a cabo una generación coherente y de alta calidad.

Últimos recursos sobre IA

hace 1 año

060.3K

职达AI简历 - AI简历生成与优化平台，精准分析问题、提供优化建议

JobTech AI CV - Plataforma de generación y optimización de CV mediante IA, que analiza con precisión los problemas y ofrece sugerencias de optimización.

Job AI resume es una plataforma inteligente de generación y optimización de currículos eficiente y cómoda. Basada en la tecnología de IA, la plataforma ayuda a los usuarios a generar rápidamente currículos profesionales y personalizados. Los usuarios sólo tienen que introducir la información básica y la experiencia, la plataforma puede generar curriculum vitae de alta calidad en poco tiempo, proporcionando más de 2800 plantillas hermosas, que cubren una variedad de posiciones.

Últimos recursos sobre IA

hace 1 año

060.3K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - Una versión mejorada de la Inteligencia de Investigación Profunda de Kunlun

Skywork Deep Research Agent v2 es un organismo inteligente de investigación profunda lanzado por Kunlun Wave, centrado en la integración y el análisis de información multimodal.Skywork Deep Research Agent v2 puede procesar texto, gráficos...

Últimos recursos sobre IA

hace 12 meses

060.3K

稿定AI社区 - AI创意内容设计平台，多种设计资源满足不同创作需求

Drafting AI Community - Plataforma de diseño de contenidos creativos con IA, una variedad de recursos de diseño para satisfacer diferentes necesidades creativas.

Drafting AI Community es una plataforma en línea de inspiración creativa en IA que proporciona a los usuarios una gran cantidad de recursos y herramientas de diseño creativo. La plataforma abarca diversos campos del diseño, como fotos de imágenes, diseño de comercio electrónico, temas de vacaciones, ilustraciones en 3D, diseño de avatares, materiales Xiaohongshu, diseño de retratos, etc., para satisfacer las necesidades de los distintos usuarios.

Últimos recursos sobre IA

hace 1 año

060.3K

2024年自动化流程执行创作工作的14款出色AI工具

14 brillantes herramientas de IA para automatizar procesos y realizar trabajos creativos en 2024

Si está buscando aprovechar el poder de la Inteligencia Artificial para ayudarle con las tareas cotidianas y automatizar los flujos de trabajo en su vida personal y laboral, entonces puede que le interese la amplia gama de herramientas de IA disponibles. AssemblyAI ha elaborado un vídeo de cinco minutos en el que se detallan las herramientas que puedes utilizar para automatizar...

Últimos recursos sobre IA

hace 2 años

060.2K

AntSK FileChunk - 免费的AI语义文档切片工具，动态切片调整

AntSK FileChunk - Herramienta gratuita de rebanado semántico de documentos AI, ajuste dinámico de rebanado

AntSK FileChunk es una herramienta gratuita de rebanado inteligente de documentos diseñada para aplicaciones RAG (Retrieval Augmented Generation). Semántica como núcleo, el documento será inteligentemente rebanado en segmentos semánticamente completos, coherentes, soporte para multi-idioma, ajustar dinámicamente el tamaño de la rebanada para asegurar la coherencia contextual.

Últimos recursos sobre IA

hace 11 meses

060.2K

Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - Modelos de generación de música por IA de Quintessence

Mureka V7 es un modelo avanzado de generación musical por IA lanzado por Kunlun World Wide. El modelo se basa en la tecnología MusiCoT, que permite planificar la estructura general de la música antes de rellenar los detalles para generar obras musicales más coherentes y artísticas.

Últimos recursos sobre IA

hace 1 año

060.1K

Magistral - Mistral AI 推出的系列推理模型

Magistral - Serie de modelos de inferencia de Mistral AI

Magistral es un modelo de inferencia de Mistral AI que se centra en capacidades de razonamiento transparentes, multilingües y específicas de cada dominio. El modelo consta de una versión de código abierto (Magistral Small) y una versión empresarial (Magistral Medium), esta última en...

Últimos recursos sobre IA

hace 1 año

060K

Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - ¡Un modelo de interpretación simultánea de ByteHop!

Seed LiveInterpret 2.0 es un modelo de interpretación simultánea de última generación lanzado por el equipo Seed de ByteDance, que admite la traducción bidireccional entre chino e inglés. El modelo tiene una precisión de traducción cercana a la vida real y una latencia extremadamente baja, con un retardo medio de voz a voz de solo 2-3 segundos, muy inferior al de...

Últimos recursos sobre IA

hace 1 año

060K

NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen: el modelo de IA para juegos de código abierto de NVIDIA en colaboración con Stanford, Caltech y otros.

NitroGen es un modelo de IA para juegos de código abierto desarrollado por NVIDIA en colaboración con la Universidad de Stanford, Caltech y otras instituciones, capaz de ejecutar más de 1.000 tipos de juegos diferentes. El modelo se basa en la arquitectura GROOT N1.5 y se obtiene mediante el análisis de 40.000 horas de datos de vídeo de juegos (incluida la anotación del funcionamiento del joystick)....

Últimos recursos sobre IA

hace 7 meses

059.9K

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed（蚂蚁·安诊儿医疗大模型）是浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司联合开发的开源医疗大模型。模型采用混合专家架构（MoE），总参数量达1000亿...

Últimos recursos sobre IA

hace 7 meses

059.9K

问小白5 - 问小白推出的全能AI模型

Ask White 5 - Modelo AI todo en uno de Ask White

Ask White 5 es el modelo insignia "Todo en uno" con un nivel de inteligencia muy alto. El modelo obtiene buenos resultados en muchas evaluaciones, como la puntuación de evaluación compuesta AA-Index de 64,7 y la puntuación de evaluación de la capacidad STEM de 86, que se acerca a la del líder mundial GPT-5.

Últimos recursos sobre IA

hace 11 meses

059.7K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Un gran modelo de razonamiento financiero de Anthem Digital

Agentar-Fin-R1 es un modelo de gran lenguaje de última generación para el ámbito financiero presentado por Anthem. Desarrollado sobre la base de la potente arquitectura Qwen3, el modelo ofrece dos versiones de escala de parámetros, 8B y 32B, y puede manejar con precisión tareas complejas de razonamiento financiero, incluyendo el análisis de múltiples pasos, la evaluación de riesgos y la guerra....

Últimos recursos sobre IA

hace 1 año

059.7K

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列，专注于代码智能领域，具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式，从代码库演化...

Últimos recursos sobre IA

hace 7 meses

059.6K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Modelos de generación de escenas 3D de código abierto de Qunar Technologies

SpatialGen es un modelo de generación de escenas 3D de código abierto de Qunar Technology, basado en la arquitectura del modelo de difusión, que admite la generación de imágenes multivista coherentes espaciotemporalmente a partir de descripciones textuales, imágenes de referencia y disposición espacial 3D, y que además genera escenas gaussianas 3D y renderiza vídeos itinerantes.

Últimos recursos sobre IA

hace 11 meses

059.6K

FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - Sistema de interacción por voz full-duplex de código abierto de Little Red Book

FireRedChat es un sistema de interacción de voz full-duplex de código abierto para Xiaohongshu con capacidad de diálogo bidireccional en tiempo real y soporte para interrupciones controladas. Utilizando un diseño modular , incluyendo módulo de control de transcripción , módulo de interacción y gestor de diálogo , etc., soporta arquitectura en cascada y semi-cascada , despliegue flexible.

Últimos recursos sobre IA

hace 10 meses

059.4K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS: el último marco de generación de voz de KunlunWei

MoE-TTS es un marco de síntesis del habla introducido por KunlunWanwei, basado en la arquitectura Mixed Expert (MoE), que combina Large Language Models (LLMs) preentrenados con módulos expertos del habla.MoE-TTS conserva el potente razonamiento textual congelando los parámetros del módulo textual y actualizando sólo los parámetros del módulo del habla....

Últimos recursos sobre IA

hace 12 meses

059.4K

Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard - Modelo de seguridad de código abierto Ali Qwen

Qwen3Guard es un modelo de protección de seguridad afinado basado en el modelo base Qwen3, diseñado para la detección de seguridad. Proporciona una categorización de seguridad precisa de las solicitudes y respuestas, proporciona niveles de riesgo y es compatible con entornos en inglés, chino y multilingües.Qwen3Guard está disponible en dos pro...

Últimos recursos sobre IA

hace 10 meses

059.4K

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed是开发者Kevin He推出的开源AI新闻摘要工具，解决信息过载问题。通过聚合Twitter、RSS、GitHub等多平台信息源，利用AI自动生成4小时、每日、每周和每月的结构化摘要...

Últimos recursos sobre IA

hace 5 meses

059.3K

MindLink - 昆仑万维推出的开源推理大模型

MindLink - Gran modelo de razonamiento de código abierto de KunlunWei

MindLink es un gran modelo de razonamiento de código abierto lanzado por Kunlun World Wide Web. Con el mecanismo de razonamiento adaptativo , de acuerdo con la complejidad de la tarea de conmutación flexible modo de razonamiento , las tareas simples generados rápidamente , tareas complejas razonamiento en profundidad , teniendo en cuenta la eficiencia y la precisión . Paradigma de razonamiento basado en planes para eliminar la etiqueta "pensar" , reducir ...

Últimos recursos sobre IA

hace 1 año

059.2K

Xiaomi-MiMo-Audio - 小米开源的首个原生端到端语音大模型

Xiaomi-MiMo-Audio: el primer modelo nativo de voz de extremo a extremo de código abierto de Xiaomi

Xiaomi-MiMo-Audio es el macromodelo de voz de Xiaomi de código abierto con 7.000 millones de parámetros de extremo a extremo y potentes funciones como el diálogo multilingüe, la continuación del habla, la generalización de menos muestras y la comprensión de audio, capaz de alcanzar el nivel SOTA en inteligencia del habla y comprensión de audio, superando a Google Gemi...

Últimos recursos sobre IA

hace 10 meses

059.1K

Midjourney V1- Midjourney推出的首个图生视频模型

Midjourney V1- El primer modelo de vídeo gráfico de Midjourney

Midjourney V1 es el primer modelo de generación de vídeo AI de Midjourney, que permite transformar imágenes estáticas en vídeos vivos y dinámicos con la ayuda de la avanzada tecnología AI. Los usuarios solo tienen que cargar imágenes o imágenes generadas con Midjourney, tocar...

Últimos recursos sobre IA

hace 1 año

059K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - Conjunto de evaluación de código abierto Meeseeks para evaluar la capacidad de seguir instrucciones de modelos.

Meeseeks es un conjunto de evaluación de grandes modelos de código abierto utilizado por el equipo M17 de Meituan para evaluar la capacidad de un modelo para seguir instrucciones.Meeseeks utiliza un marco de evaluación de tres niveles para medir de forma exhaustiva si un modelo es capaz de generar respuestas en estricta conformidad con las instrucciones del usuario desde el nivel macro al micro, y no evalúa el conocimiento del contenido de la respuesta como...

Últimos recursos sobre IA

hace 11 meses

059K

MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 - ¡El último modelo de generación de música por IA de MiniMax!

MiniMax Music 1.5 es una herramienta avanzada de generación de música por IA que permite generar hasta 4 minutos de música a partir de la descripción en lenguaje natural del usuario. El modelo es compatible con una amplia gama de estilos musicales y personalización del estado de ánimo, y genera tonos vocales naturales y completos, transiciones suaves y arreglos ricamente estratificados....

Últimos recursos sobre IA

hace 11 meses

059K

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - Modelo de inferencia de inteligencia artificial de Google

Gemini 2.5 Deep Think es un modelo de razonamiento de IA de Google diseñado para resolver tareas complejas. Es una variante del modelo que ganó la medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, y está diseñado para resolver tareas complejas mediante Paralelo...

Últimos recursos sobre IA

hace 1 año

059K

文心大模型X1.1 - 百度推出的深度思考模型，理解能力更强

Wenshin Big Model X1.1 - El modelo de pensamiento profundo de Baidu para comprender mejor

Wenxin Big Model X1.1 es un modelo de pensamiento profundo lanzado por Baidu, basado en un marco híbrido de aprendizaje por refuerzo que se centra en mejorar la comprensión y la generación de lenguaje. El modelo destaca en el manejo de preguntas complejas, el seguimiento de instrucciones y la simulación del comportamiento de las inteligencias, y puede proporcionar con precisión respuestas bien fundamentadas y contenidos de texto de alta calidad.

Últimos recursos sobre IA

hace 11 meses

059K

飞算JavaAI - AI Java开发助手，自然语言实现全流程智能化开发

Flycount JavaAI - AI Java asistente de desarrollo, la aplicación de lenguaje natural de todo el proceso de desarrollo inteligente

Flycount JavaAI es un asistente inteligente de desarrollo Java lanzado por Flycount Technology. La plataforma es compatible con la entrada de lenguaje natural para lograr todo el proceso de desarrollo inteligente de análisis de requisitos para la generación de código. Los desarrolladores sólo tienen que introducir una descripción de los requisitos, Flycount JavaAI puede entender con precisión y generar un marco completo de código de ingeniería, la plataforma...

Últimos recursos sobre IA

hace 1 año

058.8K

Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Modelo emblemático de gran lenguaje de Tongyi Qianqian

Qwen3-Max-Preview es el último gran modelo lingüístico insignia lanzado por Tongyi Qianwen. Es el modelo con el mayor número de parámetros de la familia Qwen3, con un tamaño de parámetros de más de 1 billón. El modelo presenta mejoras significativas en inferencia, seguimiento de instrucciones, soporte multilingüe y cobertura de conocimiento de cola larga...

Últimos recursos sobre IA

hace 11 meses

058.6K

PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - Marco de razonamiento colaborativo paralelo de StepStar para la Inteligencia Artificial

PaCoRe (Parallel Coordinated Reasoning) es el innovador marco de razonamiento colaborativo paralelo de código abierto de StepFun, a través de un mecanismo de pensamiento masivamente paralelo, desde múltiples perspectivas para explorar simultáneamente la solución del problema, rompiendo...

Últimos recursos sobre IA

hace 8 meses

058.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

Últimos recursos sobre IA

hace 2 meses

058.4K

Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架

Youtu-GraphRAG - Marco de generación de gráficos mejorados de código abierto de Tencent Youtu Labs

Youtu-GraphRAG es un marco de generación de aumento de recuperación de grafos de código abierto de Tencent Youtu Labs para ayudar a los grandes modelos lingüísticos a manejar tareas complejas de preguntas y respuestas con mayor precisión. Mediante la construcción de un árbol de conocimiento de cuatro capas, el conocimiento se desmonta en cuatro niveles: atributos, relaciones, palabras clave y comunidades, para lograr un conocimiento transversal del dominio propio de la act...

Últimos recursos sobre IA

hace 11 meses

058.3K

Report mAIstro：生成任意自定义主题的详细报告文档，例如商业分析、年终汇报等

mAIstro de informes: Genere informes detallados sobre cualquier tema personalizado, como análisis de negocio, informes de fin de año, etc.

Descripción general Report mAIstro es una potente herramienta diseñada para ayudar a los usuarios a crear fácilmente informes personalizados mediante la tecnología de procesamiento del lenguaje natural. La herramienta utiliza la tecnología LangChain para transformar los temas y estructuras proporcionados por el usuario en informes detallados dentro de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Generar un informe de investigación en profundidad

hace 1 año

058.2K

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban是开源的AI编程代理任务管理工具，专为同时使用多个AI编程助手（如Claude Code、Gemini CLI、Codex等）的开发者设计。通过看板形式统一管理任务进度，支持并行...

Últimos recursos sobre IA

hace 7 meses

058.2K

万兴天幕 – 万兴科技推出AIGC视频创作平台

Wanxing Canopy - Wanxing Technology lanza la plataforma de creación de vídeo AIGC

Wanxing Canopy es la plataforma de creación de vídeo AIGC lanzada por Wanxing Technology, que abarca los tres principales campos de creación: vídeo, imagen y generación de audio, y está especialmente diseñada para trabajadores de la industria cultural y de los medios de comunicación, trabajadores de cine y televisión/postproducción, trabajadores de arte y diseño, profesionales de la publicidad y el marketing, etc., con el fin de ofrecer soluciones de creación profesional integradas.

Últimos recursos sobre IA

hace 1 año

058.2K

Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - Modelo de análisis sintáctico de documentos de código abierto Ali

Logics-Parsing es un modelo de análisis sintáctico de documentos de extremo a extremo de código abierto, basado en Qwen2.5-VL-7B. Optimiza el análisis del diseño de los documentos y la inferencia del orden de lectura mediante el aprendizaje por refuerzo ...

Últimos recursos sobre IA

hace 10 meses

058.2K

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next是阿里巴巴通义千问团队开源的专为编程智能体设计的高效混合模型，基于80B总参数的Qwen3-Next架构，推理时仅激活3B参数。核心创新在于采用环境交互和强化学习训练方...

Últimos recursos sobre IA

hace 6 meses

058K

Stand-In - 腾讯微信视觉开源的轻量级视频生成框架

Stand-In - Marco de generación de vídeo ligero de código abierto Tencent WeChat Visual

Stand-In es un marco de generación de vídeo ligero, plug-and-play y preservador de identidad del equipo WeChat Vision de Tencent. Centrado en preservar rasgos de identidad específicos en la generación de vídeo, solo necesita entrenar parámetros adicionales del modelo base 1%, y puede lograr excelentes resultados en similitud facial y naturalidad.

Últimos recursos sobre IA

hace 11 meses

057.7K

DeepSeek-OCR - DeepSeek开源的光学字符识别模型

DeepSeek-OCR - Modelo de reconocimiento óptico de caracteres de código abierto DeepSeek

DeepSeek-OCR es un modelo avanzado de reconocimiento óptico de caracteres (OCR) de código abierto creado por el equipo de DeepSeek, que convierte texto en imágenes mediante la tecnología de "compresión óptica contextual" y utiliza fichas visuales para la compresión y descodificación con el fin de lograr un procesamiento eficaz de textos largos.

Últimos recursos sobre IA

hace 9 meses

057.7K

MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent - framework de código abierto para la creación de cuerpos inteligentes móviles de la Universidad Jiaotong de Shanghai

MobiAgent es una cadena de herramientas de código abierto para cuerpos inteligentes móviles del Laboratorio IPADS de la Universidad Jiaotong de Shanghai, que ayuda a los usuarios a construir sus propios asistentes inteligentes móviles. Mediante el registro de la trayectoria de funcionamiento del usuario y la generación de datos de alta calidad, entrena cuerpos inteligentes capaces de entender órdenes en lenguaje natural. Entre sus principales características se incluyen...

Últimos recursos sobre IA

hace 11 meses

057.4K

WebWeaver - 阿里通义开源的新型双智能体框架

WebWeaver - Ali Tongyi abre un nuevo marco corporal de doble inteligencia

WebWeaver es un nuevo marco corporal de doble inteligencia introducido por el equipo de Alibaba Tongyi, que se utiliza principalmente en la investigación profunda abierta, y puede simular el proceso de investigación humana, que se divide en dos inteligencias: planificación y escritura.

Últimos recursos sobre IA

hace 11 meses

057.4K

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts 是蚂蚁集团与Inclusion AI联合开源的多模态音频生成模型，包含0.5B和16.8B-A3B两个版本。模型首次实现了语音、环境音和音乐的统一自回归生成，支持语速、音量...

Últimos recursos sobre IA

hace 5 meses

057.4K

Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - Una familia de modelos de IA de código abierto publicada por NVIDIA

Nemotron 3 es una familia de modelos de IA de código abierto lanzada por NVIDIA en tamaños Nano, Super y Ultra. Nemotron 3 adopta una arquitectura MoE latente que mejora significativamente la eficiencia de la inferencia y reduce los costes operativos. Entre ellos...

Últimos recursos sobre IA

hace 8 meses

057.2K

Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - El nuevo modelo de razonamiento presentado por Racer

Klear-Reasoner es un modelo de inferencia de alto rendimiento de Racer, basado en Qwen3-8B-Base. El modelo se entrena mediante ajuste fino supervisado en cadena de pensamiento largo y aprendizaje por refuerzo para obtener buenos resultados en razonamiento matemático y de código.Klear-Reasoner...

Últimos recursos sobre IA

hace 11 meses

057.1K

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5是阿里巴巴通义千问团队开源的最新一代大语言模型，属于千问（Qwen）系列的升级版本。Qwen3.5突破了传统文本模型的限制，实现了真正的原生多模态理解，可直接处理文本、图像、视频等多种模...

Últimos recursos sobre IA

hace 5 meses

057.1K

HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager - Modelo mundial de itinerancia ultralarga de código abierto de Tencent

HunyuanWorld-Voyager (abreviado Hunyuan Voyager) es el primer modelo de mundo itinerante ultralargo de la industria lanzado por Tencent que admite la reconstrucción nativa en 3D. Se trata de un novedoso marco de difusión de vídeo que genera secuencias de nubes de puntos 3D de trayectorias de cámara definidas por el usuario a partir de una sola imagen,...

Últimos recursos sobre IA

hace 11 meses

057K

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding是阿里通义团队开源的多模态嵌入模型，属于Qwen3-VL系列，主要用于跨模态检索任务。模型将文本、图像、视频等不同模态数据映射到同一语义空间，通过双塔架构生成向量表...

Últimos recursos sobre IA

hace 7 meses

056.9K

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex是英伟达开源的全双工语音对话模型，拥有70亿参数。摒弃了传统的语音识别→语言模型→文本到语音的级联流程，采用统一的Transformer架构，能同步处理语音理解与生成。模型支持全...

Últimos recursos sobre IA

hace 6 meses

056.8K

OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - Modelo multimodal de código abierto para Meituan y la Universidad Jiaotong de Shanghai

OneCAT es un nuevo modelo multimodal unificado lanzado por Meituan junto con la Universidad Jiaotong de Shanghai, que adopta una arquitectura de descodificador puro que integra a la perfección la comprensión multimodal, la generación de texto a imagen y las funciones de edición de imágenes. El modelo abandona el diseño de los modelos multimodales tradicionales que dependen de codificadores y desambiguadores visuales externos mediante...

Últimos recursos sobre IA

hace 11 meses

056.6K

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0是蚂蚁集团开源的全模态大模型，集成了视觉、语音和生成能力的AI模型，在多项基准测试中性能领先。支持同时生成语音、环境音效和音乐，能通过自然语言指令精细控制音色、语...

Últimos recursos sobre IA

hace 5 meses

056.6K

Gemini Robotics On-Device - 谷歌推出首个在本地运行的具身智能模型

Gemini Robotics On-Device - Google lanza el primer modelo de inteligencia incorporada que funciona localmente

Gemini Robotics On-Device es un modelo de visión-lenguaje-acción de Google DeepMind que admite la ejecución local en un robot. El modelo es capaz de realizar tareas fuera de línea, completando acciones finas basadas en comandos de lenguaje natural, como doblar ropa y tirar de bolsas abiertas....

Últimos recursos sobre IA

hace 1 año

056.6K

Qwen3-Omni - 阿里通义推出的全模态AI模型

Qwen3-Omni - Modelo de IA omnimodal presentado por Ali Tongyi

Qwen3-Omni es un modelo de IA totalmente modal presentado por el equipo de Ali Tongyi que puede manejar múltiples tipos de datos, como texto, imágenes, audio y vídeo, y admite la interacción con texto en 119 idiomas con baja latencia y alta controlabilidad.

Últimos recursos sobre IA

hace 10 meses

056.6K

FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - Modelo de generación y edición de imágenes de la Selva Negra

FLUX.1 Kontext es un modelo de generación y edición de imágenes de Black Forest Labs que proporciona técnicas de procesamiento de imágenes conscientes del contexto. El modelo entiende las respuestas a las señales de texto e imagen, realiza tareas como la modificación de objetos, la conversión de estilos y la sustitución del fondo, manteniendo la esquina...

Últimos recursos sobre IA

hace 1 año

056.6K

混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

Mixed World Model 1.5 - Marco de generación de modelos del mundo en tiempo real de código abierto Tencent Mixed

Hybrid World Model 1.5 (Tencent HY WorldPlay) es el primer marco de modelo mundial en tiempo real de código abierto de la industria lanzado por Tencent, que cubre la cadena completa de despliegue de datos, formación e inferencia de streaming. El núcleo es el modelo de difusión autorregresiva WorldPlay, que utiliza...

Últimos recursos sobre IA

hace 8 meses

056.5K

VTP - MiniMax海螺视频团队开源的视觉生成模型技术

VTP - La tecnología de modelado generativo visual de código abierto del equipo de vídeo MiniMax Conch

VTP (Visual Tokenizer Pre-training) es una tecnología clave para modelos generativos visuales propuesta por el equipo de MiniMax Conch Video para mejorar el rendimiento del sistema generativo mejorando el método de preentrenamiento del tokenizador visual (tokenizer). El método tradicional...

Últimos recursos sobre IA

hace 7 meses

056.5K

Más información