Lista de herramientas de IA destacadas | Página 5 | AI Sharing Circle

超人工智能 ASI（Artificial Super Intelligence）是什么，一文看懂

Superinteligencia Artificial (ASI) ¿Qué es la ASI (Superinteligencia Artificial) en un artículo?

La Superinteligencia Artificial (SIA) es un sistema inteligente que supera la inteligencia humana, con capacidades que superan las de los humanos en todos los ámbitos, incluidos la cognición, la creatividad, la resolución de problemas y la toma de decisiones.

hace 7 meses

050.3K

迁移学习（Transfer Learning）是什么，一文看懂

El Aprendizaje por Transferencia (Transfer Learning) es qué, un artículo para leer y entender

El aprendizaje por transferencia (TL) es una rama importante en el campo del aprendizaje automático, la idea central es aplicar el conocimiento aprendido de una tarea o dominio a otra tarea o dominio relacionado pero diferente.

hace 7 meses

036.6K

HuMo - 清华大学联合字节开源的多模态视频生成框架

HuMo - Marco de generación de vídeo multimodal de código abierto United Bytes de la Universidad de Tsinghua

HuMo es un marco de generación de vídeo multimodal de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y ByteDance Intelligent Creation Lab, que se centra en la generación de vídeo centrada en el ser humano. Puede generar vídeos humanos de alta calidad, precisos y controlables a partir de entradas multimodales como texto, imágenes y audio.

Últimos recursos sobre IA

hace 7 meses

0119.8K

AnyI2V - 复旦联合阿里达摩院等开源的智能图像动画生成框架

AnyI2V - Fudan y Ali Dharma Institute y otro marco de generación de animación de imágenes inteligente de código abierto

AnyI2V es un marco de generación de animaciones de imágenes lanzado conjuntamente por la Universidad de Fudan, Alibaba Darmo Academy y otras entidades, que permite convertir imágenes condicionales estáticas (por ejemplo, cuadrículas, nubes de puntos, etc.) en vídeos dinámicos sin necesidad de un complejo proceso de formación y una gran cantidad de datos.

Últimos recursos sobre IA

hace 7 meses

034.5K

SRPO - 腾讯混元推出的文本到图像生成模型

SRPO - Modelo de generación de texto a imagen lanzado por Tencent Hybrid

SRPO (Semantic Relative Preference Optimization) es un modelo de generación de texto a imagen introducido por Tencent Mixed Meta, que optimiza el mecanismo de recompensa a través de señales condicionales textuales para lograr el ajuste en línea de las recompensas y reducir la dependencia del ajuste fuera de línea.

Últimos recursos sobre IA

hace 7 meses

047.9K

Qwen3-Next - 阿里通义推出的最新基础模型

Qwen3-Next, el último modelo básico lanzado por Ali Tongyi

Qwen3-Next es un gran modelo de arquitectura híbrida de nueva generación, desarrollado por Ali Tongyi, que combina las tecnologías Gated DeltaNet y Gated Attention, lo que le permite tratar textos largos, realizar inferencias rápidas y ahorrar recursos informáticos.

Últimos recursos sobre IA

hace 7 meses

033K

文心大模型X1.1 - 百度推出的深度思考模型，理解能力更强

Wenshin Big Model X1.1 - El modelo de pensamiento profundo de Baidu para comprender mejor

Wenxin Big Model X1.1 es un modelo de pensamiento profundo lanzado por Baidu, basado en un marco híbrido de aprendizaje por refuerzo que se centra en mejorar la comprensión y la generación de lenguaje. El modelo destaca en el manejo de preguntas complejas, el seguimiento de instrucciones y la simulación del comportamiento de las inteligencias, y puede proporcionar con precisión respuestas bien fundamentadas y contenidos de texto de alta calidad.

Últimos recursos sobre IA

hace 7 meses

040.3K

混元图像2.1 - 腾讯推出的开源文生图模型

Imagen híbrida 2.1 - Modelo gráfico de proveedor de código abierto de Tencent

HunyuanImage 2.1 es el modelo gráfico de código abierto de Tencent diseñado para la generación de imágenes de alta calidad. El modelo admite resolución 2K nativa, puede renderizar con precisión escenas y detalles complejos, de modo que la expresión y el movimiento de los personajes pueden reproducirse vívidamente.

Últimos recursos sobre IA

hace 7 meses

036.5K

AntSK FileChunk - 免费的AI语义文档切片工具，动态切片调整

AntSK FileChunk - Herramienta gratuita de rebanado semántico de documentos AI, ajuste dinámico de rebanado

AntSK FileChunk es una herramienta gratuita de rebanado inteligente de documentos diseñada para aplicaciones RAG (Retrieval Augmented Generation). Semántica como núcleo, el documento será inteligentemente rebanado en segmentos semánticamente completos, coherentes, soporte para multi-idioma, ajustar dinámicamente el tamaño de la rebanada para asegurar la coherencia contextual.

Últimos recursos sobre IA

hace 7 meses

040.6K

UnifiedTTS - 一站式TTS API服务平台，实时性能监控

UnifiedTTS - Plataforma única de servicios TTS API, supervisión del rendimiento en tiempo real

UnifiedTTS es una plataforma integral de servicios de texto a voz (TTS). Admite varios idiomas, como chino, inglés, japonés y coreano, para satisfacer las necesidades de las empresas de todo el mundo. A través de una interfaz API unificada, integra muchos de los principales servicios TTS, como Micro...

Últimos recursos sobre IA

hace 7 meses

044.3K

MiniCPM 4.1 - 面壁智能推出的超高效端侧大模型

MiniCPM 4.1 - Macromodelado de extremo ultraeficiente mediante Facing Face Intelligence

MiniCPM 4.1 es un modelo de lenguaje de gran tamaño ultraeficiente introducido por Facade Intelligence. Con la arquitectura de atención dispersa InfLLM v2, cada lexema sólo necesita calcular la correlación con menos de 5% lexemas, lo que reduce significativamente la sobrecarga de procesamiento de texto largo. En el escenario de texto largo de 128K...

Últimos recursos sobre IA

hace 7 meses

035.6K

WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - Marco de código abierto de Tencent WeChat para la comprensión de documentos y la recuperación semántica

WeKnora es Tencent WeChat equipo de código abierto basado en el Modelo de Lenguaje Grande (LLM) comprensión de documentos y el marco de recuperación semántica , diseñado para la estructura de los escenarios de contenido de documentos complejos y heterogéneos y diseñado para utilizar una arquitectura modular , la integración de preprocesamiento multimodal , la indexación vectorial semántica , la recuperación inteligente y gran modelo de razonamiento generativo ...

Últimos recursos sobre IA

hace 7 meses

077.3K

XTuner V1 - 上海AI Lab开源的大模型训练引擎

XTuner V1 - Motor de entrenamiento de grandes modelos de código abierto de Shanghai AI Lab

XTuner V1 es una nueva generación de motor de entrenamiento de modelos de gran tamaño de código abierto del Laboratorio de Inteligencia Artificial de Shanghai, diseñado para el entrenamiento de modelos de Expertos Mixtos (MoE) dispersos a escala ultra grande. Desarrollado sobre la base de PyTorch FSDP, logra un alto rendimiento mediante la optimización multidimensional de la memoria, la comunicación y la carga....

Últimos recursos sobre IA

hace 7 meses

036.2K

Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型

Qwen3-ASR-Flash - una serie de modelos de reconocimiento de voz lanzados por Ali Tongyi Qianqian

Qwen3-ASR-Flash es el último modelo de reconocimiento de voz de alta precisión de Alibaba, basado en el modelo de base Qwen3, entrenado con datos multimodales masivos. Es compatible con 11 idiomas y múltiples acentos, incluidos mandarín, sichuan, minnan, wu, cantonés y otros dialectos...

Últimos recursos sobre IA

hace 7 meses

049.2K

人工智能治理（AI Governance）是什么，一文看懂

Qué es la gobernanza de la inteligencia artificial (gobernanza de la IA), en un artículo

La gobernanza de la IA es un marco integral que abarca la tecnología, la ética, el derecho y la sociedad y que orienta, gestiona y supervisa de forma eficaz todo el ciclo de vida de los sistemas de IA: desde el diseño, el desarrollo, la implantación y el uso final. El objetivo principal no es obstaculizar la innovación tecnológica, sino garantizar que el desarrollo y la aplicación de las tecnologías de IA comiencen...

hace 7 meses

044.4K

吴恩达的LangChain for LLM应用开发免费课程

Curso gratuito de LangChain para el desarrollo de aplicaciones LLM por Ernest Ng

LangChain for LLM Application Development es un curso en línea de DeepLearning.AI en el que participan el fundador de LangChain, Harrison Chase, y Andrew Ng.

Últimos recursos sobre IA Información sobre el curso

hace 7 meses

058K

吴恩达的Transformer LLMs工作原理免费课程

Curso gratuito sobre el funcionamiento de los Transformer LLM, por Enda Wu

Los LLM transformadores funcionan según el principio que DeepLearning.AI y Jay Alammar y Maarten Grootend, autores de Hands-On Large Language Models...

Últimos recursos sobre IA Información sobre el curso

hace 7 meses

051.9K

半监督学习（Semi-Supervised Learning）是什么，一文看懂

¿Qué es el aprendizaje semisupervisado (SSL) en un artículo?

El aprendizaje semisupervisado es una rama importante en el campo del aprendizaje automático, que utiliza una pequeña cantidad de datos etiquetados y una gran cantidad de datos sin etiquetar para entrenar conjuntamente un modelo con el fin de mejorar el efecto de aprendizaje y la capacidad de generalización.

hace 7 meses

042.6K

无监督学习（Unsupervised Learning）是什么，一文看懂

¿Qué es el aprendizaje no supervisado (ULS) en un artículo?

El aprendizaje no supervisado (Unsupervised Learning, ULS) es una importante rama del aprendizaje automático que se centra en el procesamiento de conjuntos de datos que no están preetiquetados.

hace 7 meses

035.3K

Seedream 4.0 - 字节推出的最新一代图像创作模型

Seedream 4.0: la última generación de modelos de creación de imágenes lanzada por Bytes

Seedream 4.0 es una herramienta avanzada de generación y edición de imágenes lanzada por ByteDance, que se centra en la integración de la generación y la edición, con potentes funciones como la edición precisa de comandos, la alta retención de funciones y la comprensión profunda de intenciones.

Últimos recursos sobre IA

hace 7 meses

080.3K

rStar2-Agent - 微软开源的高效AI推理模型

rStar2-Agent: el eficiente modelo de inferencia de IA de código abierto de Microsoft

rStar2-Agent es un modelo avanzado de razonamiento matemático de IA de código abierto de Microsoft que demuestra una gran capacidad para resolver problemas matemáticos al alcanzar una precisión de 80,61 TP3T en la prueba AIME24. El modelo está equipado con capacidades de razonamiento científico, logrando en la prueba GPQA-Diamond...

Últimos recursos sobre IA

hace 7 meses

037.5K

Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Modelo emblemático de gran lenguaje de Tongyi Qianqian

Qwen3-Max-Preview es el último gran modelo lingüístico insignia lanzado por Tongyi Qianwen. Es el modelo con el mayor número de parámetros de la familia Qwen3, con un tamaño de parámetros de más de 1 billón. El modelo presenta mejoras significativas en inferencia, seguimiento de instrucciones, soporte multilingüe y cobertura de conocimiento de cola larga...

Últimos recursos sobre IA

hace 7 meses

040.8K

OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - Modelo multimodal de código abierto para Meituan y la Universidad Jiaotong de Shanghai

OneCAT es un nuevo modelo multimodal unificado lanzado por Meituan junto con la Universidad Jiaotong de Shanghai, que adopta una arquitectura de descodificador puro que integra a la perfección la comprensión multimodal, la generación de texto a imagen y las funciones de edición de imágenes. El modelo abandona el diseño de los modelos multimodales tradicionales que dependen de codificadores y desambiguadores visuales externos mediante...

Últimos recursos sobre IA

hace 7 meses

039.2K

Claudable - 开源AI Web应用构建器，自然语言生成代码

Claudable - Constructor de aplicaciones web de IA de código abierto, código generado en lenguaje natural

Claudable es un creador de aplicaciones web de código abierto basado en Next.js que combina las capacidades avanzadas de agente de IA de Claude Code y Cursor CLI con la experiencia de creación de aplicaciones sencilla e intuitiva de Lovable...

Últimos recursos sobre IA

hace 7 meses

043.2K

FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - Hugging Face lanza un conjunto de datos de código abierto sobre el lenguaje visual

FineVision es el conjunto de datos de lenguaje visual de código abierto de Hugging Face para el entrenamiento de modelos avanzados de lenguaje visual. Contiene 17,3 millones de imágenes, 24,3 millones de muestras, 88,9 millones de rondas de diálogo y 9.500 millones de tokens de respuesta. El conjunto de datos...

Últimos recursos sobre IA

hace 7 meses

041.2K

InfinityHuman - 字节联合浙大推出的长视频数字人生成模型

InfinityHuman: un modelo de generación humana digital de vídeo largo lanzado por Bytes en colaboración con ZJU.

InfinityHuman es un modelo comercial de generación de vídeos de personajes con series de audio de larga duración lanzado conjuntamente por ByteDance y la Universidad de Zhejiang. El modelo se basa en el audio y puede generar vídeos de personajes de alta resolución, larga duración y coherencia visual.

Últimos recursos sobre IA

hace 7 meses

037.3K

Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - ¡El último modelo de Dark Side of the Moon!

Kimi K2-0905 es un modelo avanzado de IA de Dark Side of the Moon Technologies Ltd. que destaca en la asistencia a la programación, genera código de forma eficiente y favorece la generación de código ordenado y estandarizado en el desarrollo front-end. La longitud del contexto del modelo se amplía hasta 256K para gestionar tareas complejas.

Últimos recursos sobre IA

hace 7 meses

074.7K

强化学习（Reinforcement Learning）是什么，一文看懂

¿Qué es el aprendizaje por refuerzo en un artículo?

El aprendizaje por refuerzo es una rama importante del aprendizaje automático, centrada en permitir que las inteligencias aprendan de forma autónoma a tomar decisiones óptimas para maximizar las recompensas acumulativas a largo plazo mediante la interacción continua con su entorno.

hace 7 meses

036K

监督学习（Supervised Learning）是什么，一文看懂

¿Qué es el aprendizaje supervisado (SL) en un artículo?

El aprendizaje supervisado es uno de los métodos más comunes y fundamentales del aprendizaje automático. La idea central es enseñar a un modelo informático a hacer predicciones o juicios utilizando un conjunto de datos existente con la "respuesta correcta".

hace 7 meses

038.2K

深度学习（Deep Learning）是什么，一文看懂

El aprendizaje profundo (Deep Learning) es qué, un artículo para entender

El aprendizaje profundo (AD) es una rama del aprendizaje automático que se centra en el uso de redes neuronales artificiales multicapa para aprender y representar patrones complejos en los datos.

hace 7 meses

039.2K

HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager - Modelo mundial de itinerancia ultralarga de código abierto de Tencent

HunyuanWorld-Voyager (abreviado Hunyuan Voyager) es el primer modelo de mundo itinerante ultralargo de la industria lanzado por Tencent que admite la reconstrucción nativa en 3D. Se trata de un novedoso marco de difusión de vídeo que genera secuencias de nubes de puntos 3D de trayectorias de cámara definidas por el usuario a partir de una sola imagen,...

Últimos recursos sobre IA

hace 7 meses

040.3K

Hunyuan-MT-7B - 腾讯混元开源的轻量级翻译模型

Hunyuan-MT-7B - Modelo de traducción ligera de código abierto Tencent Mixed Meta

Hunyuan-MT-7B es un modelo de traducción ligero introducido por el Mixed Meta Team de Tencent, con 7.000 millones de referencias, que admite la traducción mutua de 33 idiomas y 5 lenguas/dialectos del chino popular, incluidos el cantonés, el uigur y el tibetano. En el concurso WMT2025 de la Asociación Internacional de Lingüística Computacional (ACL)...

Últimos recursos sobre IA

hace 7 meses

037.4K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Macromodelado del habla de código abierto Step-Star

Step-Audio 2 mini es un macromodelo del habla integral de código abierto de Step-Audio. Rompe con la estructura tradicional del modelo del habla y adopta una verdadera arquitectura multimodal de extremo a extremo, que transforma directamente la entrada de audio sin procesar en salida de respuesta del habla, con menor latencia, y comprende la información paralingüística y las señales no vocales.

Últimos recursos sobre IA

hace 7 meses

046.3K

MobileCLIP2 - 苹果公司开源的高效端侧多模态模型

MobileCLIP2: el eficiente modelo multimodal de código abierto de Apple

MobileCLIP2 es una versión mejorada de MobileCLIP, un eficiente modelo multimodal de extremo introducido por investigadores de Apple. Optimizado para el entrenamiento de refuerzo multimodal, integra el modelo de profesor CLIP mediante el entrenamiento de un mejor rendimiento en el conjunto de datos DFN y la mejora de la generat...

Últimos recursos sobre IA

hace 7 meses

050.1K

InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5 - Modelos grandes multimodales de código abierto de Shanghai AI Lab

InternVL3.5 (Shusheng-Wanxiang 3.5) es un gran modelo multimodal de código abierto del Laboratorio de Inteligencia Artificial de Shanghai, el modelo está totalmente actualizado en términos de capacidad general, capacidad de razonamiento y eficiencia de despliegue, proporcionando nueve tamaños de versiones de 1.000 millones a 241.000 millones de parámetros, cubriendo diferentes escenarios de demanda de recursos,...

Últimos recursos sobre IA

hace 7 meses

048.7K

FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Modelado de lenguaje visual de Apple

FastVLM (Fast Vision Language Model) es un eficiente modelo de lenguaje visual introducido por Apple. Con el codificador visual híbrido FastViTHD como núcleo, incorpora arquitecturas convolucionales y Transformer para reducir significativamente los...

Últimos recursos sobre IA

hace 7 meses

046.3K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - Conjunto de evaluación de código abierto Meeseeks para evaluar la capacidad de seguir instrucciones de modelos.

Meeseeks es un conjunto de evaluación de grandes modelos de código abierto utilizado por el equipo M17 de Meituan para evaluar la capacidad de un modelo para seguir instrucciones.Meeseeks utiliza un marco de evaluación de tres niveles para medir de forma exhaustiva si un modelo es capaz de generar respuestas en estricta conformidad con las instrucciones del usuario desde el nivel macro al micro, y no evalúa el conocimiento del contenido de la respuesta como...

Últimos recursos sobre IA

hace 7 meses

041.1K

gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - El último modelo de voz con IA de OpenAI

gpt-realtime es un modelo avanzado de habla de OpenAI que admite el procesamiento directo del audio para generar un habla natural y fluida. El modelo admite varios idiomas y estilos, entiende señales no verbales como la risa y puede cambiar de idioma.

Últimos recursos sobre IA

hace 7 meses

042.7K

Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent - Marco de código abierto de Tencent para cuerpos inteligentes eficientes

Youtu-agent es un marco de código abierto para construir y ejecutar inteligencias autónomas de Tencent Youtu Labs. El marco obtiene buenos resultados en las pruebas comparativas WebWalkerQA y GAIA, con una precisión de 71,47% y 72,8% respectivamente.El marco...

Últimos recursos sobre IA

hace 7 meses

052.6K

HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley - Modelo de generación de sonido de vídeo de código abierto de Tencent

HunyuanVideo-Foley es un modelo de generación de sonido de vídeo de código abierto del equipo Tencent Mixed Yuan que permite añadir efectos de sonido adaptados con precisión a los vídeos silenciosos. El modelo se basa en un conjunto de datos a gran escala de formación , con una arquitectura de convertidor de difusión multimodal , combinado con la representación de la función de pérdida de alineación y técnicas de optimización de audio VAE....

Últimos recursos sobre IA

hace 7 meses

052K

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - Aishi Technologies lanza un modelo de vídeo con inteligencia artificial de desarrollo propio

PixVerse V5 es un gran modelo de generación de vídeo por IA lanzado por Aishi Technology. El modelo puede generar contenidos de vídeo de alta calidad a partir de descripciones de texto o imágenes introducidas por el usuario, y admite diversos estilos, como anime, ciencia ficción y estilo nacional.

Últimos recursos sobre IA

hace 7 meses

046.2K

问小白5 - 问小白推出的全能AI模型

Ask White 5 - Modelo AI todo en uno de Ask White

Ask White 5 es el modelo insignia "Todo en uno" con un nivel de inteligencia muy alto. El modelo obtiene buenos resultados en muchas evaluaciones, como la puntuación de evaluación compuesta AA-Index de 64,7 y la puntuación de evaluación de la capacidad STEM de 86, que se acerca a la del líder mundial GPT-5.

Últimos recursos sobre IA

hace 7 meses

042.1K

MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - Modelo multimodal facetado inteligente de código abierto de 8B parámetros

MiniCPM-V 4.5 es un modelo paramétrico multimodal 8B de código abierto para Inteligencia de Fachadas, construido en base a Qwen3-8B y SigLIP2-400M, con capacidad para procesar eficientemente imágenes y vídeos. Tiene un excelente rendimiento en el consumo de tokens visuales, procesamiento ...

Últimos recursos sobre IA

hace 7 meses

052.4K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - El modelo de generación y edición de imágenes más potente de Google

Gemini 2.5 Flash Image (nombre en clave nano banana) es un modelo de generación y edición de imágenes de última generación de Google que mantiene la coherencia de los caracteres en todas las escenas y admite la edición precisa de imágenes mediante lenguaje natural, como el desenfoque de fondos y la eliminación de manchas.

Últimos recursos sobre IA

hace 7 meses

043.8K

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - Modelo de generación de vídeo basado en audio de código abierto Ali Tongyi

Wan2.2-S2V es un modelo de generación de vídeo multimodal de código abierto de Ali Tongyi , sólo una imagen estática y un fragmento de audio , puede generar vídeo humano digital de alta calidad , y soporta una variedad de tipos de imagen y marco .

Últimos recursos sobre IA

hace 7 meses

044.7K

吴恩达面向开发者的ChatGPT提示工程免费课程

Curso gratuito sobre ingeniería de consejos ChatGPT para desarrolladores por Ernest Ng

ChatGPT Tip Engineering for Developers es un curso conjunto de DeepLearning.AI y OpenAI diseñado para desarrolladores, que cuenta con Isa Fulford, Andrew Ng para enseñar a utilizar Large Language Models (LLM...

Últimos recursos sobre IA Información sobre el curso

hace 7 meses

046.8K

问小白o4 - 问小白推出的并行思考模型，同时开启8条思考路径

Ask o4 - Un modelo de pensamiento paralelo introducido por Ask o4 que abre 8 vías de pensamiento al mismo tiempo

Ask White o4 es un innovador modelo de pensamiento paralelo que abre 8 vías de pensamiento al mismo tiempo, analiza el problema desde múltiples perspectivas y filtra automáticamente la solución óptima. El modelo incorpora técnicas avanzadas de aprendizaje por refuerzo Long-CoT y aprendizaje por recompensa de procesos, tiene potentes capacidades de razonamiento profundo y rinde bien en tareas complejas.

Últimos recursos sobre IA

hace 7 meses

037.4K

VibeVoice - 微软推出的文本到语音模型

VibeVoice - Modelado de texto a voz de Microsoft

VibeVoice es un nuevo modelo de conversión de texto a voz (TTS) de Microsoft. Este modelo genera audio conversacional a partir de hasta cuatro altavoces diferentes y admite hasta 90 minutos de emisión continua de voz, con lo que rompe las limitaciones de duración de los sistemas TTS tradicionales.

Últimos recursos sobre IA

hace 7 meses

065K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Modelos de generación de escenas 3D de código abierto de Qunar Technologies

SpatialGen es un modelo de generación de escenas 3D de código abierto de Qunar Technology, basado en la arquitectura del modelo de difusión, que admite la generación de imágenes multivista coherentes espaciotemporalmente a partir de descripciones textuales, imágenes de referencia y disposición espacial 3D, y que además genera escenas gaussianas 3D y renderiza vídeos itinerantes.

Últimos recursos sobre IA

hace 7 meses

043.2K

EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - Modelo de generación de animación humana digital multimodal de código abierto Ant

EchoMimicV3 es un modelo multimodal de generación de vídeo humano digital lanzado por Ant Group, con 1.300 millones de parámetros, capaz de manejar múltiples entradas como audio, texto e imágenes para generar animaciones humanas digitales de alta calidad.

Últimos recursos sobre IA

hace 7 meses

042.7K

人工智能伦理（AI Ethics）是什么，一文看懂

¿Qué es la ética de la IA, en un artículo?

La Ética de la Inteligencia Artificial (Ética de la IA) es un campo interdisciplinar que examina los principios éticos, los valores y las responsabilidades sociales que deben seguirse en el desarrollo, despliegue y uso de los sistemas de IA.

hace 7 meses

040.5K

AI论文写作工具有哪些？推荐15个免费AI学术论文助手

¿Cuáles son las mejores herramientas de AI para escribir ensayos? 15 Asistentes gratuitos recomendados para ensayos académicos con IA

En la era del auge de la Inteligencia Artificial, las herramientas de IA han cambiado nuestras vidas y han sido de gran ayuda para la investigación académica y la redacción de trabajos. Con el fin de ayudar a los usuarios a trabajar y estudiar de manera más eficiente, esta compilación selecciona cuidadosamente y presenta 15 asistentes gratuitos de vanguardia para la redacción de trabajos académicos.

hace 7 meses

047.3K

Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR: una nueva generación de modelos de reconocimiento del habla lanzada conjuntamente por Nail y Tongyi

Fun-ASR es un gran modelo de reconocimiento de voz lanzado conjuntamente por Nail y Tongyi Labs. El modelo se ha entrenado con datos de audio masivos y puede identificar con precisión terminología multisectorial, como Internet, tecnología, decoración del hogar, etc., mejorando significativamente la precisión del reconocimiento. El modelo se combina con la información empresarial de Nail para optimizar la inferencia y reducir el problema de las...

Últimos recursos sobre IA

hace 7 meses

065.7K

Squibler - AI小说辅助写作平台，助力构思到创作全过程

Squibler: plataforma de escritura asistida por inteligencia artificial que impulsa todo el proceso, desde la idea hasta la creación.

Squibler es una potente plataforma de escritura asistida por IA diseñada para escritores que ayuda a los usuarios en todo el proceso, desde la concepción a la creación y la publicación. La plataforma ofrece diversas plantillas de historias que abarcan novelas, guiones, relatos cortos, etc. Los usuarios solo tienen que introducir el concepto inicial, y la IA puede generar esquemas, personajes, escenas...

Últimos recursos sobre IA

hace 7 meses

045.9K

91写作 - 开源的AI智能小说创作平台

91Writing - Plataforma de creación de novelas inteligentes con IA de código abierto

91Writing es una herramienta de creación de novelas de IA totalmente de código abierto, desarrollada en base a Vue 3 y Element Plus, que integra una variedad de modelos avanzados de IA, como GPT, Claude, Gemini, etc. La herramienta proporciona a los creadores una completa cadena de herramientas de creación, desde la idea hasta el texto, incluyendo la creación de proyectos...

Últimos recursos sobre IA

hace 7 meses

046.6K

Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization, una plataforma de simulación social multiagente lanzada por la HKUST

Aivilization es la primera plataforma de simulación social de cuerpos multiinteligentes de IA del mundo, desarrollada por la Universidad de Ciencia y Tecnología de Hong Kong. Construye una caja de arena digital visual donde los usuarios pueden crear y guiar a miles de inteligencias IA para observar la evolución social de la futura coexistencia entre humanos e IA. La plataforma admite...

Últimos recursos sobre IA

hace 7 meses

081.6K

弱人工智能（Narrow AI）是什么，一文看懂

Qué es la IA débil (IA estrecha), en un artículo

La Inteligencia Artificial Débil (IA Estrecha) es actualmente la forma dominante de desarrollo de tecnología de IA en nuestro mundo real. La IA débil está diseñada y entrenada para realizar una tarea específica y bien definida con un nivel de inteligencia que puede superar al de los humanos en ese dominio concreto.

hace 7 meses

045.5K

Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - El modelo de IA de código abierto xAI de Musk

Grok 2.5 es un modelo de IA de código abierto de la xAI de Elon Musk. Con 269.000 millones de parámetros, se basa en la arquitectura Mixed Expertise (MoE) para un rendimiento y una inferencia potentes. El modelo se ha probado con conocimientos científicos de nivel universitario (GPQA), conocimientos de uso general (MMLU, MM...

Últimos recursos sobre IA

hace 7 meses

047.2K

Draw A Fish - 免费的在线AI画鱼网站，共享虚拟鱼缸

Draw A Fish - sitio de dibujo de peces en línea gratis con peceras virtuales compartidas

Draw A Fish es un sencillo y divertido sitio de dibujo de peces en línea en el que los usuarios pueden dibujar peces para colocarlos en una pecera virtual compartida globalmente.

Últimos recursos sobre IA

hace 8 meses

066.7K

MIT最新报告《生成式AI鸿沟：2025年商业人工智能现状》

El nuevo informe del MIT, The Generative AI Divide: the State of Business Artificial Intelligence in 2025 (La brecha de la inteligencia artificial generativa: el estado de la inteligencia artificial empresarial en 2025)

El último informe del MIT, The Generative AI Divide: the State of Business AI in 2025, revela el núcleo del proceso de adopción de la IA generativa (GenAI) que están experimentando las empresas mediante una investigación en profundidad de más de 300 proyectos de IA, entrevistas con 52 organizaciones y una encuesta a 153 ejecutivos....

Últimos recursos sobre IA Información sobre el curso

hace 8 meses

080.1K

AutoClip - 开源的AI视频切片工具，一键生成专题视频合集

AutoClip - Herramienta de código abierto para generar colecciones de vídeos temáticos con un solo clic.

AutoClip es de código abierto AI herramienta de edición de vídeo, basado en la tecnología de IA avanzada para lograr el proceso completo de procesamiento automatizado de vídeo. Las herramientas pueden identificar automáticamente los aspectos más destacados del vídeo, la extracción precisa de contenido valioso, se puede basar en la similitud del tema de la agrupación inteligente, para generar una colección de contenido.AutoClip apoyo...

Últimos recursos sobre IA

hace 8 meses

063.1K

《动手学AI：人工智能通识与实践》 - 阿里云推出的免费AI通识课程

Hands-On AI: Inteligencia Artificial Conocimientos Generales y Práctica - Curso gratuito de AI Conocimientos Generales por AliCloud

Hands-On Learning AI: Artificial Intelligence General Knowledge and Practice" de AliCloud, en colaboración con Superstar Erlang, es un curso de aprendizaje sistemático sobre IA para alumnos de diferentes ámbitos profesionales. El curso está impartido por profesores de cinco de las mejores universidades y es exhaustivo, ya que construye un cuerpo completo de conocimientos desde la historia del desarrollo de la IA, las tecnologías básicas hasta la seguridad ética...

Información sobre el curso

hace 8 meses

043.9K

ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - Herramienta de animación de IA generativa de código abierto de Tencent

ToonComposer es una herramienta de animación generativa por IA lanzada conjuntamente por la Universidad China de Hong Kong, Tencent PCG ARC Lab y la Universidad de Pekín. Gracias a la tecnología generativa de fotogramas clave posteriores, el proceso de generación de fotogramas intermedios y de coloreado se integra en un proceso automatizado que solo requiere un boceto y...

Últimos recursos sobre IA

hace 8 meses

053.3K

Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Un nuevo modelo de IA de código abierto del equipo de Wordpress

Seed-OSS es una familia de grandes modelos lingüísticos de código abierto del equipo Byte Jump Seed, centrada en tareas de razonamiento y textos largos. El modelo tiene un buen rendimiento en el razonamiento lógico complejo y el razonamiento en varios pasos con una gran precisión y puede resolver problemas difíciles de forma eficiente.Seed-OSS admite contextos de texto largo de hasta 512K....

Últimos recursos sobre IA

hace 8 meses

050.2K

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Modelo científico multimodal ligero de código abierto de Shanghai AI Lab

Intern-S1-mini es un macromodelo científico multimodal ligero con una escala de parámetros de 8B lanzado por el Laboratorio de Inteligencia Artificial de Shanghai (SAL).Hereda las potentes capacidades de Intern-S1, combinando tanto capacidades de propósito general como científicas especializadas, y es adecuado para un despliegue rápido y un desarrollo secundario. En términos de rendimiento, I...

Últimos recursos sobre IA

hace 8 meses

043.8K

人工智能 AI（Artificial Intelligence）是什么，一文看懂

Inteligencia Artificial ¿Qué es la IA (Inteligencia Artificial) en un artículo?

La Inteligencia Artificial (IA) es una rama fundamental de las ciencias de la computación cuyo objetivo es construir sistemas teóricos y tecnológicos que puedan simular, ampliar e incluso superar la inteligencia humana, de modo que las máquinas tengan la capacidad de aprender, razonar, percibir y tomar decisiones que normalmente requieren la inteligencia humana para...

hace 7 meses

057.6K

Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - Modelo de edición de imágenes con inteligencia artificial de Google

Nano Banana es el nombre en clave de Gemini 2.5 Flash Image para Gemini, un modelo de generación y edición de imágenes AI de Google que genera imágenes detalladas y fotorrealistas basadas en simples indicaciones de texto para realizar modificaciones de alta calidad en imágenes existentes.

Últimos recursos sobre IA

hace 7 meses

069.7K

Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - El nuevo modelo de razonamiento presentado por Racer

Klear-Reasoner es un modelo de inferencia de alto rendimiento de Racer, basado en Qwen3-8B-Base. El modelo se entrena mediante ajuste fino supervisado en cadena de pensamiento largo y aprendizaje por refuerzo para obtener buenos resultados en razonamiento matemático y de código.Klear-Reasoner...

Últimos recursos sobre IA

hace 8 meses

040.2K

CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - El eficiente modelo VLA de Amoy Group

CombatVLA es un innovador modelo 3D específico para juegos de rol de acción (ARPG) del equipo Future Life Lab del grupo Amoy.CombatVLA es un modelo de visión-lingüística-acción (VLA), construido a escala paramétrica 3B, que recoge la información del jugador humano a través del rastreador de movimiento....

Últimos recursos sobre IA

hace 8 meses

044.3K

DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - El último modelo de IA de código abierto de DeepSeek

DeepSeek V3.1 es una nueva generación de modelos de inteligencia artificial presentada por DeepSeek, con importantes mejoras basadas en su predecesora, la V3. DeepSeek V3.1 introduce una arquitectura de razonamiento híbrida que permite al modelo alternar con flexibilidad entre los modos de pensamiento y no pensamiento, mejorando significativamente la...

Últimos recursos sobre IA

hace 8 meses

047.2K

Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Modelo de edición de imágenes de código abierto Ali Tongyi

Qwen-Image-Edit es un modelo de edición de imágenes polivalente introducido por Ali Tongyi, basado en la arquitectura Qwen-Image con 20.000 millones de parámetros. El modelo combina capacidades de edición semántica y de apariencia, y puede realizar ediciones de apariencia visual de bajo nivel en imágenes (por ejemplo, añadir, eliminar...

Últimos recursos sobre IA

hace 8 meses

044.6K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS: el último marco de generación de voz de KunlunWei

MoE-TTS es un marco de síntesis del habla introducido por KunlunWanwei, basado en la arquitectura Mixed Expert (MoE), que combina Large Language Models (LLMs) preentrenados con módulos expertos del habla.MoE-TTS conserva el potente razonamiento textual congelando los parámetros del módulo textual y actualizando sólo los parámetros del módulo del habla....

Últimos recursos sobre IA

hace 8 meses

043.8K

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner: la plataforma robótica de código abierto de uso general de Jiyuan con Beihang y otras entidades

Genie Envisioner (GE) es una plataforma unificada para operaciones robóticas desarrollada por el equipo de Genie Robotics en colaboración con la Universidad Nacional de Singapur, la Universidad de Aeronáutica y Astronáutica de Pekín y otras instituciones. Permite a los robots comprender y realizar mejor las tareas "imaginando primero y actuando después".

Últimos recursos sobre IA

hace 8 meses

044.8K

DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Modelo base de visión autosupervisada de próxima generación de Meta AI

DINOv3 es un modelo base de visión autosupervisada de próxima generación de Meta AI que utiliza un paradigma de aprendizaje autosupervisado para aprender características de imágenes sin datos de etiquetado. Resuelve el problema de la degradación de características mejorando la preparación de los datos e introduciendo el anclaje Gram, y mejora la generalización....

Últimos recursos sobre IA

hace 8 meses

054.9K

Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - Modelos avanzados de creación musical por IA de Quintessence

Mureka V7.5 es un modelo de generación musical de IA de última generación de Kunlun World Wide, centrado en la composición de canciones chinas. El modelo reproduce con precisión el timbre y las técnicas de interpretación para generar voces naturales, suaves y emotivas. Basado en la tecnología optimizada de reconocimiento automático del habla (ASR), Mureka V...

Últimos recursos sobre IA

hace 8 meses

044.2K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - Una versión mejorada de la Inteligencia de Investigación Profunda de Kunlun

Skywork Deep Research Agent v2 es un organismo inteligente de investigación profunda lanzado por Kunlun Wave, centrado en la integración y el análisis de información multimodal.Skywork Deep Research Agent v2 puede procesar texto, gráficos...

Últimos recursos sobre IA

hace 8 meses

043.6K

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Marco de código abierto de Tencent Hunyuan para generar vídeo interactivo para juegos de nueva generación.

Hunyuan-GameCraft es el marco de generación de vídeo de juegos interactivos de código abierto del equipo Tencent Hunyuan. Marco de una sola imagen y le pide que genere vídeo de juego altamente dinámico , apoyar al usuario a través del teclado y el ratón para controlar el contenido de vídeo en tiempo real .

Últimos recursos sobre IA

hace 8 meses

047.6K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - Modelado multimodal eficiente de código abierto por KunlunWanwei

Skywork UniPic 2.0 es un eficiente modelo multimodal de código abierto de Quintessence, centrado en la generación, edición y comprensión de imágenes. El modelo se basa en una arquitectura SD3.5-Medium de 2B parámetros, y se realiza mediante pre-entrenamiento, estrategia de refuerzo progresivo de doble tarea y co-entrenamiento....

Últimos recursos sobre IA

hace 8 meses

044.8K

RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - Primer protocolo de contexto robótico de código abierto del Instituto Ali Dharma

RynnRCP es un protocolo de contexto robótico (RCP, Robot Context Protocol) de código abierto del Instituto Ali Dharma que reduce el umbral para el desarrollo de la inteligencia incorporada y abre todo el proceso de desarrollo.

Últimos recursos sobre IA

hace 8 meses

049.7K

RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - El modelo de comprensión del mundo de código abierto del Instituto Ali Dharma

RynnEC es un modelo de comprensión del mundo presentado por el Instituto Dharma de Alibaba, centrado en tareas de inteligencia incorporada. El modelo se basa en una tecnología de fusión multimodal que combina datos de vídeo y lenguaje natural, y puede analizar objetos de una escena desde múltiples dimensiones, lo que permite funciones como la comprensión de objetos, la percepción espacial y la segmentación de objetivos de vídeo.

Últimos recursos sobre IA

hace 8 meses

050.2K

Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - Marco de generación de mundos 3D de código abierto para todo el mundo Kunlun

Matrix-3D es un framework de código abierto del equipo Skywork AI, centrado en la generación de mundos 3D panorámicos explorables. El marco combina técnicas de generación de vídeo panorámico y reconstrucción 3D para generar mundos 3D explorables omnidireccionales de alta calidad a partir de una sola imagen o...

Últimos recursos sobre IA

hace 8 meses

051.3K

GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Modelo de razonamiento visual multimodal de código abierto de Smart Spectrum

GLM-4.5V es el modelo de inferencia visual de código abierto líder mundial presentado por Smart Spectrum, con 106.000 millones de parámetros totales y 12.000 millones de parámetros activados. El modelo se entrena a partir del modelo base de texto de nueva generación GLM-4.5-Air, con potentes capacidades de comprensión y razonamiento visual, capaz de manejar imágenes, vídeo...

Últimos recursos sobre IA

hace 8 meses

050.3K

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 - Modelo de mundo interactivo desarrollado por KunlunWei

Matrix-Game 2.0 es un modelo de mundo interactivo desarrollado por Kunlun SkyWork AI. Matrix-Game 2.0 es el primer modelo de generación interactiva de secuencias largas, en tiempo real y de código abierto de la industria para escenarios de uso general, capaz de funcionar a 25 FPS en múltiples...

Últimos recursos sobre IA

hace 8 meses

050.2K

Baichuan-M2 - 百川智能推出开源的医疗增强大模型

Baichuan-M2 - Baichuan Intelligence lanza un gran modelo mejorado de código abierto para la sanidad

Baichuan-M2 es un macromodelo médico aumentado de código abierto lanzado por Baichuan Intelligence. Tiene un buen rendimiento en el ámbito médico, especialmente en la revisión de HealthBench con una puntuación de 60,1, superando al gpt-oss120b de OpenAI y a muchos otros modelos de código abierto, y convirtiéndose en un...

Últimos recursos sobre IA

hace 8 meses

050.5K

Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Un modelo lingüístico de alto rendimiento y bajo coste de Tongyi Chien-quan

Qwen-Flash es un modelo lingüístico de alto rendimiento y bajo coste introducido en la serie Alibaba Tongyi Thousand Questions, diseñado para una respuesta rápida y un procesamiento eficiente de tareas sencillas. Basado en la arquitectura avanzada Mixture-of-Experts (MoE), se realiza mediante una red dispersa de expertos....

Últimos recursos sobre IA

hace 8 meses

046.4K

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - Herramienta de creación humana digital basada en audio de KunlunWangwei

SkyReels-A3 es una herramienta de creación humana digital basada en audio de Kunlun World Wide Group. SkyReels-A3 es una herramienta de creación humana digital basada en audio que puede generar contenidos de vídeo dinámicos de alta calidad a partir de entradas sencillas (por ejemplo, imágenes de retratos y voz), hacer que fotos estáticas "cobren vida" y sustituir líneas de vídeos existentes por nuevas sincronizaciones labiales que los personajes...

Últimos recursos sobre IA

hace 8 meses

041.9K

通用人工智能 AGI（Artificial General Intelligence）是什么，一文看懂

Inteligencia Artificial General (AGI) ¿Qué es la AGI (Inteligencia Artificial General) en un artículo?

La Inteligencia Artificial General (AGI) son sistemas inteligentes que pueden comprender, aprender, razonar, adaptarse y crear como los humanos o incluso más allá de ellos en cualquier tarea cognitiva.

hace 7 meses

043.4K

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - Modelo de generación de voz de MiniMax

MiniMax Speech 2.5 es un modelo avanzado de generación del habla desarrollado por el equipo MiniMax. Supone un avance significativo en el campo de la síntesis del habla, especialmente en términos de expresividad multilingüe, precisión en la reproducción del timbre y cobertura lingüística. El modelo admite 40 idiomas...

Últimos recursos sobre IA

hace 8 meses

049.1K

GPT-5 - OpenAI推出的最强语言模型，统一智能系统

GPT-5 - El modelo de lenguaje más sólido presentado por OpenAI, sistema de inteligencia unificado

GPT-5 es el último modelo de lenguaje lanzado por OpenAI con varias actualizaciones. Es un sistema de inteligencia unificada con un enrutador en tiempo real integrado que cambia automáticamente entre los modos de pensamiento eficiente y profundo en función de la complejidad del problema, lo que permite una respuesta rápida y respuestas precisas.GPT-5 tiene varias versiones, incluyendo para pu...

Últimos recursos sobre IA

hace 8 meses

046.8K

dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 - Small red book hi lab open source multimodal large model

dots.vlm1 es el primer gran modelo multimodal de código abierto de Little Red Book hi lab. Basado en NaViT, un codificador visual de 1.200 millones de parámetros entrenado desde cero, y DeepSeek V3 Large Language Model (LLM), cuenta con una potente percepción visual e...

Últimos recursos sobre IA

hace 8 meses

045.8K

Genie 3 - 谷歌推出的通用世界模型

Genie 3 - El modelo universal del mundo de Google

Genie 3 es una nueva generación de modelos de mundo universales de Google DeepMind que permiten generar mundos virtuales muy dinámicos y coherentes en tiempo real.Genie 3 simula fenómenos físicos, ecosistemas naturales y admite la creación de escenarios fantásticos e históricos. Con indicaciones de texto, los usuarios pueden...

Últimos recursos sobre IA

hace 8 meses

044.9K

Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - El modelo de programación más potente de Anthropic

Claude Opus 4.1 es un modelo de lenguaje a gran escala de última generación de Anthropic, diseñado para el procesamiento eficiente de tareas complejas. El modelo destaca en el ámbito de la programación, generando código de alta calidad, soportando hasta 32k de salida única y adaptándose a una amplia gama de estilos de programación....

Últimos recursos sobre IA

hace 8 meses

044.6K

gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss - una familia de modelos de inferencia de código abierto de OpenAI

gpt-oss es la familia de modelos de inferencia de código abierto de OpenAI que permite soluciones de IA eficientes, flexibles y fáciles de implementar para desarrolladores. gpt-oss se presenta en dos versiones, gpt-oss-120B con 117.000 millones de parámetros y soporte para 8...

Últimos recursos sobre IA

hace 8 meses

042.6K

MiDashengLM - 小米开源的声音理解模型

MiDashengLM: el modelo de comprensión de sonido de código abierto de Xiaomi

MiDashengLM es el gran modelo de código abierto de Xiaomi para la comprensión eficaz del sonido, con la versión de parámetros específicos MiDashengLM-7B , centrada en el procesamiento y la comprensión del audio. El modelo se basa en Xiaomi Dasheng codificador de audio y Qwen2.5-Omn...

Últimos recursos sobre IA

hace 8 meses

044.6K

MOSS-TTSD - 清华实验室开源的双语对话语音生成模型

MOSS-TTSD - Modelo de código abierto para la generación de diálogos bilingües del laboratorio Tsinghua

MOSS-TTSD es un modelo de diálogo hablado de código abierto desarrollado por el Laboratorio de Habla y Lenguaje de la Universidad de Tsinghua. MOSS-TTSD puede convertir guiones de diálogo de texto en habla de diálogo natural, fluida y expresiva, y admite la generación bilingüe.

Últimos recursos sobre IA

hace 8 meses

047.7K

可解释性人工智能（Explainable AI）是什么，一文看懂

Qué es la IA explicable, en un artículo

La IA explicable (XAI) es un conjunto global de conceptos, métodos, tecnologías y marcos de gobernanza.

hace 7 meses

037.5K

AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Un modelo de generación de audio multimodal de Racer

AudioGen-Omni es un modelo de generación de audio multimodal de Racer que genera audio, voz y canciones de alta calidad a partir de entradas como vídeo, texto, etc.AudioGen-Omni se basa en técnicas avanzadas como el transformador de difusión multimodal y...

Últimos recursos sobre IA

hace 8 meses

047.1K

LangExtract - 谷歌开源的Python库，提取结构化信息

LangExtract - Biblioteca Python de código abierto de Google para extraer información estructurada

LangExtract es una biblioteca Python de código abierto de Google que utiliza grandes modelos lingüísticos (LLM) para extraer información estructurada de texto no estructurado. Con comandos definidos por el usuario y un pequeño número de ejemplos, puede identificar y organizar eficazmente detalles clave, como notas clínicas de...

Últimos recursos sobre IA

hace 8 meses

052.3K

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian lanza el modelo básico de código abierto de Qwen-Image

Qwen-Image es un modelo base de generación de imágenes de código abierto lanzado por el equipo Alibaba Tongyi Qianqian. Con 20.000 millones de parámetros, adopta la arquitectura de transformador de difusión multimodal (MMDiT), que incorpora tres módulos: comprensión multimodal, codificación de alta resolución y modelado de difusión.Qwen-Image...

Últimos recursos sobre IA

hace 8 meses

046.8K

Más información