Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
DeepSeek 发布了 v3 模型的首个开源版本,现阶段拥有(国产)最强代码能力

DeepSeek publica la primera versión de código abierto de su modelo v3, ahora con la mayor capacidad de código (en China)

DeepSeek-V3 es un potente modelo lingüístico de Mezcla de Expertos (MoE) con 671.000 millones de parámetros totales y 3.700 millones de parámetros activados para cada token. El modelo emplea una innovadora atención potencial multicabezal (Mu...
hace 1 año
079.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de lenguaje visual inteligente de código abierto de Smart Spectrum para la automatización de interfaces gráficas

Introducción CogAgent es un modelo de lenguaje visual de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), cuyo objetivo es automatizar el funcionamiento de la interfaz gráfica de usuario (GUI) en todas las plataformas. El modelo se basa en CogVLM (GLM-4V-9B) y es compatible con el chino y el inglés bilingües....
hace 1 año
065.3K
达摩院“寻光”视频创作平台全面评测

Plataforma de creación de vídeo "Searchlight" del Instituto Dharma Reseña completa

Hoy temprano, recibí una notificación de que mi solicitud para pruebas internas de "Searchlight" fue aprobada, así que publicaré una breve reseña antes de irme a la cama. La plataforma se posiciona como la "plataforma de aplicaciones de capacidad de tecnología visual" del Instituto Dharma, y actualmente hay menos aplicaciones (en comparación con el lanzamiento), esperando abrir gradualmente más aplicaciones visuales. La búsqueda de la luz se divide en dos direcciones: https...
hace 1 año
043.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: generación de vídeos con control preciso de la postura humana, creación de bailarinas

Introducción general DisPose es un innovador proyecto de inteligencia artificial de código abierto centrado en la generación controlada de animación de imágenes de personajes. Desarrollado por un equipo de investigadores y de código abierto en GitHub, el proyecto utiliza técnicas avanzadas de aprendizaje profundo para lograr un control preciso de la animación de personajes mediante la descomposición de la información de pose esquelética.D...
hace 1 año
054.6K
Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Smolagents: proyecto de código abierto para el desarrollo rápido de inteligencias de IA y la construcción ligera de inteligencias

Introducción completa Smolagents es una biblioteca ligera de agentes inteligentes desarrollada por HuggingFace que se centra en simplificar el proceso de desarrollo de sistemas de agentes de IA. El proyecto es conocido por su simplicidad en la filosofía de diseño, con sólo alrededor de 1000 líneas de código del núcleo, sin embargo, proporciona potentes capacidades de integración de características. Es más ...
hace 1 año
087.6K
通过视觉提取文档为Markdown格式文档的组合提示词指令

Comandos combinados cue word para extraer visualmente documentos en formato Markdown

Este comando proviene del proyecto Vision Parse y extrae documentos markdown en dos pasos. Pregunta de análisis de imagen (img_analysis.prompt): Analiza esta imagen y...
hace 1 año
046.5K
Napkin AI 中文入门指南

Guía de iniciación a la Inteligencia Artificial china

¿Cómo empezar a generar contenidos visuales con Napkin AI? (Creación de cuentas, generación visual, exportación a archivos pdf o de imagen...) Bienvenido a Napkin AI, una herramienta que facilita la conversión de su texto en bellos elementos visuales. Esta guía le...
hace 1 año
056.1K
Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Vision Parse: conversión inteligente de documentos PDF al formato Markdown mediante modelos de lenguaje visual

Introducción completa Vision Parse es una revolucionaria herramienta de procesamiento de documentos, que combina inteligentemente la tecnología más avanzada de modelos de lenguaje visual (Vision Language Models), la capacidad de convertir inteligentemente documentos PDF a formato Markdown de alta calidad...
hace 1 año
056.3K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Proyecto de superresolución de imágenes de código abierto para mejorar la calidad de la resolución de imágenes.

Introducción general InvSR es un innovador proyecto de código abierto de superresolución de imágenes basado en técnicas de inversión de la difusión capaces de convertir imágenes de baja resolución en imágenes de alta calidad y alta resolución. El proyecto explota el rico conocimiento previo de la imagen incrustado en modelos de difusión a gran escala preentrenados y, mediante un mecanismo de muestreo flexible, admite...
hace 1 año
071.1K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 1 año
064.4K