Proyecto AI de código abierto

Total 1020 artículos
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: la herramienta de inteligencia artificial que restaura de forma inteligente las fotos antiguas amarillentas y desgastadas

Bringing Old Photos Back to Life es un proyecto de código abierto desarrollado por un equipo de investigadores de Microsoft que se centra en la restauración de fotos antiguas utilizando tecnología de IA. Se basa en un enfoque de aprendizaje profundo que puede tratar problemas graves de degradación en las fotos, como arañazos....
hace 5 meses
01.7K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 5 meses
02.7K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: el texto genera un vídeo en bucle sin interrupciones

Introducción general Mobius Diffusion es una innovadora herramienta en línea centrada en la generación de contenidos de vídeo en bucle a partir de texto. Se basa en modelos de difusión de vídeo preentrenados y no requiere entrenamiento por parte del usuario ni datos de anotación para empezar a trabajar rápidamente. La tecnología central del sitio es el ...
hace 5 meses
02.3K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: framework backend basado en SpringBoot para chat y dibujo con inteligencia artificial

Introducción completa RuoYi AI es un proyecto back-end basado en el marco ruoyi-plus , centrándose en la integración de chat AI y funciones de pintura . Es completamente de código abierto y gratuito , utilizando Java17 y SpringBoot 3.X pila de tecnología , backend de gestión ...
hace 5 meses
03.5K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

Introducción general Vision Agent es un proyecto de código abierto desarrollado por LandingAI (Team Enda Wu) y alojado en GitHub, diseñado para ayudar a los usuarios a generar rápidamente código para resolver tareas de visión por ordenador. Utiliza un marco de agentes avanzado y modelos multimodales...
hace 5 meses
02.3K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: Herramienta de IA de línea de comandos para corregir código y generar casos de prueba automáticamente

Introducción general MyCoder es un proyecto de código abierto desarrollado por el equipo drivecore y alojado en GitHub, cuyo objetivo es proporcionar a los desarrolladores asistencia de programación inteligente a través de una interfaz de línea de comandos. Se basa en la tecnología Claude AP...
hace 5 meses
02.2K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 5 meses
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastrea y resume las noticias sobre inteligencia artificial en tiempo real y las publica automáticamente en WeChat.

Introducción general ai-trend-publish es un proyecto de código abierto alojado en GitHub, desarrollado por el equipo OpenAISpace, centrado en el seguimiento y la publicación de las últimas tendencias en inteligencia artificial en tiempo real. Esta herramienta está diseñada para ayudar a desarrolladores, aficionados a la tecnología...
hace 5 meses
02.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...
hace 5 meses
02.2K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: Un sistema de archivos paralelo para mejorar la eficiencia del acceso a los datos (DeepSeek Open Source Week Day 5)

Introducción general 3FS (Fire-Flyer File System) es un sistema de archivos paralelo de código abierto desarrollado por el equipo DeepSeek, diseñado para SSDs modernos y redes RDMA, con el objetivo de mejorar drásticamente la eficiencia de acceso a los datos. Está implementado en un clúster de 180 nodos...
hace 5 meses
02.2K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo con inteligencia artificial que admite sesiones simultáneas con múltiples chats.

Introducción general DeepChat es un proyecto de asistente inteligente de código abierto desarrollado por el equipo ThinkInAIXYZ en GitHub. Su objetivo es conectar a los usuarios con el mundo digital a través de una potente tecnología de IA para proporcionar una experiencia de chat eficiente y natural. Es compatible con Win...
hace 5 meses
03.1K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 6 meses
02.6K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....
hace 2 meses
03.9K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: un asistente pedagógico inteligente que ofrece orientación personalizada sobre programación

Introducción general Coding-Tutor es un proyecto de código abierto alojado en GitHub y creado por el desarrollador iwangjian para proporcionar a los alumnos una experiencia de enseñanza de programación personalizada. Utiliza tecnología de IA conversacional para aprender basándose en los conocimientos...
hace 6 meses
02K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....
hace 6 meses
02.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: herramienta inteligente diseñada para analizar datos tabulares complejos

Introducción completa TableGPT Agent es una herramienta inteligente basada en el proyecto de código abierto GitHub, diseñada para procesar y analizar datos tabulares. Se basa en el modelo Big Language TableGPT2, que utiliza la interacción con el lenguaje natural para permitir a los usuarios consultar, manipular...
hace 6 meses
02.8K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 6 meses
02.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 6 meses
02.5K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: generación de recursos de animación de estructuras esqueléticas a partir de modelos 3D estáticos

Introducción general MagicArticulate es un marco de IA desarrollado por ByteDance en colaboración con la Universidad Tecnológica de Nanyang (NTU), que se centra en la rápida transformación de modelos 3D estáticos en activos digitales de animación. Lo hace mediante un Transformador autorregresivo avanzado y un modelo de difusión funcional, auto...
hace 6 meses
02.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 6 meses
02.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraiga la compleja estructura del contenido PDF de la herramienta de código abierto

Introducción completa PDF-Extract-Kit es un proyecto de código abierto desarrollado por el equipo OpenDataLab , centrándose en la extracción eficiente de contenido de alta calidad a partir de documentos PDF complejos y diversos . Integra tecnología avanzada de análisis sintáctico de documentos para la detección de diseños, el reconocimiento de fórmulas ...
hace 6 meses
03.1K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: una plataforma de IA para generar activos digitales modelados en 3D de alta resolución

Introducción general Neural4D es una innovadora plataforma basada en IA que se centra en ayudar a los usuarios a generar rápidamente modelos y animaciones 3D de alta calidad con la simple introducción de texto o imágenes. Desarrollada por DreamTech, se basa en la tecnología líder mundial de generación de modelos 3D de gran tamaño de extremo a extremo....
hace 6 meses
02.5K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 6 meses
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 6 meses
02.9K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 6 meses
02.8K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: colaboración multiagente para realizar búsquedas bibliográficas y generar informes de investigación

Introducción general Auto-Deep-Research es una herramienta de IA de código abierto desarrollada por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS), cuyo objetivo es ayudar a los usuarios a automatizar tareas de investigación en profundidad. Se basa en el marco AutoAgent y admite múltiples modelos lingüísticos de gran tamaño...
hace 4 meses
05.5K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: una herramienta de código abierto para generar materiales de estudio de palabras de 4º curso utilizando DeepSeek.

Introducción completa "Vocabulary Book by DeepSeek" es un proyecto de código abierto desarrollado sobre la base del gran modelo de DeepSeek, con el objetivo de ayudar a los estudiantes de inglés a dominar el vocabulario del nivel 4 de inglés universitario (CET-4) de manera eficiente. El proyecto está alojado en GitHub...
hace 6 meses
03K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...
hace 6 meses
03.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: un marco para crear y desplegar rápidamente inteligencias de IA a través del lenguaje natural

Introducción general AutoAgent es un marco de inteligencias de IA de código abierto desarrollado por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS) y alojado en GitHub.Permite a los usuarios crear y desplegar rápidamente inteligencias de IA personalizadas describiendo sus requisitos en lenguaje puramente natural, sin ninguna base de programación....
hace 2 meses
03K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 6 meses
02.4K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...
hace 6 meses
02.2K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: un asistente de inteligencia artificial para la investigación profunda multilingüe

Introducción exhaustiva Deep Research Web UI es una herramienta asistente de investigación de código abierto basada en tecnología de IA, diseñada para ayudar a los usuarios a realizar investigaciones iterativas profundas sobre cualquier tema. Combina la potencia de los motores de búsqueda, el rastreo web y el modelado lingüístico a gran escala a través de una interfaz web intuitiva....
hace 4 meses
02.6K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 6 meses
02.5K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: una aplicación de chat en grupo con múltiples personajes de inteligencia artificial que interactúan en tiempo real.

Introducción general Botgroup.chat es una aplicación de chat de grupo de IA de código abierto desarrollada sobre la base de React y Cloudflare Pages, con el objetivo de proporcionar a los usuarios una experiencia interactiva similar al chat de grupo de WeChat. Soporta la participación simultánea de múltiples personajes de IA....
hace 6 meses
03.8K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: el asistente inteligente de código abierto de LangChain para la investigación profunda

Introducción exhaustiva Open Deep Research es un asistente de investigación basado en web capaz de generar informes de investigación exhaustivos sobre cualquier tema. El sistema utiliza un flujo de trabajo de "planificar y hacer" que permite a los usuarios planificar y revisar la estructura del informe antes de pasar a la fase de investigación, que lleva mucho tiempo...
hace 4 meses
03.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: herramienta de código abierto para la generación automática de grafos de conocimiento a partir de texto plano

Introducción general KGGen es una herramienta de código abierto desarrollada por el Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), alojada en GitHub, diseñada para generar automáticamente grafos de conocimiento a partir de texto arbitrario. Utiliza algoritmos avanzados de modelado del lenguaje y agrupación para...
hace 6 meses
03.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: Extensión del navegador para sincronizar contenidos generados por IA con plataformas de autopublicación en un clic

Introducción General MultiPost-Extension es una extensión del navegador de gran alcance diseñado para ayudar a los usuarios publicar contenido en múltiples plataformas de medios sociales en un solo clic. La extensión soporta la publicación simultánea en más de 10 plataformas principales, incluyendo Zhihu, Weibo, Xiaohongshu, TikTok ...
hace 6 meses
02.8K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: modelos de vídeo de código abierto para generar vídeos de acción humana de alta calidad

Introducción general SkyReels-V1 es un proyecto de código abierto desarrollado por el equipo SkyworkAI centrado en la generación de contenidos de vídeo de alta calidad centrados en el ser humano. El proyecto se basa en el modelo HunyuanVideo , a través de decenas de millones de clips de cine y televisión de alta calidad de micro...
hace 6 meses
02.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 6 meses
02.5K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: motor de recuperación de datos no estructurados y consultas complejas

Introducción general dsRAG es un motor de recuperación de alto rendimiento diseñado para gestionar consultas complejas sobre datos no estructurados. Funciona especialmente bien con consultas complejas en texto denso, como informes financieros, documentos jurídicos y trabajos académicos. dsRAG emplea tres enfoques clave para mejorar el rendimiento: lenguaje...
hace 6 meses
02.2K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...
hace 6 meses
02.2K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

Introducción general Graphiti es una herramienta desarrollada por getzep para construir y consultar grafos de conocimiento dinámicos y temporales. Es capaz de representar relaciones complejas y evolutivas entre entidades y consultarlas mediante diversos métodos, como algoritmos temporales, de texto completo, semánticos y de grafos.Grap...
hace 6 meses
03.8K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 6 meses
02.2K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 6 meses
02.5K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: una plataforma de agregación de comercialización que integra múltiples productos de IA

Introducción completa AIBot PRO es un cliente de agregación de AI basado en .NET 6 diseñado para proporcionar a los usuarios una plataforma conveniente para integrar múltiples productos de AI. El cliente admite el diálogo de conmutación sin sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
hace 6 meses
02.4K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: soluciones eficaces de formación de modelos de IA a gran escala

Introducción ColossalAI es una plataforma de código abierto desarrollada por HPC-AI Technologies, con el objetivo de proporcionar una solución eficiente y rentable para el entrenamiento y la inferencia de modelos de IA a gran escala. Al soportar múltiples estrategias paralelas, gestión de memoria heterogénea y entrenamiento de precisión mixta, ColossalAI...
hace 6 meses
01.9K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: un gran modelo médico de apoyo al análisis de imágenes médicas y a las preguntas y respuestas diagnósticas

Introducción exhaustiva HealthGPT es un modelo avanzado de gran lenguaje visual médico que pretende lograr capacidades unificadas de comprensión y generación visual médica mediante la adaptación de conocimientos heterogéneos. El objetivo del proyecto es integrar la comprensión visual médica y las capacidades de generación en un marco autorregresivo unificado que mejore significativamente la...
hace 6 meses
01.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: herramienta de código abierto para extraer el vídeo para especificar el retrato de destino, generar el vídeo de retrato de destino

Introducción general MatAnyone es un proyecto de código abierto centrado en la codificación de vídeo, desarrollado y publicado en GitHub por un equipo de investigación de S-Lab, Universidad Tecnológica de Nanyang, Singapur. Proporciona a los usuarios capacidades de procesamiento de vídeo estables y eficientes mediante técnicas de propagación de memoria coherente, especialmente...
hace 6 meses
02.5K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: un modelo de vídeo de Vincennes que admite la entrada multilingüe y la generación de vídeos largos

Introducción completa Step-Video-T2V es un modelo avanzado de conversión de texto a vídeo de StepFun AI (StepFun Star). El modelo tiene 3.000 millones de parámetros y es capaz de generar vídeos de hasta 204 fps. Con un Auto-Encoder Variable (VAE) profundamente comprimido, el modelo...
hace 6 meses
02.3K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: capturas de pantalla de la interfaz de usuario convertidas en elementos estructurados para facilitar la comprensión y manipulación de modelos de gran tamaño.

综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...
hace 6 meses
02.2K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: generación de vídeo basada en silicio para controlar el movimiento de objetos sólidos en imágenes

Introducción General DragAnything es un proyecto de código abierto que tiene como objetivo lograr el control de movimiento de objetos arbitrarios a través de la representación de entidades. El proyecto está desarrollado por el equipo Showlab y ha sido aceptado por ECCV 2024.DragAnything proporciona una forma de utilizar...
hace 6 meses
02.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 6 meses
02.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 6 meses
03.2K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Plataforma de código abierto para entrevistas de voz con inteligencia artificial que genera preguntas de entrevista personalizadas y realiza análisis inteligentes

Introducción general FoloUp es una plataforma de código abierto diseñada para ofrecer a las empresas soluciones de entrevistas de voz basadas en IA. Con FoloUp, las empresas pueden generar rápidamente preguntas de entrevista personalizadas para descripciones de puestos de trabajo y realizar entrevistas conversacionales naturales con IA. La plataforma también proporciona un análisis detallado de las entrevistas...
hace 5 meses
02.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Asistente de programación Vim nativo basado en LLM, programación inteligente segura sin conexión

Introducción General VimLM es un plugin de Vim que proporciona un asistente de código impulsado por el LLM nativo (Large Language Model). Interactuando con el modelo LLM nativo a través de los comandos de Vim, obtiene automáticamente el contexto del código y ayuda a los usuarios a editar código en Vim.VimLM está inspirado en...
hace 6 meses
02.7K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...
hace 6 meses
02.8K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 6 meses
02.6K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker mejorado para generar personas digitales utilizando vídeo de retratos

Descripción general SadTalker-Video-Lip-Sync es una herramienta de síntesis labial de vídeo basada en la implementación de SadTalkers. El proyecto genera formas labiales a través de la generación por voz y utiliza la mejora configurable de la región facial para mejorar la claridad de las formas labiales generadas....
hace 6 meses
02.2K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: un modelo que admite juegos de rol y diálogos complejos, con un rendimiento superior a 32b (con instalador de un solo clic).

Introducción exhaustiva Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 es un eficiente modelo de lenguaje diseñado para soportar juegos de rol complejos y diálogos de varias rondas. Profundamente optimizado sobre la base de Qwen 2.5-7B, cuenta con una excelente generación de texto y diálogo....
hace 6 meses
03.3K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 6 meses
02.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Introducción general CodeWeaver es una herramienta de línea de comandos diseñada para entretejer bibliotecas de código en documentos Markdown únicos y fáciles de navegar. Genera una representación estructurada de la jerarquía de archivos de un proyecto escaneando recursivamente los directorios e incrustando el contenido de cada archivo en bloques de código. Esta herramienta...
hace 6 meses
02.1K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: un marco de trabajo de bajo código para organismos multiinteligentes que simplifica las soluciones de automatización de tareas complejas

Introducción completa PraisonAI es un marco de cuerpo multi-inteligencia out-of-the-box para entornos de producción, diseñado para crear inteligencias AI para automatizar y resolver problemas que van desde tareas simples a desafíos complejos. El marco proporciona una solución de bajo código que simplifica la construcción de sistemas LLM de cuerpos multi-inteligentes y...
hace 6 meses
03.8K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

Podcast en chino de HN: captura automáticamente artículos tecnológicos populares, la IA genera resúmenes en chino y los convierte en podcasts.

Introducción general El proyecto Hacker News Chinese Podcast es una plataforma innovadora basada en tecnología de IA, cuyo objetivo es recopilar automáticamente los artículos más populares de Hacker News cada día y generar resúmenes en chino y contenidos de podcast mediante IA. El proyecto está dirigido por ccbikai ...
hace 6 meses
02K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: una herramienta para gestionar la colaboración multiinteligencia mediante inteligencias supervisoras

Introducción general LangGraph Supervisor es una librería Python basada en el framework LangGraph, diseñada para crear y gestionar sistemas de cuerpos multi-inteligentes. La librería coordina el trabajo de múltiples agentes especializados a través de un agente supervisor central, asegurando que los flujos de comunicación y las tareas se dividen...
hace 6 meses
02.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 6 meses
02.6K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: un asistente de investigación profunda basado en IA que proporciona herramientas de investigación eficientes y capacidades de generación de informes.

Introducción general Deep Research es un asistente de investigación basado en IA diseñado para realizar investigación profunda iterativa combinando motores de búsqueda, rastreo web y grandes modelos de lenguaje. El proyecto fue lanzado por dzhng en GitHub con el objetivo de proporcionar un generador de investigación profunda fácil de usar....
hace 4 meses
02.2K