Proyecto AI de código abierto

Total 1020 artículos
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: la herramienta de inteligencia artificial que restaura de forma inteligente las fotos antiguas amarillentas y desgastadas

Bringing Old Photos Back to Life es un proyecto de código abierto desarrollado por un equipo de investigadores de Microsoft que se centra en la restauración de fotos antiguas utilizando tecnología de IA. Se basa en un enfoque de aprendizaje profundo que puede tratar problemas graves de degradación en las fotos, como arañazos....
hace 10 meses
033.4K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: una herramienta de código abierto para optimizar las palabras clave de los modelos de IA convencionales.

Introducción general Prompt Optimizer es una herramienta de código abierto centrada en la optimización de palabras clave, desarrollada por linshenkx en GitHub. Ayuda a los usuarios a optimizar las palabras clave de los modelos de IA mediante algoritmos inteligentes, mejorando así la calidad del contenido generado...
hace 10 meses
059K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

Introducción completa AI-Infra-Guard es una herramienta de evaluación de la seguridad de la infraestructura de IA de código abierto desarrollada por el equipo de seguridad híbrida de Tencent, Zhuqiao Labs, que está diseñada para ayudar a los usuarios a descubrir y detectar rápidamente posibles riesgos de seguridad en los sistemas de IA. La herramienta es compatible con más de 30 marcos y componentes de IA para...
hace 10 meses
038.1K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: el texto genera un vídeo en bucle sin interrupciones

Introducción general Mobius Diffusion es una innovadora herramienta en línea centrada en la generación de contenidos de vídeo en bucle a partir de texto. Se basa en modelos de difusión de vídeo preentrenados y no requiere entrenamiento por parte del usuario ni datos de anotación para empezar a trabajar rápidamente. La tecnología central del sitio es el ...
hace 10 meses
035.2K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: framework backend basado en SpringBoot para chat y dibujo con inteligencia artificial

Introducción completa RuoYi AI es un proyecto back-end basado en el marco ruoyi-plus , centrándose en la integración de chat AI y funciones de pintura . Es completamente de código abierto y gratuito , utilizando Java17 y SpringBoot 3.X pila de tecnología , backend de gestión ...
hace 10 meses
055.8K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

Introducción general Vision Agent es un proyecto de código abierto desarrollado por LandingAI (Team Enda Wu) y alojado en GitHub, diseñado para ayudar a los usuarios a generar rápidamente código para resolver tareas de visión por ordenador. Utiliza un marco de agentes avanzado y modelos multimodales...
hace 10 meses
038.5K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: Herramienta de IA de línea de comandos para corregir código y generar casos de prueba automáticamente

Introducción general MyCoder es un proyecto de código abierto desarrollado por el equipo drivecore y alojado en GitHub, cuyo objetivo es proporcionar a los desarrolladores asistencia de programación inteligente a través de una interfaz de línea de comandos. Se basa en la tecnología Claude AP...
hace 10 meses
041.8K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: un modelo de audio de extremo a extremo para la interacción vocal en tiempo real

Introducción completa Baichuan-Audio es un proyecto de código abierto desarrollado por Baichuan Intelligence (baichuan-inc), alojado en GitHub, centrado en la tecnología de interacción de voz de extremo a extremo. El proyecto proporciona un marco completo de procesamiento de audio que permite ...
hace 10 meses
047.4K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: un modelo de lenguaje visual de código abierto para el razonamiento multimodal

Introducción exhaustiva R1-Onevision es un modelo de macrolenguaje multimodal de código abierto desarrollado por el equipo Fancy-MLLM, centrado en la combinación profunda de visión y lenguaje, capaz de procesar entradas multimodales como imágenes y texto, y de actuar en los campos del razonamiento visual, la comprensión de imágenes, la resolución matemática, etc. ....
hace 10 meses
038.2K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastrea y resume las noticias sobre inteligencia artificial en tiempo real y las publica automáticamente en WeChat.

Introducción general ai-trend-publish es un proyecto de código abierto alojado en GitHub, desarrollado por el equipo OpenAISpace, centrado en el seguimiento y la publicación de las últimas tendencias en inteligencia artificial en tiempo real. Esta herramienta está diseñada para ayudar a desarrolladores, aficionados a la tecnología...
hace 10 meses
039.6K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Genera vídeos explicativos de matemáticas animados de más de 5 minutos con Manim

Introducción general TheoremExplainAgent es un proyecto innovador desarrollado por TIGER AI Lab para transformar complejos teoremas matemáticos y científicos en animaciones de vídeo fáciles de entender utilizando técnicas de inteligencia artificial. La herramienta se basa en el Large Language Model (LLM...
hace 10 meses
044.1K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: Un sistema de archivos paralelo para mejorar la eficiencia del acceso a los datos (DeepSeek Open Source Week Day 5)

Introducción general 3FS (Fire-Flyer File System) es un sistema de archivos paralelo de código abierto desarrollado por el equipo DeepSeek, diseñado para SSDs modernos y redes RDMA, con el objetivo de mejorar drásticamente la eficiencia de acceso a los datos. Está implementado en un clúster de 180 nodos...
hace 10 meses
036.3K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo con inteligencia artificial que admite sesiones simultáneas con múltiples chats.

Introducción general DeepChat es un proyecto de asistente inteligente de código abierto desarrollado por el equipo ThinkInAIXYZ en GitHub. Su objetivo es conectar a los usuarios con el mundo digital a través de una potente tecnología de IA para proporcionar una experiencia de chat eficiente y natural. Es compatible con Win...
hace 10 meses
068K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: a bi-directional pipelined parallel algorithm to improve the efficiency of large-scale AI model training (DeepSeek Open Source Week Day 4)

Introducción general DualPipe es una tecnología de código abierto desarrollada por el equipo de DeepSeek-AI centrada en mejorar la eficiencia del entrenamiento de modelos de IA a gran escala. Se trata de un innovador algoritmo paralelo bidireccional canalizado que se utiliza principalmente en DeepSeek-V3 y R1....
hace 10 meses
035.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: herramienta de generación y depuración automática de código con soporte multilingüe

Introducción general AutoDev es un proyecto de código abierto desarrollado por el equipo de Unit Mesh y alojado en GitHub, cuyo objetivo es mejorar la eficiencia de programación de los desarrolladores mediante tecnología de inteligencia artificial. Es un potente asistente de codificación que soporta múltiples lenguajes de programación, incluyendo Ja...
hace 10 meses
046K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: un reproductor de vídeo que genera subtítulos en tiempo real con traducción bilingüe

Introducción general LLPlayer es un reproductor multimedia de código abierto para estudiantes de idiomas, alojado en GitHub y creado por el desarrollador umlx5h. Integra una variedad de características útiles como la visualización de subtítulos bilingües, subtítulos autogenerados por IA, traducción en tiempo real y búsqueda de palabras....
hace 7 meses
0105.4K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: Una biblioteca de código abierto con soporte eficiente para operaciones matriciales FP8 (DeepSeek Open Source Week Day 3)

Introducción general DeepGEMM es una biblioteca FP8 GEMM (Generalised Matrix Multiplication) de código abierto desarrollada por el equipo DeepSeek, centrada en proporcionar un soporte eficiente de aritmética matricial. Está dirigida específicamente a la arquitectura NVIDIA Hopper para Tensor ...
hace 10 meses
040.8K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: un asistente pedagógico inteligente que ofrece orientación personalizada sobre programación

Introducción general Coding-Tutor es un proyecto de código abierto alojado en GitHub y creado por el desarrollador iwangjian para proporcionar a los alumnos una experiencia de enseñanza de programación personalizada. Utiliza tecnología de IA conversacional para aprender basándose en los conocimientos...
hace 10 meses
041.6K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestación de flujos de trabajo de bajo código para la creación rápida de chatbots

Introducción general Flock es una plataforma de código abierto para flujos de trabajo, alojada en GitHub y desarrollada por el equipo Onelevenvy. Se basa en las tecnologías LangChain y LangGraph y se centra en ayudar a los usuarios a construir rápidamente máquinas de chat....
hace 10 meses
045.5K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: herramienta inteligente diseñada para analizar datos tabulares complejos

Introducción completa TableGPT Agent es una herramienta inteligente basada en el proyecto de código abierto GitHub, diseñada para procesar y analizar datos tabulares. Se basa en el modelo Big Language TableGPT2, que utiliza la interacción con el lenguaje natural para permitir a los usuarios consultar, manipular...
hace 10 meses
041.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas

Introducción general TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de presentación en vídeos con narración. Genera automáticamente contenido de audio y vídeo a partir de archivos de presentación de entrada a través de sencillas operaciones de línea de comandos, adecuado para aquellos que...
hace 10 meses
056.2K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: herramienta de desarrollo de código abierto de Shangtang para crear aplicaciones corporales multiinteligentes

Introducción exhaustiva LazyLLM es una herramienta de código abierto desarrollada por el equipo LazyAGI, centrada en simplificar el proceso de desarrollo de aplicaciones de grandes modelos de inteligencia múltiple. Ayuda a los desarrolladores a construir rápidamente aplicaciones complejas de IA a través de la implementación con un solo clic y mecanismos de puerta de enlace ligeros, ahorrando la tediosa configuración de ingeniería....
hace 10 meses
047.4K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: generación de recursos de animación de estructuras esqueléticas a partir de modelos 3D estáticos

Introducción general MagicArticulate es un marco de IA desarrollado por ByteDance en colaboración con la Universidad Tecnológica de Nanyang (NTU), que se centra en la rápida transformación de modelos 3D estáticos en activos digitales de animación. Lo hace mediante un Transformador autorregresivo avanzado y un modelo de difusión funcional, auto...
hace 10 meses
041.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 10 meses
052.2K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraiga la compleja estructura del contenido PDF de la herramienta de código abierto

Introducción completa PDF-Extract-Kit es un proyecto de código abierto desarrollado por el equipo OpenDataLab , centrándose en la extracción eficiente de contenido de alta calidad a partir de documentos PDF complejos y diversos . Integra tecnología avanzada de análisis sintáctico de documentos para la detección de diseños, el reconocimiento de fórmulas ...
hace 10 meses
070.4K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: una plataforma de IA para generar activos digitales modelados en 3D de alta resolución

Introducción general Neural4D es una innovadora plataforma basada en IA que se centra en ayudar a los usuarios a generar rápidamente modelos y animaciones 3D de alta calidad con la simple introducción de texto o imágenes. Desarrollada por DreamTech, se basa en la tecnología líder mundial de generación de modelos 3D de gran tamaño de extremo a extremo....
hace 10 meses
042.9K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...
hace 10 meses
054.1K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: interfaz de chat para visualizar conversaciones basadas en árboles

Introducción general TreeGPT es una aplicación de chat de código abierto basada en Next.js, centrada en la visualización de conversaciones con grandes modelos lingüísticos (LLMs, por sus siglas en inglés, p. ej., GPTs) a través de estructuras de grafos en árbol (grafos acíclicos dirigidos, DAGs), sustituyendo a los métodos de chat lineales tradicionales para mejorar la velocidad y...
hace 10 meses
046.2K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: un asistente de IA para la generación de descripciones de texto Flujos de trabajo ComfyUI

Introducción general ComfyUI-Copilot es un nodo personalizado impulsado por IA diseñado para el marco ComfyUI, con el objetivo de mejorar la eficiencia de la depuración y el despliegue de algoritmos de IA a través de la interacción del lenguaje natural. Está desarrollado por el equipo AIDC-AI (Alibaba) y derivado de GitHu...
hace 10 meses
054.2K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: colaboración multiagente para realizar búsquedas bibliográficas y generar informes de investigación

Introducción general Auto-Deep-Research es una herramienta de IA de código abierto desarrollada por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS), cuyo objetivo es ayudar a los usuarios a automatizar tareas de investigación en profundidad. Se basa en el marco AutoAgent y admite múltiples modelos lingüísticos de gran tamaño...
hace 9 meses
045.9K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: una herramienta de código abierto para generar materiales de estudio de palabras de 4º curso utilizando DeepSeek.

Introducción completa "Vocabulary Book by DeepSeek" es un proyecto de código abierto desarrollado sobre la base del gran modelo de DeepSeek, con el objetivo de ayudar a los estudiantes de inglés a dominar el vocabulario del nivel 4 de inglés universitario (CET-4) de manera eficiente. El proyecto está alojado en GitHub...
hace 10 meses
044.1K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...
hace 10 meses
074.1K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: un marco para crear y desplegar rápidamente inteligencias de IA a través del lenguaje natural

Introducción general AutoAgent es un marco de inteligencias de IA de código abierto desarrollado por el Laboratorio de Inteligencia de Datos de la Universidad de Hong Kong (HKUDS) y alojado en GitHub.Permite a los usuarios crear y desplegar rápidamente inteligencias de IA personalizadas describiendo sus requisitos en lenguaje puramente natural, sin ninguna base de programación....
hace 7 meses
044.8K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 10 meses
037.6K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de código abierto para el aprendizaje por refuerzo del razonamiento a gran escala

Introducción general Open-Reasoner-Zero es un proyecto de código abierto centrado en la investigación del aprendizaje por refuerzo (RL), desarrollado por el equipo Open-Reasoner-Zero en GitHub. Su objetivo es proporcionar un entrenamiento eficiente, escalable y fácil de usar...
hace 10 meses
036.9K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: un asistente de inteligencia artificial para la investigación profunda multilingüe

Introducción exhaustiva Deep Research Web UI es una herramienta asistente de investigación de código abierto basada en tecnología de IA, diseñada para ayudar a los usuarios a realizar investigaciones iterativas profundas sobre cualquier tema. Combina la potencia de los motores de búsqueda, el rastreo web y el modelado lingüístico a gran escala a través de una interfaz web intuitiva....
hace 9 meses
046.5K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D con audio de personas digitales interactivas en tiempo real, que funcionan a 30 fps en la CPU.

Introducción general LiteAvatar es una herramienta de código abierto desarrollada por el equipo HumanAIGC (parte de Ali) que se centra en generar animaciones faciales a partir de avatares 2D controlados por audio en tiempo real. Funciona a 30 fotogramas por segundo (fps) dependiendo únicamente de la CPU, y está especialmente indicada para...
hace 10 meses
054.1K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: una aplicación de chat en grupo con múltiples personajes de inteligencia artificial que interactúan en tiempo real.

Introducción general Botgroup.chat es una aplicación de chat de grupo de IA de código abierto desarrollada sobre la base de React y Cloudflare Pages, con el objetivo de proporcionar a los usuarios una experiencia interactiva similar al chat de grupo de WeChat. Soporta la participación simultánea de múltiples personajes de IA....
hace 10 meses
067.9K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: el asistente inteligente de código abierto de LangChain para la investigación profunda

Introducción exhaustiva Open Deep Research es un asistente de investigación basado en web capaz de generar informes de investigación exhaustivos sobre cualquier tema. El sistema utiliza un flujo de trabajo de "planificar y hacer" que permite a los usuarios planificar y revisar la estructura del informe antes de pasar a la fase de investigación, que lleva mucho tiempo...
hace 9 meses
053K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: herramienta de código abierto para la generación automática de grafos de conocimiento a partir de texto plano

Introducción general KGGen es una herramienta de código abierto desarrollada por el Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), alojada en GitHub, diseñada para generar automáticamente grafos de conocimiento a partir de texto arbitrario. Utiliza algoritmos avanzados de modelado del lenguaje y agrupación para...
hace 10 meses
071.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: Extensión del navegador para sincronizar contenidos generados por IA con plataformas de autopublicación en un clic

Introducción General MultiPost-Extension es una extensión del navegador de gran alcance diseñado para ayudar a los usuarios publicar contenido en múltiples plataformas de medios sociales en un solo clic. La extensión soporta la publicación simultánea en más de 10 plataformas principales, incluyendo Zhihu, Weibo, Xiaohongshu, TikTok ...
hace 10 meses
037.3K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: modelos de vídeo de código abierto para generar vídeos de acción humana de alta calidad

Introducción general SkyReels-V1 es un proyecto de código abierto desarrollado por el equipo SkyworkAI centrado en la generación de contenidos de vídeo de alta calidad centrados en el ser humano. El proyecto se basa en el modelo HunyuanVideo , a través de decenas de millones de clips de cine y televisión de alta calidad de micro...
hace 10 meses
084.3K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 11 meses
046.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: motor de recuperación de datos no estructurados y consultas complejas

Introducción general dsRAG es un motor de recuperación de alto rendimiento diseñado para gestionar consultas complejas sobre datos no estructurados. Funciona especialmente bien con consultas complejas en texto denso, como informes financieros, documentos jurídicos y trabajos académicos. dsRAG emplea tres enfoques clave para mejorar el rendimiento: lenguaje...
hace 11 meses
038.4K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: un transformador autorregresivo de una etapa para la generación automática de canciones

Introducción SongGen es un modelo autorregresivo de Transformación de una sola etapa, de código abierto, diseñado para tareas de generación de texto a canción. El modelo es capaz de generar canciones que contienen voces y pistas de acompañamiento de entrada de texto.SongGen proporciona un control de grano fino sobre una amplia gama de atributos musicales ...
hace 11 meses
037.4K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

Introducción general Graphiti es una herramienta desarrollada por getzep para construir y consultar grafos de conocimiento dinámicos y temporales. Es capaz de representar relaciones complejas y evolutivas entre entidades y consultarlas mediante diversos métodos, como algoritmos temporales, de texto completo, semánticos y de grafos.Grap...
hace 11 meses
057.4K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: una solución de memoria a largo plazo basada en el perfil del usuario para aplicaciones de IA

Introducción general Memobase es un sistema de memoria basado en el perfil del usuario diseñado para soportar una memoria de usuario duradera para aplicaciones de IA generativa. Tanto si estás construyendo un compañero virtual, una herramienta educativa o un asistente personalizado, Memobase ayuda a tu IA a recordar, comprender y crecer con el uso de...
hace 11 meses
040.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de datos de destilación DeepSeek-R1 basado en China, compatible con el conjunto de datos SFT de destilación R1 chino

Introducción exhaustiva El conjunto de datos chinos de destilación DeepSeek-R1 es un conjunto de datos chinos de código abierto que contiene 110.000 datos diseñados para apoyar el aprendizaje automático y la investigación del procesamiento del lenguaje natural. El conjunto de datos ha sido publicado por el equipo de PNL de Cong Liu. El conjunto de datos no sólo contiene datos matemáticos, sino también un gran número de...
hace 11 meses
037.9K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: una plataforma de agregación de comercialización que integra múltiples productos de IA

Introducción completa AIBot PRO es un cliente de agregación de AI basado en .NET 6 diseñado para proporcionar a los usuarios una plataforma conveniente para integrar múltiples productos de AI. El cliente admite el diálogo de conmutación sin sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
hace 11 meses
040.5K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: soluciones eficaces de formación de modelos de IA a gran escala

Introducción ColossalAI es una plataforma de código abierto desarrollada por HPC-AI Technologies, con el objetivo de proporcionar una solución eficiente y rentable para el entrenamiento y la inferencia de modelos de IA a gran escala. Al soportar múltiples estrategias paralelas, gestión de memoria heterogénea y entrenamiento de precisión mixta, ColossalAI...
hace 11 meses
036.2K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: un gran modelo médico de apoyo al análisis de imágenes médicas y a las preguntas y respuestas diagnósticas

Introducción exhaustiva HealthGPT es un modelo avanzado de gran lenguaje visual médico que pretende lograr capacidades unificadas de comprensión y generación visual médica mediante la adaptación de conocimientos heterogéneos. El objetivo del proyecto es integrar la comprensión visual médica y las capacidades de generación en un marco autorregresivo unificado que mejore significativamente la...
hace 11 meses
042.4K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: herramienta de código abierto para extraer el vídeo para especificar el retrato de destino, generar el vídeo de retrato de destino

Introducción general MatAnyone es un proyecto de código abierto centrado en la codificación de vídeo, desarrollado y publicado en GitHub por un equipo de investigación de S-Lab, Universidad Tecnológica de Nanyang, Singapur. Proporciona a los usuarios capacidades de procesamiento de vídeo estables y eficientes mediante técnicas de propagación de memoria coherente, especialmente...
hace 11 meses
058.3K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: la caja de herramientas de los entusiastas de la IA para gestionar, conectar y utilizar todos sus modelos de IA en un solo escritorio.

General Omnitool.ai es un "laboratorio de IA" de código abierto diseñado para proporcionar un entorno de escritorio extensible basado en navegador para estudiantes, aficionados y cualquier persona interesada en las innovaciones actuales de IA. Permite a los usuarios colaborar a través de una interfaz unificada con una amplia gama de expertos en IA de OpenAI, repl...
hace 11 meses
034.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: un modelo de vídeo de Vincennes que admite la entrada multilingüe y la generación de vídeos largos

Introducción completa Step-Video-T2V es un modelo avanzado de conversión de texto a vídeo de StepFun AI (StepFun Star). El modelo tiene 3.000 millones de parámetros y es capaz de generar vídeos de hasta 204 fps. Con un Auto-Encoder Variable (VAE) profundamente comprimido, el modelo...
hace 11 meses
042.3K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: capturas de pantalla de la interfaz de usuario convertidas en elementos estructurados para facilitar la comprensión y manipulación de modelos de gran tamaño.

Introducción general OmniParser es una herramienta desarrollada por Microsoft para analizar capturas de pantalla de la interfaz de usuario y convertirlas en elementos estructurados y fáciles de entender. Esta herramienta mejora significativamente la capacidad de GPT-4V para generar acciones precisas en el área de interfaz correspondiente.OmniParser no sólo admite...
hace 11 meses
037.8K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: generación de vídeo basada en silicio para controlar el movimiento de objetos sólidos en imágenes

Introducción General DragAnything es un proyecto de código abierto que tiene como objetivo lograr el control de movimiento de objetos arbitrarios a través de la representación de entidades. El proyecto está desarrollado por el equipo Showlab y ha sido aceptado por ECCV 2024.DragAnything proporciona una forma de utilizar...
hace 11 meses
034.3K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 11 meses
049.5K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 11 meses
053.9K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Plataforma de código abierto para entrevistas de voz con inteligencia artificial que genera preguntas de entrevista personalizadas y realiza análisis inteligentes

Introducción general FoloUp es una plataforma de código abierto diseñada para ofrecer a las empresas soluciones de entrevistas de voz basadas en IA. Con FoloUp, las empresas pueden generar rápidamente preguntas de entrevista personalizadas para descripciones de puestos de trabajo y realizar entrevistas conversacionales naturales con IA. La plataforma también proporciona un análisis detallado de las entrevistas...
hace 10 meses
036K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Asistente de programación Vim nativo basado en LLM, programación inteligente segura sin conexión

Introducción General VimLM es un plugin de Vim que proporciona un asistente de código impulsado por el LLM nativo (Large Language Model). Interactuando con el modelo LLM nativo a través de los comandos de Vim, obtiene automáticamente el contexto del código y ayuda a los usuarios a editar código en Vim.VimLM está inspirado en...
hace 11 meses
040.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...
hace 11 meses
038.5K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 11 meses
044K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker mejorado para generar personas digitales utilizando vídeo de retratos

Descripción general SadTalker-Video-Lip-Sync es una herramienta de síntesis labial de vídeo basada en la implementación de SadTalkers. El proyecto genera formas labiales a través de la generación por voz y utiliza la mejora configurable de la región facial para mejorar la claridad de las formas labiales generadas....
hace 11 meses
042.3K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: un modelo que admite juegos de rol y diálogos complejos, con un rendimiento superior a 32b (con instalador de un solo clic).

Introducción exhaustiva Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 es un eficiente modelo de lenguaje diseñado para soportar juegos de rol complejos y diálogos de varias rondas. Profundamente optimizado sobre la base de Qwen 2.5-7B, cuenta con una excelente generación de texto y diálogo....
hace 11 meses
042.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 11 meses
037.9K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Introducción general CodeWeaver es una herramienta de línea de comandos diseñada para entretejer bibliotecas de código en documentos Markdown únicos y fáciles de navegar. Genera una representación estructurada de la jerarquía de archivos de un proyecto escaneando recursivamente los directorios e incrustando el contenido de cada archivo en bloques de código. Esta herramienta...
hace 11 meses
040.4K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: un marco de trabajo de bajo código para organismos multiinteligentes que simplifica las soluciones de automatización de tareas complejas

Introducción completa PraisonAI es un marco de cuerpo multi-inteligencia out-of-the-box para entornos de producción, diseñado para crear inteligencias AI para automatizar y resolver problemas que van desde tareas simples a desafíos complejos. El marco proporciona una solución de bajo código que simplifica la construcción de sistemas LLM de cuerpos multi-inteligentes y...
hace 11 meses
035.7K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

Podcast en chino de HN: captura automáticamente artículos tecnológicos populares, la IA genera resúmenes en chino y los convierte en podcasts.

Introducción general El proyecto Hacker News Chinese Podcast es una plataforma innovadora basada en tecnología de IA, cuyo objetivo es recopilar automáticamente los artículos más populares de Hacker News cada día y generar resúmenes en chino y contenidos de podcast mediante IA. El proyecto está dirigido por ccbikai ...
hace 11 meses
038.3K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: una herramienta para gestionar la colaboración multiinteligencia mediante inteligencias supervisoras

Introducción general LangGraph Supervisor es una librería Python basada en el framework LangGraph, diseñada para crear y gestionar sistemas de cuerpos multi-inteligentes. La librería coordina el trabajo de múltiples agentes especializados a través de un agente supervisor central, asegurando que los flujos de comunicación y las tareas se dividen...
hace 11 meses
042.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: proyecto de código abierto para la búsqueda por inferencia profunda mediante conocimiento local

Introducción exhaustiva Deep Searcher es una potente herramienta que combina grandes modelos lingüísticos (LLM) y bases de datos vectoriales diseñada para buscar, evaluar y razonar a partir de datos privados, proporcionando respuestas muy precisas e informes exhaustivos. Es adecuado para la gestión del conocimiento empresarial...
hace 11 meses
042.2K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: un asistente de investigación profunda basado en IA que proporciona herramientas de investigación eficientes y capacidades de generación de informes.

Introducción general Deep Research es un asistente de investigación basado en IA diseñado para realizar investigación profunda iterativa combinando motores de búsqueda, rastreo web y grandes modelos de lenguaje. El proyecto fue lanzado por dzhng en GitHub con el objetivo de proporcionar un generador de investigación profunda fácil de usar....
hace 9 meses
037.6K