Proyecto AI de código abierto

Total 1020 artículos
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: creador de flujos de trabajo de código abierto para agentes de IA

Introducción exhaustiva Sim Studio es una plataforma de código abierto para la creación de flujos de trabajo de agentes de IA que se centra en ayudar a los usuarios a diseñar, probar y desplegar rápidamente flujos de trabajo de modelos lingüísticos (LLM) a gran escala a través de una interfaz visual ligera e intuitiva. Los usuarios pueden crear flujos de trabajo complejos sin necesidad de programar...
hace 3 meses
01.2K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos

Introducción general Mad Professor (Grumpy Professor Reads Papers) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento PDF, traducción IA, recuperación RAG, preguntas IA...
hace 3 meses
01.1K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: una herramienta de código abierto para editar imágenes con instrucciones de lenguaje natural

Introducción general Step1X-Edit es un marco de edición de imágenes de código abierto desarrollado por el equipo Stepfun AI y alojado en GitHub. Combina un modelo de lenguaje multimodal de gran tamaño (Qwen-VL) y un transformador de difusión (DiT) para permitir a los usuarios crear imágenes a través de un...
hace 3 meses
0928
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: herramienta de integración del protocolo de contexto de modelo (MCP) para aplicaciones de IA

Introducción general Klavis AI es una plataforma de código abierto centrada en simplificar el uso y la integración del Protocolo de Contexto de Modelo (MCP), un estándar abierto que permite a las aplicaciones de IA conectarse dinámicamente con herramientas y fuentes de datos externas.Klavis AI proporciona a Slack...
hace 3 meses
01.2K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: diálogo hablado natural de baja latencia con IA

Introducción general RealtimeVoiceChat es un proyecto de código abierto centrado en conversaciones naturales y en tiempo real con inteligencia artificial a través de la voz. Los usuarios utilizan un micrófono para introducir su voz, y el sistema captura el audio a través de un navegador, lo convierte rápidamente en texto, y un gran modelo de lenguaje (LLM) genera de nuevo...
hace 3 meses
0818
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: un pequeño modelo de código abierto para el razonamiento matemático eficiente y la generación de código

Introducción general MiMo es un proyecto de modelado de grandes lenguajes de código abierto desarrollado por Xiaomi, centrado en el razonamiento matemático y la generación de código. El producto principal es la familia de modelos MiMo-7B, que contiene un modelo base (Base), un modelo de ajuste fino supervisado (SFT), un químico fuerte entrenado a partir del modelo base....
hace 3 meses
01.2K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: servicios MCP para controlar software CAD mediante comandos de lenguaje natural

Introducción General CAD-MCP es un proyecto de código abierto que permite a los usuarios controlar el software CAD a través de comandos de lenguaje natural para las operaciones de dibujo. Combina el procesamiento del lenguaje natural y la tecnología de automatización CAD , de modo que los usuarios no necesitan operar manualmente la interfaz CAD , basta con introducir comandos de texto simples que...
hace 3 meses
01.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: ajuste de modelos lingüísticos mediante grafos de conocimiento para generar datos sintéticos

Introducción general GraphGen es un marco de código abierto desarrollado por OpenScienceLab, un laboratorio de IA de Shanghái, alojado en GitHub, que se centra en optimizar el ajuste fino supervisado de grandes modelos lingüísticos (LLM) guiando la generación de datos sintéticos a través de grafos de conocimiento. Se desarrolló a partir de ...
hace 3 meses
0904
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: proyecto experimental para ejecutar un modelo lingüístico a gran escala en un archivo PDF

Introducción general llm.pdf es un proyecto de código abierto que permite a los usuarios ejecutar grandes modelos lingüísticos (LLM) directamente en archivos PDF. Desarrollado por EvanZhouDev y alojado en GitHub, este proyecto demuestra un enfoque innovador: al Em...
hace 3 meses
0997
Abogen:将多种文本格式转换为有声读物的工具

Abogen: una herramienta para convertir múltiples formatos de texto en audiolibros

Introducción general Abogen es una herramienta de código abierto diseñada para convertir rápidamente archivos ePub, PDF o de texto plano en audio de alta calidad. Utiliza el modelo Kokoro-82M para generar un habla natural y fluida, y admite la generación simultánea de subtítulos, lo que resulta idóneo para producir audiolibros....
hace 3 meses
0957
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research: una herramienta de gestión local para generar informes de investigación en profundidad.

Introducción general Local Deep Research es un asistente de investigación de IA de código abierto diseñado para ayudar a los usuarios a realizar investigaciones profundas y generar informes detallados para problemas complejos. Es compatible con la ejecución local, lo que permite a los usuarios completar las tareas de investigación sin depender de los servicios en la nube. La herramienta ...
hace 3 meses
01.1K
Trackers:用于视频对象跟踪的开源工具库

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...
hace 3 meses
01.2K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: modelo base de procesamiento de audio y diálogo de código abierto

Introducción general Kimi-Audio es un modelo de base de audio de código abierto desarrollado por Moonshot AI, centrado en la comprensión, generación y diálogo de audio. Es compatible con una amplia gama de tareas de procesamiento de audio, como el reconocimiento del habla, el Q&A de audio y el reconocimiento de las emociones del habla. El modelo se ha probado en más de 130...
hace 3 meses
01K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: creación de una herramienta de colaboración en tareas multiinteligencia en una frase

Introducción general Cooragent es un marco de colaboración de agentes de IA de código abierto desarrollado por LeapLab en la Universidad de Tsinghua y alojado en GitHub. Permite a los usuarios crear agentes de IA inteligentes con una descripción de una frase y admite múltiples agentes para colaborar en tareas complejas. El marco proporciona dos...
hace 3 meses
01K
Claude生成深度研究报告的MCP服务

Servicio MCP de Claude para generar informes de investigación en profundidad

Introducción general MCP Server Deep Research es una herramienta de código abierto que genera automáticamente informes de investigación estructurados para problemas complejos mediante inteligencia artificial y búsqueda en la web. Los usuarios introducen una pregunta de investigación y la herramienta la desglosa, busca información autorizada, evalúa la credibilidad de las fuentes...
hace 3 meses
0891
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: una herramienta de código abierto que proporciona un marco de memoria de clase empresarial para modelos de gran tamaño.

Introducción Deep Recall es un marco de memoria empresarial de código abierto diseñado para grandes modelos lingüísticos (LLM). Proporciona una capacidad de respuesta hiperpersonalizada a través de una recuperación y una integración contextuales eficaces. El marco utiliza una arquitectura de tres niveles, que incluye un servicio de memoria, un servicio de razonamiento y un...
hace 3 meses
01K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: una herramienta de código abierto para generar retratos hablados realistas

Introducción general FantasyTalking es un proyecto de código abierto desarrollado por el equipo Fantasy-AMAP, centrado en la generación de realismo hablando videos retrato a través de la unidad de audio. El proyecto se basa en el modelo avanzado de difusión de vídeo Wan2.1 , combinado con el codificador de audio Wa...
hace 3 meses
01.6K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: conversión automática de documentos de aprendizaje automático en código ejecutable

Introducción general Paper2Code es un proyecto de código abierto que pretende resolver el problema de la falta de implementaciones de código para artículos de aprendizaje automático. Transforma automáticamente artículos científicos en repositorios de código ejecutables a través del sistema multiagente de modelado de grandes lenguajes (LLM) PaperCoder. El sistema utiliza la planificación ...
hace 3 meses
01K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: generación automatizada de documentación AI para repositorios GitHub, GitLab

Introducción completa DeepWiki-Open es un proyecto de código abierto diseñado para generar automáticamente documentación estructurada para repositorios de código en GitHub, GitLab y Bitbucket. Utiliza tecnología de IA para analizar la estructura del código , el contenido de los archivos y las relaciones lógicas , la generación rápida...
hace 3 meses
01.5K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: convertir artículos tecnológicos populares en podcasts de audio listos para escuchar

Introducción general Audibit es un proyecto de código abierto, la función principal es Hacker News, TechCrunch y otros artículos populares de tecnología convertidos automáticamente en podcasts de audio, para que los usuarios en el viaje, la aptitud, u ocupado al escuchar la información a través de la Web o móvil. El proyecto hace ...
hace 3 meses
01K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: un marco de código abierto TypeScript para construir rápidamente inteligencias de IA

Introducción general VoltAgent es un marco TypeScript de código abierto diseñado para que los desarrolladores construyan y orquesten rápidamente inteligencias de IA. Proporciona herramientas modulares y un modelo de desarrollo estandarizado que simplifica la interacción con grandes modelos de...
hace 3 meses
0959
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: Extensión del navegador para gestionar y utilizar avisos rápidamente

General Quick Prompt es una extensión de navegador de código abierto que se centra en la gestión de palabras de aviso (Prompt) y en la introducción rápida de datos. Los usuarios pueden crear, organizar y almacenar bibliotecas de Prompts e insertar rápidamente contenido preestablecido Prompt en el cuadro de entrada de cualquier página web. Esta herramienta es especialmente ...
hace 3 meses
01.3K
Suna:集成浏览器操作与数据分析的智能代理

Suna: agentes inteligentes que integran operaciones de navegación y análisis de datos

Introducción general Suna es un agente de IA de propósito general de código abierto desarrollado por Kortix AI, alojado en GitHub, basado en la licencia Apache 2.0, que permite a los usuarios descargarlo, modificarlo y autoalojarlo gratuitamente. Utiliza el diálogo en lenguaje natural para ayudar a los usuarios con...
hace 4 meses
01.3K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodales de código abierto para el tratamiento de imágenes, vídeos y textos

Introducción integral InternVL es un proyecto de big model multimodal de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai (OpenGVLab) y alojado en GitHub. Integra capacidades de procesamiento visual y lingüístico para apoyar la comprensión integral y la generación de imágenes, vídeos y textos.En...
hace 4 meses
01.1K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: un asistente de ingeniería de IA para crear rápidamente bases de código propias

Introducción completa Potpie AI es una plataforma de código abierto centrada en proporcionar a los desarrolladores asistentes de ingeniería de IA personalizados. Permite a los agentes de IA comprender en profundidad la estructura y la lógica del código y automatizar tareas como la depuración, las pruebas y la generación de código mediante la construcción de un grafo de conocimiento de la base de código. Los usuarios pueden...
hace 4 meses
01.3K
Vexa:实时会议转录与智能知识提取工具

Vexa: una herramienta inteligente de transcripción de reuniones y extracción de conocimientos en tiempo real

Introducción completa Vexa es una plataforma de código abierto para la transcripción de reuniones en tiempo real y la gestión del conocimiento diseñada para proporcionar servicios eficientes de grabación de reuniones y extracción inteligente del conocimiento para empresas y particulares. Se une automáticamente a plataformas como Google Meet, Zoom, etc. mediante robots de reuniones basados en API....
hace 4 meses
01.2K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: un sistema de mejora de la memoria basado en la extensión de código Roo

Introducción completa RooFlow es una herramienta de programación asistida por IA de código abierto con la funcionalidad principal de preservar el código, las decisiones y el progreso de las tareas durante el desarrollo mediante el registro de proyectos. Se basa en la extensión Roo Code e integra cinco modos: arquitectura, codificación, pruebas, depuración y preguntas y respuestas. Estos modos inter...
hace 4 meses
0941
Zev:用自然语言快速查询终端命令的CLI工具

Zev: una herramienta CLI para consultar rápidamente comandos de terminal en lenguaje natural

Introducción general Zev es una herramienta de interfaz de línea de comandos (CLI) fácil de usar que ayuda a los usuarios a consultar y generar rápidamente comandos de terminal en lenguaje natural. En lugar de tener que recordar complejas sintaxis de comandos, Zev genera comandos de terminal describiendo tus necesidades en lenguaje cotidiano. Basado en Ope...
hace 4 meses
0623
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: generación de informes indexados de investigación profunda

Introducción general Open Deep Research es una herramienta de investigación en profundidad desarrollada y de código abierto por el equipo Together AI y alojada en GitHub. Simula el proceso de investigación humana mediante un flujo de trabajo de IA multiagente, generando informes de investigación detallados...
hace 4 meses
0690
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: una herramienta de gestión que combina la aprobación automatizada inteligente de procesos con auditorías humanas.

Introducción general LLManager es una herramienta de gestión de aprobación inteligente de código abierto, desarrollada en base al marco LangGraph de LangChain, centrada en la automatización del procesamiento de las solicitudes de aprobación al tiempo que optimiza la toma de decisiones con revisión humana. Lo hace a través de la búsqueda semántica, el aprendizaje...
hace 4 meses
01.2K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: una herramienta inteligente para automatizar la documentación de código Python

Introducción general DocAgent es una herramienta de código abierto de generación de documentación de código Python desarrollada por Meta AI. Utiliza la colaboración multi-inteligencia y el análisis jerárquico de código para generar automáticamente anotaciones de documentos de alta calidad y conscientes del contexto para bases de código Python (d...
hace 4 meses
0835
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: compatibilidad con herramientas de generación de imágenes personalizadas mono y multisujeto (adecuadas para gráficos de comercio electrónico).

UNO es un marco de generación de imágenes de código abierto desarrollado por el equipo de creación inteligente ByteDance. Se basa en el modelo FLUX.1 y se centra en la generación de imágenes personalizadas de un único sujeto y de varios sujetos mediante un enfoque de generalización de "menos a más".UNO utiliza el transformador de difusión...
hace 4 meses
0857
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: herramienta gratuita de edición de síntesis de canciones de código abierto

Introducción general OpenUtau es una plataforma libre de código abierto de síntesis y edición de canciones diseñada para proporcionar a la comunidad UTAU una experiencia de edición moderna. Es el sucesor del software UTAU y resuelve los problemas de compatibilidad y complejidad del software original.OpenUtau soporta Wind...
hace 4 meses
01.4K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: una herramienta basada en grafos heterogéneos para la recuperación y generación de información precisa

Una introducción completa NodeRAG es un sistema de código abierto de Generación Aumentada de Recuperación (RAG) alojado en GitHub y desarrollado por Terry-Xu-666. Optimiza la recuperación y generación de información a través de estructuras de grafos heterogéneos, mejorando significativamente la precisión de la recuperación y la relevancia contextual.Nod...
hace 4 meses
01.4K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: una herramienta de AI de código abierto para convertir lenguaje natural en comandos de shell

Introducción general Open Codex es una herramienta de AI de línea de comandos de código abierto diseñada para que los desarrolladores conviertan instrucciones de lenguaje natural en comandos de shell precisos. Utiliza un modelo de lenguaje nativo (por ejemplo, phi-4-mini), no requiere redes ni claves API, y todas las operaciones en...
hace 4 meses
0820
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: una herramienta de IA de código abierto para generar vídeos de duración ilimitada

Introducción completa SkyReels-V2 es un modelo de generación de vídeo de código abierto desarrollado por SkyworkAI. Admite la generación de vídeos de longitud ilimitada mediante la tecnología avanzada Diffusion Forcing, y es apto para la conversión de texto a vídeo (T2V) y graf...
hace 4 meses
01.2K
Dia:生成超现实多人对话的文本转语音模型

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....
hace 4 meses
0867
Plandex:支持超长上下文的开源AI编码助手

Plandex: un asistente de código abierto para la codificación de IA con soporte para contextos ultralargos

Introducción General Plandex es un código abierto de extremo a extremo AI codificación asistente diseñado para proyectos de software grandes y complejos. Puede planificar y ejecutar tareas de múltiples pasos, manejar contextos de hasta 2 millones de fichas y soportar más de 30 lenguajes de programación.Plandex ofrece...
hace 4 meses
01.1K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: la herramienta de inteligencia artificial que genera automáticamente notas Markdown a partir de vídeos

Introducción completa BiliNote es una herramienta de código abierto AI video toma de notas que soporta la extracción de contenido de BiliNote y enlaces de vídeo de YouTube para generar automáticamente notas claramente estructuradas en formato Markdown. Hace uso de la transcripción nativa de audio y de una gran variedad de modelos ...
hace 4 meses
0839
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: Integración de múltiples fuentes de datos en un único archivo de texto

Introducción completa OneFileLLM es una herramienta de línea de comandos de código abierto diseñada para consolidar múltiples fuentes de datos en un único archivo de texto para facilitar la entrada en grandes modelos lingüísticos (LLM). Permite procesar repositorios de GitHub, artículos de ArXiv, transcripciones de vídeos de YouTube,...
hace 4 meses
01.2K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G de memoria gráfica de bajo crecimiento rápido de vídeo largo proyecto de código abierto

Introducción general FramePack es una herramienta de generación de vídeo de código abierto centrada en hacer más prácticas las técnicas de difusión de vídeo. Desvincula la carga de trabajo de generación de la longitud del vídeo comprimiendo los fotogramas de entrada a una longitud fija mediante una red neuronal única de predicción del siguiente fotograma. Esto significa que, incluso cuando se generan vídeos largos, los requisitos de memoria de vídeo...
hace 3 meses
0969
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: OpenAI lanza un asistente de programación de IA en línea de comandos de terminal

Introducción general OpenAI Codex CLI es una herramienta de codificación de terminal de código abierto, desarrollada por OpenAI, diseñada para desarrolladores acostumbrados a los terminales. Genera código, edita archivos, ejecuta comandos e integra el control de versiones Git a través de comandos en lenguaje natural.Cod...
hace 4 meses
01.2K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: una herramienta de generación de vídeo de código abierto para optimizar la coherencia de los rostros

Introducción general Open-Sora es un proyecto de código abierto diseñado para permitir a cualquiera generar vídeos de alta calidad de forma eficiente. Está desarrollado por el equipo hpcaitech para proporcionar herramientas para generar vídeo a partir de texto o imágenes, soportando múltiples resoluciones y duraciones. El proyecto es completamente de código abierto, con pesos de modelo público...
hace 4 meses
0914
OneLine:生成热点事件时间轴的AI工具

OneLine: una herramienta de IA para generar cronologías de acontecimientos candentes

Introducción general OneLine es una herramienta de código abierto para generar cronologías de eventos alojada en GitHub y desarrollada por el usuario chengtx809. Genera rápidamente una línea de tiempo de eventos por palabras clave introducidas por el usuario, mostrando la hora, título, descripción y personas relacionadas del evento....
hace 4 meses
0990
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: una plataforma de chat de código abierto para interactuar con personajes de IA personalizados

Introducción general Agnai Chat es una plataforma de chat de IA de código abierto que permite a los usuarios crear personajes de IA personalizados para la interacción individual o multijugador. Es compatible con una amplia gama de servicios de IA, incluyendo OpenAI, Claude, Kobold, etc., y es adecuado para el entretenimiento, juegos de rol, educación o...
hace 4 meses
01.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: una plataforma inteligente de preguntas y respuestas basada en grafos de conocimiento

Yuxi-Know es una plataforma inteligente de preguntas y respuestas de código abierto que combina el grafo de conocimiento y la tecnología RAG (Retrieval Augmented Generation) para ayudar a los usuarios a obtener rápidamente respuestas precisas. Se basa en Neo4j para almacenar el grafo de conocimiento , utilizando FastAPI y VueJS estructura...
hace 4 meses
01.2K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: herramienta de código abierto para extraer y consultar los registros de chat de WeChat

Introducción General Chatlog es una herramienta de código abierto que se centra en la extracción y consulta de registros de chat de la base de datos local de WeChat. Es compatible con las versiones 3.x y 4.0 de WeChat, tanto para sistemas Windows como macOS. Los usuarios pueden utilizar la línea de comandos, la interfaz de terminal o H...
hace 4 meses
01.5K
VOP:提取复杂图表与数学公式的OCR工具

VOP: herramienta de OCR para extraer diagramas complejos y fórmulas matemáticas

Introducción completa Versatile OCR Program es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto diseñada para trabajar con documentos académicos y educativos complejos. Puede extraer texto, tablas, fórmulas matemáticas, diagramas y esquemas de PDF, imágenes y otros documentos y generar...
hace 4 meses
01.2K
self.so:一键生成精美的个人简历网页

self.so: ¡Genera una bonita página de CV con un solo clic!

Introducción general self.so es una herramienta de código abierto diseñada para convertir rápidamente un CV o un perfil de LinkedIn en un sitio web personal. Los usuarios simplemente cargan un CV en PDF o introducen un enlace de LinkedIn, y el sistema lo convierte en un sitio web personal utilizando tecnología de IA (basada en Tog...
hace 4 meses
01.2K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes

Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
hace 4 meses
01.4K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: carga de wireframes para generar código front-end basado en Llama4

Introducción general Napkins.dev es un proyecto libre de código abierto, la función principal es permitir a los usuarios subir capturas de pantalla de interfaz o wireframes para generar automáticamente código front-end ejecutable. Los usuarios sólo tienen que proporcionar un dibujo de diseño , la herramienta será a través del modelo Llama 4 ( por Juntos ...
hace 4 meses
01K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: análisis de los flujos de trabajo y los riesgos de seguridad de AI Intelligentsia

Introducción general Agent-Wiz es una herramienta de línea de comandos Python de código abierto diseñada para desarrolladores, investigadores y equipos de seguridad. Puede extraer flujos de trabajo complejos de los principales marcos de inteligencia artificial como LangGraph, CrewAI, AutoGen, etc., para generar...
hace 4 meses
0848
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi

Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
hace 4 meses
0875
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: herramienta de renderizado para generar vídeos multivista a partir de un único vídeo

Introducción general ReCamMaster es una herramienta de procesamiento de vídeo de código abierto, cuya función principal es generar nuevas vistas de cámara a partir de un único vídeo. Los usuarios pueden especificar la pista de la cámara y volver a renderizar el vídeo para obtener una imagen dinámica con diferentes ángulos. Está desarrollado por un equipo de la Universidad de Zhejiang y Racer Technology, basado en...
hace 4 meses
01.1K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad

Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...
hace 4 meses
01.1K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: una herramienta de IA para analizar las relaciones entre los personajes de un libro y generar gráficos

Introducción general Austen es una herramienta de IA de código abierto que utiliza el framework Angular y la inicialización Analogjs, combinados con la tecnología Mermaidjs para generar gráficos que ayudan a los usuarios a analizar las relaciones entre personajes en los libros. Los usuarios pueden...
hace 4 meses
01.1K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: herramientas de código abierto para la ampliación y el suavizado de imágenes de cualquier tamaño

Introducción general Thera es una herramienta de superresolución de imágenes de código abierto desarrollada por un equipo de la ETH de Zúrich y la Universidad de Zúrich. Puede ampliar imágenes de baja resolución a escalas arbitrarias, como 2x, 3,14x o incluso múltiplos no enteros, y poner...
hace 4 meses
0957
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lanza un protocolo abierto para la comunicación entre inteligencias artificiales

Introducción general A2A (Agent2Agent) es un protocolo de código abierto desarrollado por Google para permitir que las inteligencias artificiales desarrolladas por diferentes marcos o proveedores se comuniquen y colaboren entre sí. Proporciona un conjunto estandarizado de métodos para que las inteligencias descubran las capacidades de las demás, compartan tareas y completen el trabajo....
hace 4 meses
01.3K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 4 meses
01.2K
LM Speed:快速测试大模型API性能

LM Speed: Pruebas rápidas de rendimiento de API de modelos grandes

Introducción general LM Speed es una herramienta diseñada específicamente para desarrolladores de IA, y también está disponible como servicio en línea en lmspeed.net Su función principal es probar y analizar el rendimiento de las API de modelos lingüísticos, ayudando a los usuarios a identificar rápidamente los cuellos de botella de velocidad y optimizar las estrategias de llamada. Esta...
hace 4 meses
01.1K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: un servicio MCP para rastrear y organizar rápidamente la documentación técnica

Introducción general DevDocs es una herramienta de código abierto completamente gratuita desarrollada por el equipo CyberAGI y alojada en GitHub. Diseñada para programadores y desarrolladores de software, parte de la URL de un documento técnico, rastrea automáticamente las páginas relevantes y las organiza en un conciso ma...
hace 4 meses
01.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: una herramienta inteligente para automatizar las pruebas de software mediante IA

Introducción general TestDriver es un sitio web que utiliza tecnología de inteligencia artificial para ayudar a los desarrolladores a probar software. Automatiza la tarea de probar software simulando acciones humanas, como hacer clic con el ratón o teclear texto. En el corazón del sitio hay un "ordenador que utiliza un agente de IA" que funciona como una persona real...
hace 4 meses
0935
自动解析PDF内容并提取文字与表格的开源服务

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...
hace 4 meses
0998
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: reconocimiento de lenguas asiáticas y modelización de voz a texto para lenguas asiáticas

Introducción general Dolphin es un modelo de código abierto desarrollado por DataoceanAI y la Universidad de Tsinghua, centrado en el reconocimiento del habla y del lenguaje para las lenguas asiáticas. Es compatible con 40 lenguas de Asia Oriental, Asia Meridional, Asia Sudoriental y Oriente Medio, así como con 22 dialectos chinos...
hace 4 meses
01K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 4 meses
01.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 4 meses
01.2K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 4 meses
01.5K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 2 meses
01.6K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 4 meses
01.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA motriz basada en el aprendizaje por refuerzo para estudiar problemas complejos

Introducción general DeepResearcher es un proyecto de código abierto desarrollado por el equipo GAIR-NLP de la Universidad Jiao Tong de Shanghai. Se trata de una herramienta de investigación inteligente basada en grandes modelos lingüísticos (LLM), entrenados de principio a fin en entornos web reales mediante aprendizaje por refuerzo (RL). El proyecto ...
hace 4 meses
0890
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: una herramienta de código abierto para generar vídeos de anime e interacciones de personajes con comandos lingüísticos

AnimeGamer es una herramienta de código abierto del ARC Lab de Tencent. Los usuarios pueden generar vídeos de anime con comandos lingüísticos sencillos, como "Sousuke conduce en un coche morado", así como permitir que diferentes personajes de anime interactúen entre sí, como Kiki de Magical Girl's Adventure y Sky City....
hace 4 meses
01.2K