Proyecto AI de código abierto

Total 1020 artículos
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: Herramienta de gestión de bases de datos para SQL inteligente y generación de informes de datos

Introducción general Chat2DB es una herramienta de gestión de bases de datos y cliente SQL de código abierto desarrollada por el equipo CodePhiliaX , integrada con funcionalidad AI , soporte para escribir rápidamente consultas SQL , gestión de bases de datos , generación de informes de datos e interacción multi-base de datos . Soporta más de 16...
hace 10 meses
056.8K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: proyecto de código abierto que permite a la IA manejar ordenadores a distancia y controlarlos mediante lenguaje natural

Introducción general NeoAI es una innovadora herramienta de código abierto AI asistente que permite a los usuarios controlar y gestionar fácilmente sus ordenadores a través del diálogo en lenguaje natural. Sin escribir ningún código, los usuarios pueden hacer la búsqueda de archivos, automatización de tareas, gestión de dispositivos y mucho más con sólo el diálogo diario.NeoAI...
hace 1 año
056.8K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: un marco de colaboración multiinteligencia para la creación de equipos de desarrollo de software de IA para la programación en lenguaje natural

Introducción exhaustiva MetaGPT es un innovador marco de trabajo para organismos multiinteligencia diseñado para simular el funcionamiento de una empresa de software de IA completa. Creado por geekan (Alexander Wu), el objetivo del proyecto es combinar modelos GPT con diferentes roles en una entidad colaborativa....
hace 10 meses
056.8K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: un modelo de lenguaje visual experto para la comprensión multimodal avanzada

Introducción exhaustiva DeepSeek-VL2 es una serie de modelos avanzados de lenguaje visual Mixture-of-Experts (MoE) que mejoran significativamente el rendimiento de su predecesor, DeepSeek-VL. Los modelos son útiles en preguntas y respuestas visuales, reconocimiento óptico de caracteres,...
hace 11 meses
056.7K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: cargue una imagen y migre las funciones de retrato para generar diferentes estilos de imágenes

Introducción completa InstantID es una tecnología avanzada centrada en la generación de imágenes con estilos o poses personalizados en cuestión de segundos, al tiempo que garantiza un alto nivel de fidelidad utilizando una única imagen de identificación de referencia. La tecnología utiliza una solución basada en un modelo de difusión mediante la integración de imágenes faciales, mapas de puntos de referencia...
hace 1 año
056.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalación con un solo clic de modelos de inteligencia artificial e interfaces de chat en ordenadores personales (con DeepSeek)

Introducción general AingDesk es un software de código abierto y gratuito diseñado para ayudar a los usuarios a implementar y ejecutar fácilmente varios modelos de IA en sus ordenadores locales. Ya se trate de un modelo DeepSeek o Llama, AingDesk permite una sencilla...
hace 11 meses
056.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: un asistente de código de IA de código abierto que se integra con VS Code y personaliza modelos e incrustaciones.

Introducción general Continue es un asistente de código de IA de código abierto diseñado para mejorar la eficiencia de los desarrolladores de software. Sus principales características incluyen autocompletado de código, optimización de código y sugerencias inteligentes de código para VS Code y JetBrains IDEs.Continue hace...
hace 11 meses
056.2K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: API automatizada de navegación web para crear inteligencia y aplicaciones que controlen el funcionamiento del navegador.

Introducción general Steel Browser es una API de navegador de código abierto diseñada para agentes y aplicaciones de IA. Proporciona una instancia de navegador completa que permite a los usuarios automatizar operaciones web sin preocuparse por la infraestructura.Steel Browser soporta...
hace 1 año
056.1K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: una herramienta de inteligencia artificial que ayuda a leer y analizar trabajos académicos

Introducción general Mad Professor (Grumpy Professor Reads Papers) es una herramienta académica de IA de código abierto diseñada para que investigadores y estudiantes simplifiquen la lectura y el análisis de documentos académicos. Integra procesamiento PDF, traducción IA, recuperación RAG, preguntas IA...
hace 8 meses
056.1K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelado lingüístico multimodal MNN para Android

Introducción exhaustiva MNN (Mobile Neural Network) es un marco de aprendizaje profundo eficiente y ligero desarrollado por Alibaba y optimizado para dispositivos móviles.MNN no solo es capaz de realizar inferencias rápidas en dispositivos móviles, sino que también admite tareas multimodales, incluida la generación de texto....
hace 12 meses
056.1K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google lanza un protocolo abierto para la comunicación entre inteligencias artificiales

Introducción general A2A (Agent2Agent) es un protocolo de código abierto desarrollado por Google para permitir que las inteligencias artificiales desarrolladas por diferentes marcos o proveedores se comuniquen y colaboren entre sí. Proporciona un conjunto estandarizado de métodos para que las inteligencias descubran las capacidades de las demás, compartan tareas y completen el trabajo....
hace 9 meses
055.8K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: herramienta de clonación de voz multilingüe y sin muestras basada en xtts_v2 para Windows.

Descripción general Clone Voice es una herramienta de clonación de sonido de código abierto que proporciona una interfaz basada en web que permite a los usuarios clonar voces utilizando cualquier sonido o grabación de voz personal. La herramienta es fácil de usar, incluso sin una GPU NVIDIA, y se puede utilizar con una aplicación precompilada...
hace 1 año
055.8K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: restauración facial de imágenes y vídeos, restauración de fotos antiguas, ofrece una versión de despliegue con un solo clic

CodeFormer Introducción general CodeFormer es un código base para la reparación robusta de rostros ciegos, desarrollado por un equipo de investigadores del S-Lab de la Universidad Tecnológica de Nanyang y presentado en NeurIPS 2022. El proyecto utiliza un transformador de búsqueda de c...
hace 1 año
055.8K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: herramienta gratuita de IA basada en el paquete Pollinations.

Introducción general FreeAI es una plataforma de aplicaciones de IA de código abierto basada en la API Pollinations.AI, que proporciona servicios gratuitos e ilimitados de asistentes de chat de IA, generación de imágenes y síntesis de voz. El proyecto fue iniciado por el desarrollador Azad-sl en G...
hace 9 meses
055.7K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): plataforma de código abierto para crear y gestionar grafos de conocimiento, con soporte nativo para aplicaciones RAG.

Introducción Knowledge Graph Studio (KGS) es una plataforma de código abierto diseñada para simplificar el proceso de creación y gestión de grafos de conocimiento nativos de RAG. La plataforma ofrece resolución de entidades basada en reglas, construcción modular de grafos,...
hace 1 año
055.5K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: el asistente inteligente de código abierto de LangChain para la investigación profunda

Introducción exhaustiva Open Deep Research es un asistente de investigación basado en web capaz de generar informes de investigación exhaustivos sobre cualquier tema. El sistema utiliza un flujo de trabajo de "planificar y hacer" que permite a los usuarios planificar y revisar la estructura del informe antes de pasar a la fase de investigación, que lleva mucho tiempo...
hace 10 meses
055.5K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: un marco de flujo de trabajo de código abierto de IA que integra muchas palabras clave para gestionar eficazmente una variedad de transacciones.

Introducción general Fabric es un marco de IA de código abierto desarrollado por Daniel Miessler para simplificar y automatizar las tareas informáticas cotidianas y facilitar el uso de la inteligencia artificial. Ayuda a los usuarios de forma eficiente a través de un diseño modular y de palabras clave predefinidas (Patrones)...
hace 1 año
055.4K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversión de imágenes a Markdown, modelo visual OCR de alta precisión

Introducción general Zerox es un proyecto de código abierto diseñado para convertir PDF, DOCX, imágenes y otros documentos a formato Markdown a través de modelos visuales. El proyecto ha sido desarrollado por el equipo getomni-ai y proporciona una solución OCR (Reconocimiento Óptico de Caracteres) sencilla y eficiente.
hace 12 meses
055.3K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 11 meses
055.1K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Introducción general ChatFree es un proyecto de código abierto que pretende liberar las aplicaciones de IA de los usuarios de las limitaciones de los navegadores para que se ejecuten localmente. Creado utilizando la API GPT, Copilot está diseñado para soportar una amplia gama de software ofimático como Office, Word, WPS, etc. El proyecto fue desarrollado por ...
hace 1 año
055K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: modelo de generación de activos 3D desarrollado por Microsoft, compatible con múltiples formatos y de edición flexible.

Introducción general TRELLIS es un modelo de generación de activos 3D a gran escala desarrollado por Microsoft. Es capaz de recibir indicaciones de texto o imágenes y generar activos 3D de alta calidad en diversos formatos, como campos radiales, gaussianos 3D y mallas.
hace 1 año
054.9K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Asistente de Código Inteligente Contextualizado, Generación y Modificación de Código, Soporte Multi-IDE

Introducción general J.A.R.V.I.S. (Just A Rather Very Intelligent System) es un asistente de código inteligente diseñado para ayudar a los desarrolladores en la generación, modificación y discusión técnica de código utilizando múltiples modelos de lenguaje de última generación....
hace 1 año
054.7K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de AI IDEs mediante herramientas de automatización (por ejemplo, Cursor y Windsurf)

Descripción general AI Auto Free es una potente herramienta de automatización diseñada para ayudar a los usuarios a hacer un uso ilimitado de los Entornos de Desarrollo Integrado (IDE) basados en IA, como Cursor y Windsurf. El proyecto ofrece soporte multiplataforma e incluye múltiples funciones de lenguaje...
hace 12 meses
054.7K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: Herramienta especial para convertir archivos PPTX a Markdown

Introducción general PPTX2MD es una herramienta de código abierto diseñada para convertir archivos PPTX de PowerPoint al formato Markdown. Desarrollada por el usuario de GitHub ssine, la herramienta permite conservar los encabezados, las listas, el formato del texto (por ejemplo, negrita, cursiva, colores y super...
hace 11 meses
054.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): control mágico de la iluminación de la imagen, controla la luz y la sombra de la imagen y el fondo

Introducción general IC-Light es un proyecto para el control de la iluminación de imágenes que pretende manipular los efectos lumínicos de las imágenes mediante modelos avanzados de IA. Desarrollado por Lvmin Zhang et al, el proyecto ofrece dos modelos principales: un modelo de reiluminación condicional al texto y un modelo condicional al fondo. Los usuarios pueden pasar...
hace 1 año
054.7K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: un marco de inteligencia colaborativa multirol para simplificar tareas complejas

Introducción exhaustiva CrewAI es un marco avanzado diseñado para orquestar la colaboración entre agentes de rol y de IA autónoma. Al facilitar la inteligencia colaborativa, CrewAI permite a los agentes trabajar juntos sin problemas para resolver tareas complejas. Tanto si está creando una plataforma de asistente inteligente, automatizando equipos de atención al cliente o...
hace 1 año
054.6K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de inteligencia artificial.

Introducción general Mem0 (pronunciado "mem-zero") es un proyecto de código abierto que proporciona una capa de memoria inteligente para asistentes y agentes de IA. Recuerda las preferencias del usuario, se adapta a las necesidades individuales y mejora con el tiempo, por lo que es ideal para chatbots asistidos por el cliente, asistentes de IA y sistemas autónomos....
hace 1 año
054.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodales de código abierto para el tratamiento de imágenes, vídeos y textos

Introducción integral InternVL es un proyecto de big model multimodal de código abierto desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai (OpenGVLab) y alojado en GitHub. Integra capacidades de procesamiento visual y lingüístico para apoyar la comprensión integral y la generación de imágenes, vídeos y textos.En...
hace 9 meses
054.6K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): generación de activos 3D de alta resolución, múltiples flujos de trabajo de generación de materiales 3D

Introducción Tencent Hunyuan3D (Hunyuan3D 2.0) es un avanzado sistema de composición 3D a gran escala de Tencent diseñado para generar activos 3D texturizados de alta resolución. El sistema consta de dos componentes principales: Hunyuan3D-DiT, un modelo de generación de formas a gran escala, y Hunyuan3D-DiT, un...
hace 12 meses
054.4K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: un organismo inteligente para mejorar la eficacia del análisis de datos financieros y la investigación de inversiones

Introducción exhaustiva FinRobot es una plataforma de inteligencia de IA de código abierto desarrollada por AI4Finance Foundation y diseñada para el análisis financiero. No solo abarca los modelos lingüísticos tradicionales, sino que también incorpora diversas tecnologías de IA, con el objetivo de ofrecer una solución integral para el sector financiero.F...
hace 11 meses
054.4K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: Permite que la IA controle directamente tu ordenador, una implementación de código abierto del ordenador de control de Claude.

Introducción general Agent.exe es una aplicación Electron de código abierto que utiliza la API Sonnet Claude 3.5 de Anthropic para permitir a los usuarios controlar su ordenador local directamente a través de la IA. El proyecto fue desarrollado por K...
hace 1 año
054.2K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: un marco de código abierto para que los cuerpos inteligentes manejen los ordenadores como humanos

Introducción general Agent S es un marco de código abierto desarrollado por Simular AI que permite a las inteligencias manejar ordenadores como si fueran humanos a través de una interfaz gráfica de usuario (GUI). Utiliza un gran modelo de lenguaje multimodal y técnicas de aprendizaje empírico para realizar tareas como navegar por la web, editar documentos, utilizar software...
hace 9 meses
054.1K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 10 meses
054.1K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Esquemas: genera salidas de texto estructurado mediante expresiones regulares, JSON o modelos Pydantic.

Introducción general Outlines es una biblioteca de código abierto desarrollada por dottxt-ai para mejorar la aplicación de Large Language Models (LLMs) a través de la generación de texto estructurado. La biblioteca admite diversas integraciones de modelos, como OpenAI, transformadores...
hace 11 meses
053.9K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: motor de rendimiento para la inferencia de grandes modelos: aceleración extrema, potenciación flexible

KTransformers: Un framework Python de alto rendimiento para romper el cuello de botella de la inferencia de grandes modelos. Es más que una simple herramienta de ejecución de modelos, es un conjunto de motores de optimización de rendimiento extremo y una plataforma flexible de potenciación de interfaces. KTransf...
hace 11 meses
053.7K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: Monitoriza las actividades de los usuarios de OpenWebUI, gestiona los límites de uso, soporta el despliegue con un solo clic.

Introducción General OpenWebUI-Monitor es un panel de control para monitorizar las actividades de los usuarios de OpenWebUI y gestionar las cuotas de uso. Te permite establecer eficientemente cuotas de usuario, ver datos de usuario e información visual en tiempo real, soporta despliegue con un clic, y facilita la gestión y monitorización de usuarios....
hace 1 año
053.7K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: una herramienta de código abierto para editar imágenes con instrucciones de lenguaje natural

Introducción general Step1X-Edit es un marco de edición de imágenes de código abierto desarrollado por el equipo Stepfun AI y alojado en GitHub. Combina un modelo de lenguaje multimodal de gran tamaño (Qwen-VL) y un transformador de difusión (DiT) para permitir a los usuarios crear imágenes a través de un...
hace 8 meses
053.6K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): proyecto de código abierto que imita a Perplexity, integrando diálogo AI, búsqueda web, consulta meteorológica, etc.

Introducción general MiniPerplx (rebautizado Scira) es un motor de búsqueda minimalista basado en IA que integra una variedad de características útiles para proporcionar a los usuarios una gama completa de servicios de recuperación de información. El proyecto utiliza una moderna pila tecnológica que incluye Next.js, Tailwi...
hace 1 año
053.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Las imágenes de retratos con audio generan vídeos de demostración digitales con expresiones faciales vivas

Introducción general Sonic es una innovadora plataforma centrada en la percepción global del audio y diseñada para generar vívidas animaciones de retratos controladas por audio. Desarrollada por un equipo de investigadores de Tencent y la Universidad de Zhejiang, la plataforma utiliza información de audio para controlar las expresiones faciales y los movimientos de la cabeza con el fin de generar vídeos animados naturales y fluidos.S...
hace 10 meses
053.6K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Conversión de voz basada en recuperación WebUI: un marco para la conversión de voz basada en recuperación | Simulación de voces cantadas en la vida real

WebUI de conversión de voz basado en VITS es un marco de conversión de voz basado en VITS fácil de usar que permite la conversión de voz entre cualquier altavoz, incluyendo covers de canciones y cambios de voz en tiempo real. Tiene bajo ...
hace 1 año
053.6K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: modificación de código abierto basada en Bolt.new, herramientas de desarrollo de pila completa basadas en IA.

Descripción general multi-model-bolt.new es una versión modificada de Bolt.new que permite el uso de modelos TogetherAI, soportando características como el despliegue, la respuesta móvil y la entrada de voz. Los usuarios pueden ser solicitados directamente en el navegador, ejecutar...
hace 1 año
053.5K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: generación de imágenes en tiempo real escribiendo palabras clave (acceso gratuito al modelo Flux Schnell)

Descripción general BlinkShot es un generador de imágenes de IA en tiempo real de código abierto que utiliza la tecnología Together AI y Flux Schnell para permitir a los usuarios generar imágenes de alta calidad a medida que introducen indicaciones. La plataforma es completamente gratuita y admite la personalización del usuario y...
hace 1 año
053.5K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: la clásica herramienta de código abierto para colorear fotos y vídeos en blanco y negro mediante técnicas de IA

Introducción exhaustiva DeOldify es un proyecto de código abierto basado en tecnología de aprendizaje profundo dedicado a la coloración y restauración inteligente de fotos y vídeos en blanco y negro. El proyecto utiliza un innovador método de entrenamiento NoGAN para resolver con éxito los defectos comunes de las redes GAN tradicionales en el proceso de coloreado de imágenes....
hace 1 año
053.5K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: un modelo de conversión de texto en habla de código abierto para la generación y clonación de habla de alta calidad

Introducción general Llasa-3B es un modelo de conversión de texto a voz (TTS) de código abierto desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong (HKUST Audio). El modelo se basa en la arquitectura Llama 3.2B, que ha sido cuidadosamente ajustada para proporcionar una generación de voz de alta calidad que no sólo soporta múltiples...
hace 11 meses
053.4K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: asistente de clonación de voz de IA de extremo a extremo, asistente de diálogo de voz en tiempo real, proyecto derivado de Fish Speech

Introducción exhaustiva Fish Speech Derivative Project Fish Agent es un revolucionario sistema de clonación del habla AI de extremo a extremo desarrollado en base a la arquitectura modelo V0.1 3B. Como sistema de procesamiento de clonación del habla de extremo a extremo, su característica más importante es el uso de...
hace 1 año
053.3K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot: sistema de conducción autónoma de código abierto, hazte tu propio sistema de conducción inteligente para tu coche

Introducción general OpenPilot es un sistema de conducción autónoma de código abierto desarrollado por comma.ai para mejorar la experiencia de conducción y la seguridad de los vehículos existentes con funciones avanzadas de asistencia al conductor. Desde su primer lanzamiento en 2016, OpenPilot ha dado soporte a más de 2...
hace 11 meses
053.3K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: proyecto de código abierto de reparación de imágenes dañadas y zoom de alta definición, mínimo 16G de memoria de vídeo

Descripción general InstantIR es un innovador modelo de restauración de una sola imagen desarrollado por el equipo de InstantX, diseñado para resucitar sus imágenes dañadas con detalles de gran calidad y realismo, capaz de realizar una restauración de alta calidad de imágenes dañadas. La herramienta no sólo restaura los detalles de la imagen...
hace 1 año
053.2K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: bot de WeChat para inserción de noticias, diálogo con inteligencia artificial y gestión de grupos de chat

Introducción completa NGCBot es un mecanismo HOOK basado en el desarrollo de WeChat robot proyecto de código abierto , creado por el desarrollador ngc660sec (Yunshan/eXM) y alojado en GitHub Después de dos años de iteración , la versión actual de V2.3 , la función de la inicial simple ...
hace 10 meses
053K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar

Introducción general Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). El proyecto fue desarrollado por Cinnamon y soporta una variedad de proveedores de API LLM (por ejemplo, OpenA...
hace 1 año
053K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: una herramienta automatizada de I+D basada en datos que facilita los procesos de I+D basados en datos mediante tecnología de IA.

Introducción general RD-Agent es una herramienta de código abierto de Microsoft diseñada para automatizar y optimizar el proceso de investigación y desarrollo (I+D). La herramienta se centra en escenarios basados en datos para mejorar la eficacia del desarrollo de modelos y datos mediante técnicas de inteligencia artificial.RD-Agent integra la investigación...
hace 10 meses
053K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: herramienta de conversión de voz en subtítulos, cliente ligero con interfaces integradas para Cutscene, Racer y Must-Cut.

Introducción completa AsrTools es una herramienta inteligente de voz a texto con interfaces incorporadas de grandes jugadores como Cutscene, QuickScope y MustScope, que soporta procesamiento por lotes multihilo eficiente sin necesidad de GPU o configuraciones tediosas. Se basa en el desarrollo PyQt5, interfaz hermosa y fácil de usar, capaz de salida SRT y TXT palabras de formato ...
hace 1 año
052.9K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 9 meses
052.9K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

No estructurados: preprocesamiento de documentos no estructurados de código abierto, herramientas de tratamiento de datos no estructurados

Introducción completa Unstructured-IO proporciona un conjunto de componentes de código abierto para el procesamiento y preprocesamiento de imágenes y documentos de texto como PDF, HTML, documentos de Word, etc. Su principal objetivo es simplificar y optimizar los flujos de trabajo de procesamiento de datos, especialmente para grandes modelos de lenguaje (LL...
hace 1 año
052.7K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: ejecución local de macromodelos de IA en el escritorio y gestión de una base de conocimientos privada

Introducción general Klee es una aplicación de escritorio de código abierto diseñada para ayudar a los usuarios a ejecutar localmente grandes modelos lingüísticos (LLM) de código abierto con gestión privada y segura de bases de conocimiento y capacidades de toma de notas Markdown. Se basa en las tecnologías Ollama y LlamaIndex...
hace 10 meses
052.7K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: modelo de aprendizaje profundo para eliminar rápidamente el fondo de imágenes y vídeos

Introducción exhaustiva BEN2 (Background Erase Network 2) es un modelo de aprendizaje profundo desarrollado por Prama LLC específicamente diseñado para eliminar automáticamente el fondo de una imagen y generar una imagen en primer plano. El modelo utiliza un innovador algoritmo de Confiden...
hace 7 meses
052.6K
Dia:生成超现实多人对话的文本转语音模型

Dia: un modelo texto-voz para generar diálogos multijugador hiperrealistas

Introducción general Dia es un modelo de texto a voz (TTS) de código abierto desarrollado por Nari Labs y centrado en la generación de audio de diálogo hiperrealista. Transforma guiones de texto en diálogos realistas de varios caracteres en un solo proceso, admite el control de emociones y entonación, e incluso genera representaciones no verbales....
hace 9 meses
052.6K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: herramienta asistente de programación de código abierto, utiliza el asistente de IA para escribir código y editar archivos.

Introducción general Aider es una potente herramienta de código abierto que ayuda a los desarrolladores a escribir, editar y refactorizar código a través del diálogo en lenguaje natural. Como herramienta interactiva de programación por pares de IA, Aider es compatible con muchos de los principales lenguajes de programación y puede integrarse perfectamente en Git....
hace 9 meses
052.6K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 11 meses
052.5K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente asistente inteligente de chat en grupo de WeChat para Windows

Introducción integral WeChatAI es un chat de grupo WeChat basado en Python y asistente inteligente personal, que soporta una variedad de grandes modelos de lenguaje (como DeepSeek, Gemini, Tongyi Thousand Questions), que puede lograr el diálogo inteligente, auto-respuesta y otras funciones. El proyecto utiliza ...
hace 11 meses
052.4K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: inteligencias de programación escalables de código abierto que automatizan tareas de programación de procesos completos.

Introducción general Goose es una herramienta de agente de IA de código abierto desarrollada por Block, Inc. diseñada para ayudar a los desarrolladores a automatizar las tareas de desarrollo cotidianas. Es compatible con una amplia gama de modelos de lenguaje de gran tamaño (LLM) e interactúa con los usuarios a través de la línea de comandos o interfaces de aplicaciones de escritorio.Goose puede realizar una amplia gama de tareas de agente...
hace 12 meses
052.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de código abierto para pizarras de lienzo ilimitadas, AI para generar wireframes minimalistas y diagramas UML.

Descripción general tldraw es una herramienta de dibujo colaborativo gratuita e instantánea que proporciona un lienzo ilimitado donde los usuarios pueden dibujar gráficos rápidamente, escribir texto y colaborar al instante. Con una interfaz intuitiva y un rendimiento excelente, es adecuada para la colaboración en equipo y el trabajo remoto. Apoyado por la comunidad de código abierto, tldr...
hace 1 año
052.3K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

La IA lee libros: la IA lee libros en PDF página por página, extrae automáticamente los puntos clave del conocimiento y genera resúmenes.

Introducción completa AI-reads-books-page-by-page es un desarrollo basado en Python de la herramienta inteligente de análisis de libros PDF, que puede automatizar el análisis página por página de libros PDF, extraer los puntos clave de conocimiento, y después del intervalo de página especificado para generar etapa...
hace 1 año
052.3K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Asistente de corrección de la pronunciación en inglés

Introducción general Gemini Teacher es un asistente para practicar la pronunciación en inglés basado en la IA Gemini de Google. Reconoce la pronunciación inglesa del usuario en tiempo real y proporciona sugerencias de corrección y comentarios instantáneos. La herramienta está diseñada para ayudar a los usuarios a...
hace 11 meses
052.2K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI Chatbot Supabase: código abierto Next.js y Supabase construyeron AI chatbot para un rápido despliegue en Vercel.

Introducción general AI Chatbot Supabase es una plantilla de chatbot AI de código abierto construida sobre Next.js y Supabase. Desarrollado por Vercel, el proyecto tiene como objetivo proporcionar una solución de chatbot totalmente funcional y personalizable. Por ...
hace 1 año
052.2K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: un marco basado en Qwen para aplicaciones de agentes inteligentes, que incluye llamadas a herramientas, intérpretes de código, RAG y extensiones de Chrome.

Introducción completa Qwen-Agent es un marco de aplicación de agente inteligente desarrollado sobre la base de Qwen 2.0 y superiores, con capacidades tales como seguimiento de comandos, uso de herramientas, planificación y memoria. El marco proporciona una variedad de aplicaciones de ejemplo como asistentes de navegador, intérpretes de código y asistentes personalizados....
hace 1 año
052K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: robot de mensajería instantánea de código abierto de modelo grande, compatible con múltiples WeChat, QQ, Flybook y otros despliegues multiplataforma de robots de IA.

LangBot es una plataforma bot de mensajería instantánea basada en modelos de gran tamaño que admite múltiples plataformas de mensajería y modelos de gran tamaño. La plataforma se adapta a QQ, WeChat (WeChat empresarial, WeChat personal), Flybook, Discord, OneBot y otras plataformas de mensajería, y es compatible con Open...
hace 11 meses
052K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: herramienta de traducción de vídeo multifuncional de código abierto, transcripción y traducción de voz a varios idiomas, instalación de Windows con un solo clic.

Introducción general Voice-Pro es una herramienta versátil basada en Gradio WebUI que admite voz a texto, texto a voz, traducción en tiempo real, descarga de vídeos de YouTube y separación de voz humana. Integra Whisper, Faster-Wh...
hace 1 año
051.9K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端

FlowDown: una experiencia de cliente de IA fluida para iOS/macOS

Introducción general FlowDown-App es un cliente de diálogo AI ligero y eficiente, desarrollado por un equipo de desarrolladores utilizando Swift y UIKit, con el objetivo de proporcionar a los usuarios una experiencia de diálogo inteligente rápida y sin problemas. La aplicación se divide en una versión estándar (FlowDown...
hace 10 meses
051.9K