Últimos recursos sobre IA

共 2981 篇文章
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: un asistente nativo de programación de inteligencia artificial que se integra en VSCode

Introducción general Tabby es un asistente de programación de IA de código abierto desarrollado por el equipo TabbyML que los usuarios pueden desplegar ellos mismos localmente o en un servidor. Ofrece funciones similares a GitHub Copilot, como el autocompletado de código y las preguntas y respuestas...
hace 11 meses
083.9K
LM Speed:快速测试大模型API性能

LM Speed: Pruebas rápidas de rendimiento de API de modelos grandes

Introducción general LM Speed es una herramienta diseñada específicamente para desarrolladores de IA, y también está disponible como servicio en línea en lmspeed.net Su función principal es probar y analizar el rendimiento de las API de modelos lingüísticos, ayudando a los usuarios a identificar rápidamente los cuellos de botella de velocidad y optimizar las estrategias de llamada. Esta...
hace 11 meses
055.6K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: un servicio MCP para rastrear y organizar rápidamente la documentación técnica

Introducción general DevDocs es una herramienta de código abierto completamente gratuita desarrollada por el equipo CyberAGI y alojada en GitHub. Diseñada para programadores y desarrolladores de software, parte de la URL de un documento técnico, rastrea automáticamente las páginas relevantes y las organiza en un conciso ma...
hace 11 meses
053.7K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: una herramienta inteligente para automatizar las pruebas de software mediante IA

Introducción general TestDriver es un sitio web que utiliza tecnología de inteligencia artificial para ayudar a los desarrolladores a probar software. Automatiza la tarea de probar software simulando acciones humanas, como hacer clic con el ratón o teclear texto. En el corazón del sitio hay un "ordenador que utiliza un agente de IA" que funciona como una persona real...
hace 11 meses
049.2K
OpenCreator:整合多种AI模型生成创意视频

OpenCreator: integración de múltiples modelos de IA para generar vídeos creativos

Introducción general OpenCreator es una herramienta en línea diseñada para creadores con la función principal de reunir más de 20 modelos generativos de IA. Los usuarios pueden utilizarla para generar fácilmente vídeos creativos sin cambiar de plataforma ni pagar múltiples suscripciones. Tiene una interfaz sencilla y admite...
hace 11 meses
054.5K
自动解析PDF内容并提取文字与表格的开源服务

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...
hace 11 meses
054.8K
AI-Scientist-v2:自主完成科研研究与论文撰写

AI-Scientist-v2: Investigación científica autónoma y redacción de artículos

Introducción general AI-Scientist-v2 es un sistema inteligente desarrollado por la empresa japonesa SakanaAI que pretende automatizar la investigación científica de principio a fin mediante máquinas. Puede proponer ideas de investigación, diseñar experimentos, ejecutar código, analizar datos y, por último, escribir artículos científicos.2025...
hace 11 meses
081.4K
Kozy:用文字描述快速剪辑短视频的在线工具

Kozy: una herramienta en línea para editar rápidamente vídeos cortos con descripciones de texto

Kozy es una herramienta para editar rápidamente vídeos cortos con descripciones de texto. En esencia, permite a los usuarios generar vídeos cortos de aspecto profesional en cuestión de segundos con simples entradas verbales como "cortar un vídeo gracioso de una mascota". Desarrollado por Tunde Alao, el sitio se lanzará en 2025.
hace 11 meses
055.5K
Internet.io:聚合多AI模型答案的智能工作平台

Internet.io: una plataforma de trabajo inteligente para agregar respuestas de múltiples modelos de IA

Introducción general Internet.io es una plataforma inteligente que agrega respuestas de múltiples modelos de IA de primer nivel. Su objetivo es resolver el problema de que las respuestas individuales de la IA pueden ser inexactas o incoherentes. Los usuarios pueden hacer una sola pregunta y obtener respuestas de varios de los principales modelos de IA al mismo tiempo, lo que facilita la comparación...
hace 11 meses
052.7K
Exponent:在任何环境中执行自动化编程任务

Exponent: realización de tareas de programación automatizada en cualquier entorno

Introducción general Exponent es un potente agente de programación de IA diseñado para colaborar con los usuarios en cualquier tarea de ingeniería de software, desde la exploración de código hasta el despliegue final. Puede ejecutarse en entornos de desarrollo locales, operaciones terminales o procesos de Integración Continua (IC), ayudando a los usuarios con una variedad de...
hace 9 meses
045.6K
Vapi:帮助开发者快速构建低延时语音助手

Vapi: ayuda a los desarrolladores a crear rápidamente asistentes de voz de baja latencia

Introducción completa Vapi es una plataforma de IA de voz para desarrolladores. Permite a los usuarios crear, probar y desplegar asistentes de voz de IA en cuestión de minutos, resolviendo el problema del desarrollo de aplicaciones de voz tradicionales, que requiere mucho tiempo y es difícil de escalar.Vapi proporciona herramientas e infraestructura completas para soportar conversaciones en tiempo real, aplicaciones de...
hace 11 meses
066.8K
Recall:浏览网页时显示个人知识库相关信息

Recall: muestra información sobre su base de conocimientos personales cuando navega por Internet.

Comprehensive Introduction Recall es una herramienta de inteligencia artificial que mejora tu experiencia de navegación resumiendo y almacenando rápidamente páginas web, vídeos, PDF y mucho más en una base de conocimientos personal. Su función principal es ayudarte a mostrar información relevante en tiempo real mientras navegas y organizar contenidos fragmentados en una red de conocimiento ordenada. Consta de ...
hace 11 meses
051.8K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: reconocimiento de lenguas asiáticas y modelización de voz a texto para lenguas asiáticas

Introducción general Dolphin es un modelo de código abierto desarrollado por DataoceanAI y la Universidad de Tsinghua, centrado en el reconocimiento del habla y del lenguaje para las lenguas asiáticas. Es compatible con 40 lenguas de Asia Oriental, Asia Meridional, Asia Sudoriental y Oriente Medio, así como con 22 dialectos chinos...
hace 11 meses
057K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: formación de dobles digitales con registros de chat y voces de WeChat

Introducción general WeClone es un proyecto de código abierto que utiliza transcripciones de chats y mensajes de voz de WeChat, combinados con grandes modelos lingüísticos y tecnología de síntesis de voz, para permitir a los usuarios crear dobles digitales personalizados. El proyecto puede analizar los hábitos de chat del usuario para entrenar el modelo , pero también un pequeño número de muestras de voz para generar sonidos realistas...
hace 11 meses
068K
KOAH:为AI应用提供原生广告解决方案

KOAH: Soluciones de publicidad nativa para aplicaciones de IA

Introducción general KOAH es un sitio web centrado en ofrecer soluciones publicitarias para aplicaciones de IA. Está desarrollado por Koah Labs, Inc. y tiene su sede en San Francisco, California. El objetivo principal del sitio es ayudar a los desarrolladores de aplicaciones de IA a ganar dinero incrustando anuncios nativos y garantizando al mismo tiempo que la experiencia del usuario no...
hace 11 meses
052.7K
Shamaze:用自己的声音给孩子讲睡前故事

Shamaze: Cuentos infantiles para dormir con tu propia voz

Introducción general Shamaze es un sitio web que ayuda a los padres a crear cuentos personalizados para sus hijos. Utiliza tecnología de inteligencia artificial para generar historias únicas basadas en los intereses del niño, y también imita la voz de los padres para leer la historia en voz alta. Los padres sólo tienen que fijar el tema y los personajes, y Shamaze ...
hace 11 meses
052.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: una plataforma de código abierto para automatizar el cumplimiento de SOC 2, ISO 27001 y GDPR

Introducción general Comp AI es una plataforma de código abierto desarrollada por Comp AI, Inc. con sede en San Francisco, Estados Unidos. Ayuda a las organizaciones a completar rápidamente los requisitos de cumplimiento como SOC 2, ISO 27001 y GDPR a través de herramientas automatizadas, con el objetivo de varios...
hace 11 meses
068.6K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 11 meses
059.6K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: herramienta de globalización multilingüe para vídeo con traducción y doblaje en un clic

Introducción completa KrillinAI es una herramienta de procesamiento de vídeo de código abierto que se centra en el uso de la inteligencia artificial para ayudar a los usuarios a traducir vídeos y doblarlos automáticamente. Puede empezar desde la descarga del vídeo, hasta generar el producto final adaptado a diferentes plataformas, todo el proceso es cuestión de unos pocos clics. Los desarrolladores están disponibles en GitHub...
hace 9 meses
083.6K
Headshotly:快速生成职业装头像的AI工具

Headshotly: una herramienta de IA para generar rápidamente retratos profesionales

Introducción general Headshotly es una herramienta en línea que utiliza tecnología de IA para generar rápidamente retratos profesionales. Su función principal es permitir a los usuarios subir unos cuantos selfies normales, que luego son procesados por la IA para generar retratos profesionales de alta calidad. El sitio web se centra en un funcionamiento sencillo y una experiencia...
hace 11 meses
051K
Ogilvy:辅助创作高转化文案的AI写作编辑器

Ogilvy: el editor de textos con inteligencia artificial que ayuda a crear textos de alta conversión

Introducción General Ogilvy es un editor de texto diseñado para la creación de copia de alta conversión, inspirado en el gurú de la publicidad David Ogilvy.It no está destinado a escribir en lugar de usted, sino más bien para actuar como su asistente, que le ayuda a completar los proyectos de copia a la derecha en la página en blanco. Su objetivo principal es...
hace 11 meses
049.2K
CloneMyTrips:从社交媒体克隆旅行计划的AI工具

CloneMyTrips: una herramienta de IA para clonar planes de viaje de las redes sociales

Introducción general CloneMyTrips es un innovador sitio web de planificación de viajes cuya función principal es ayudar a los usuarios a extraer inspiración e itinerarios de los contenidos de viajes en las redes sociales mediante tecnología de IA. Facilita que los usuarios compartan vídeos cortos o publicaciones de sus viajes favoritos, generando automáticamente...
hace 11 meses
048.4K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: aplicación web de chat con inteligencia artificial de código abierto con carga de documentos y compatibilidad multimodelo

Introducción general Zola es una aplicación de chat de IA gratuita y de código abierto desarrollada por el desarrollador Julien Thibeaut (nombre de usuario de GitHub ibelick) y alojada en GitHub. Su mejor característica es que soporta múltiples modos de IA...
hace 11 meses
066.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: IA motriz basada en el aprendizaje por refuerzo para estudiar problemas complejos

Introducción general DeepResearcher es un proyecto de código abierto desarrollado por el equipo GAIR-NLP de la Universidad Jiao Tong de Shanghai. Se trata de una herramienta de investigación inteligente basada en grandes modelos lingüísticos (LLM), entrenados de principio a fin en entornos web reales mediante aprendizaje por refuerzo (RL). El proyecto ...
hace 11 meses
051.4K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: una herramienta de código abierto para generar vídeos de anime e interacciones de personajes con comandos lingüísticos

AnimeGamer es una herramienta de código abierto del ARC Lab de Tencent. Los usuarios pueden generar vídeos de anime con comandos lingüísticos sencillos, como "Sousuke conduce en un coche morado", así como permitir que diferentes personajes de anime interactúen entre sí, como Kiki de Magical Girl's Adventure y Sky City....
hace 11 meses
059.2K
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: un marco de código abierto para que los cuerpos inteligentes manejen los ordenadores como humanos

Introducción general Agent S es un marco de código abierto desarrollado por Simular AI que permite a las inteligencias manejar ordenadores como si fueran humanos a través de una interfaz gráfica de usuario (GUI). Utiliza un gran modelo de lenguaje multimodal y técnicas de aprendizaje empírico para realizar tareas como navegar por la web, editar documentos, utilizar software...
hace 11 meses
082.3K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: los documentos PDF se traducirán a herramientas bilingües de código abierto

Introducción general BabelDOC es una herramienta de código abierto diseñada para traducir documentos PDF a un formato bilingüe. Está desarrollado por el equipo funstory-ai , alojado en GitHub , sirviendo principalmente a la necesidad de tratar con usuarios de documentos en lenguas extranjeras , como investigadores...
hace 9 meses
099.9K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: herramienta gratuita de IA basada en el paquete Pollinations.

Introducción general FreeAI es una plataforma de aplicaciones de IA de código abierto basada en la API Pollinations.AI, que proporciona servicios gratuitos e ilimitados de asistentes de chat de IA, generación de imágenes y síntesis de voz. El proyecto fue iniciado por el desarrollador Azad-sl en G...
hace 11 meses
072.6K
Motionvid.ai:用文字或草图快速生成演示动画视频

Motionvid.ai: genera rápidamente vídeos animados para presentaciones con texto o bocetos

Introducción general Motionvid.ai es una herramienta en línea que utiliza inteligencia artificial para ayudar a los usuarios a crear rápidamente vídeos animados profesionales. Su mejor característica es generar animaciones con dinámicas suaves y efectos visuales de alta calidad en segundos a través de descripciones de texto o bocetos dibujados a mano. Los usuarios no necesitan dominar complejos...
hace 11 meses
051.8K
Viva Labs:用AI快速生成高转化率视频广告

Viva Labs: generación rápida de anuncios de vídeo de alta conversión con IA

Introducción general Viva Labs es una herramienta en línea que utiliza tecnología de IA para ayudar a los usuarios a crear rápidamente anuncios de vídeo de alta conversión. Los usuarios solo tienen que proporcionar la URL del producto, y la IA puede investigar el público objetivo, generar guiones de anuncios profesionales con avatares de IA realistas y voces en off en varios idiomas, y automatizar la...
hace 11 meses
048.2K
Langflow Desktop:Langflow桌面版客户端下载

Langflow Desktop: Descarga del cliente Langflow Desktop

Introducción general Langflow Desktop es una herramienta de escritorio que ayuda a los desarrolladores a crear rápidamente inteligencias y aplicaciones de IA. Desarrollado por el equipo de Langflow, proporciona una interfaz intuitiva que permite a los usuarios diseñar flujos de trabajo complejos con sólo arrastrar y soltar. Características principales...
hace 11 meses
054.5K
AutonomyAI:将Figma设计转化为干净的React代码

AutonomyAI: Convertir diseños Figma en código React limpio

AutonomyAI es una herramienta en línea que utiliza la inteligencia artificial para mejorar la eficiencia del desarrollo front-end. Ha sido desarrollada por un equipo cuyo principal objetivo es ayudar a los desarrolladores a convertir sus diseños en código front-end listo para producción utilizando tecnología de "agentes conscientes del contexto". El principal producto del sitio es The M...
hace 11 meses
056.4K
Supaboard:自动生成数据可视化图表的智能分析工具

Supaboard: una herramienta de análisis inteligente que genera automáticamente tablas y gráficos de visualización de datos.

Introducción general Supaboard es una plataforma de análisis de datos basada en IA diseñada para ayudar a los usuarios a transformar rápidamente datos complejos en cuadros de mando y gráficos intuitivos. Se conecta a múltiples fuentes de datos a través de operaciones sencillas y permite a los usuarios generar perspectivas de datos sin escribir código, simplemente haciendo preguntas en lenguaje natural....
hace 11 meses
060.5K
Serena:语义检索和编辑代码的免费MCP工具

Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código

Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
hace 11 meses
0175K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli

Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
hace 12 meses
051.6K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

Genspark: búsqueda en profundidad y redacción de informes de investigación basados en las inteligencias Genspark

Introducción general Genspark es una herramienta de búsqueda basada en inteligencia artificial. Fue fundada en 2023 por un antiguo ejecutivo de Baidu y tiene su sede en Palo Alto, California. Se diferencia de los motores de búsqueda tradicionales en que Genspark utiliza múltiples inteligencias de IA para generar búsquedas personalizadas en tiempo real....
hace 9 meses
077.4K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: una herramienta de código abierto para la detección de vídeo en tiempo real y la segmentación de objetos

YOLOE es un proyecto de código abierto desarrollado por el Grupo de Inteligencia Multimedia (THU-MIG) de la Escuela de Software de la Universidad de Tsinghua, cuyo nombre completo es "You Only Look Once Eye". Está basado en el framework PyTorch , pertenece a la serie de extensiones YOLO ...
hace 12 meses
067.9K
集成多种先进语音合成服务的开源运营项目

Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz

Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
hace 12 meses
055.2K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: un cliente para generar inteligencias IA locales con diálogo (prueba interna)

Introducción general Libra es una innovadora herramienta de Greenbit.ai cuya función principal es generar inteligencias IA que se ejecutan localmente a través del diálogo en lenguaje natural. Denominada "Vibe Agent", permite a los usuarios describir sus necesidades en términos sencillos y crear rápidamente...
hace 12 meses
069.3K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas

Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
hace 9 meses
054.9K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: Asistente de código inteligente para la ejecución de terminales de línea de comandos

Introducción general SuperCoder es una herramienta inteligente que se ejecuta en el terminal y está diseñada para programadores. Utiliza tecnología de IA para ayudar a los usuarios a buscar código, ver la estructura del proyecto, editar archivos y corregir errores.El proyecto es de código abierto por huytd en GitHub y soporta...
hace 12 meses
053.3K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...
hace 12 meses
060.2K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: framework de código abierto para generar vídeos de escenas arbitrarias en 3D y 4D

Introducción general GenXD es un proyecto de código abierto desarrollado por la Universidad Nacional de Singapur (NUS) y el equipo de Microsoft. Se centra en la generación de escenas arbitrarias en 3D y 4D , para resolver la generación en 3D y 4D en el mundo real debido a la insuficiencia de datos y la complejidad del diseño del modelo provocada por el problema . El proyecto fue desarrollado por ...
hace 12 meses
054.4K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: una herramienta para generar vídeos de retratos humanos digitales de medio cuerpo a partir de fotos

Introducción general ChatAnyone es un proyecto innovador desarrollado por el equipo HumanAIGC. Utiliza técnicas de inteligencia artificial para generar vídeos digitales de retratos humanos con movimientos de la parte superior del cuerpo a partir de una única foto y una entrada de audio. El proyecto se basa en un modelo jerárquico de difusión del movimiento que genera movimientos de la cabeza...
hace 12 meses
057.7K
OctoComics:用AI快速生成BL漫画的创作平台

OctoComics: una plataforma de creación para generar rápidamente cómics BL con IA

Introducción general OctoComics es una plataforma en línea que se centra en ayudar a los usuarios a generar rápidamente cómics BL con IA, al tiempo que apoya otros tipos de cómics y el intercambio de la comunidad. Los usuarios pueden introducir texto para generar cómics de temática BL, de serie original o de personajes OC con una gran variedad de estilos de dibujo....
hace 12 meses
068.6K
FluxGen:在代码编辑器中直接生成AI图像的工具

FluxGen: una herramienta para generar imágenes de IA directamente en un editor de código

Introducción general FluxGen es una herramienta de generación de imágenes de IA diseñada para desarrolladores y desarrollada por Black Forest Labs. Su función principal es permitir a los usuarios generar imágenes de alta calidad directamente en el editor de código sin cambiar a otro software de diseño. Los desarrolladores...
hace 12 meses
053.1K
Purposewrite:用AI快速生成高质量原创内容的写作工具

Purposewrite: una herramienta de redacción para generar rápidamente contenidos originales de alta calidad con IA

Descripción general Purposewrite es una herramienta de redacción en línea que utiliza inteligencia artificial para ayudar a los usuarios a generar rápidamente contenidos originales de alta calidad. Permite a los usuarios crear contenidos como blogs, correos electrónicos, textos publicitarios y mucho más en cuestión de segundos mediante sencillas operaciones. La característica principal del sitio web es que incorpora tecnología de IA para...
hace 12 meses
046.3K
Avcado AI:扫描食品标签并分析成分的健康助手

Avcado AI: un asistente de salud que escanea las etiquetas de los alimentos y analiza sus ingredientes

Descripción general Avcado AI es una herramienta inteligente que ayuda a los usuarios a comprender el contenido de los productos alimenticios. Su función principal es identificar rápidamente los ingredientes, la información nutricional y los aditivos haciendo una foto y escaneando la etiqueta del alimento. Los usuarios sólo tienen que hacer una foto de la etiqueta del envase con su teléfono móvil, y el sitio web analiza y muestra los detalles del alimento...
hace 12 meses
052.7K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: un proyecto de código abierto para entrenar a la IA a realizar acciones web con demostraciones humanas

Introducción general Optexity es un proyecto de código abierto en GitHub, desarrollado por el equipo de Optexity. Su núcleo es utilizar datos de demostración humana para entrenar a la IA a completar tareas informáticas, especialmente operaciones de páginas web. El proyecto contiene tres bibliotecas de código: Compute...
hace 12 meses
057.1K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: búsqueda profunda y razonamiento por pasos para responder a preguntas complejas

Descripción general II-Researcher es una herramienta de investigación de IA de código abierto desarrollada por el equipo Intelligent-Internet y alojada en GitHub.Está diseñada para la búsqueda profunda y el razonamiento complejo, con la capacidad de buscar a través de páginas web inteligentes y sub...
hace 12 meses
050K
vdspeak:为YouTube视频生成多语言配音

vdspeak: generación de locuciones multilingües para vídeos de YouTube

Introducción general vdspeak es una herramienta en línea centrada en ofrecer servicios de traducción y doblaje multilingüe para vídeos de YouTube. Utiliza tecnología avanzada de IA para traducir y doblar automáticamente contenidos de vídeo a más de 150 idiomas, ayudando a los usuarios a llegar fácilmente a una audiencia global. Fácil de manejar, los usuarios sólo...
hace 12 meses
052.2K
Paper to Podcast:把学术论文转换为多人对话播客

De paper a podcast: cómo convertir trabajos académicos en podcasts de conversación entre varias personas

Introducción general Paper to Podcast es una herramienta de código abierto especializada en transformar trabajos de investigación académica en podcasts animados y entretenidos. Utiliza tecnología de inteligencia artificial para convertir un documento en formato PDF en un diálogo entre tres personajes (el anfitrión, el alumno y el experto) para...
hace 12 meses
045.5K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: un modelo para transformar el lenguaje natural en consultas SQL de alta calidad

Introducción general OmniSQL es un proyecto de código abierto desarrollado por el equipo RUCKBReasoning y alojado en GitHub. Su función principal es transformar las preguntas en lenguaje natural introducidas por el usuario en sentencias de consulta SQL de alta calidad , para ayudar a los usuarios fácilmente con el número de...
hace 12 meses
065.1K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: herramienta de código abierto para generar vídeo con sincronización labial directamente a partir de audio

Introducción general LatentSync es una herramienta de código abierto desarrollada por ByteDance y alojada en GitHub. Controla los movimientos labiales de los personajes de un vídeo directamente a través del audio, de modo que la forma de la boca coincide con la voz con precisión. El proyecto se basa en Stable Di...
hace 9 meses
0132.3K
Logome:快速生成专业品牌Logo的AI工具

Logome: herramienta de IA para generar rápidamente logotipos de marca profesionales

Introducción general Logome es una plataforma en línea que utiliza tecnología de inteligencia artificial para ayudar a los usuarios a crear rápidamente logotipos de marca profesionales. Diseñada para emprendedores, pequeñas empresas y particulares, genera logotipos únicos y kits de marca completos sin necesidad de tener experiencia en diseño. Los usuarios sólo tienen que introducir el nombre de la marca y la línea...
hace 12 meses
051.5K
Talecast:用AI翻译和编辑视频的工具

Talecast: una herramienta para traducir y editar vídeos con IA

Introducción general Talecast es una herramienta basada en IA que se centra en la traducción y edición de vídeo. Su principal característica es la capacidad de traducir y sincronizar vídeos a 20 idiomas, al tiempo que permite a los usuarios modificar el contenido del vídeo como si estuvieran editando un documento. Ideal para creadores de contenidos, educadores y...
hace 12 meses
050.2K
DeepPDF:PDF对话、总结和翻译工具

DeepPDF: herramienta de diálogo, resumen y traducción de PDF

Introducción completa a DeepPDF es un uso de la inteligencia artificial para ayudar a los usuarios a tratar con documentos PDF, herramientas en línea. Permite a los usuarios "chatear" directamente con los documentos PDF, extraer rápidamente la información, generar resúmenes, sino también para traducir el documento o analizar las imágenes y fórmulas. El núcleo del sitio en ...
hace 12 meses
057.4K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: una persona digital secundaria que permite la retransmisión en directo de la estación B y la interacción por voz.

VirtualWife es un proyecto de persona digital virtual de código abierto creado por el desarrollador yakami129. Actualmente se encuentra en fase de incubación. El objetivo es crear un personaje virtual con "alma", con el que el usuario pueda interactuar como con un amigo. El proyecto cuenta con el apoyo de B Station Live...
hace 12 meses
051.7K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: un modelo ligero para sintetizar el habla china e inglesa

Introducción general MegaTTS3 es una herramienta de síntesis de voz de código abierto desarrollada por ByteDance en colaboración con la Universidad de Zhejiang, centrada en la generación de voz china e inglesa de alta calidad. Su modelo central tiene sólo 0,45 B de parámetros, es ligero y eficiente, admite la generación de habla mixta china e inglesa y la clonación del habla. El proyecto está alojado en ...
hace 12 meses
064.2K