Últimos recursos sobre IA

共 3103 篇文章
Raycast:电脑桌面上万能的AI生产力工具

Raycast: la herramienta polivalente de productividad con inteligencia artificial para el escritorio de tu ordenador

Descripción general Raycast es una herramienta de productividad todo en uno diseñada para usuarios de Mac para ayudarles a lanzar rápidamente aplicaciones, buscar archivos, gestionar tareas e incluso controlar su hogar inteligente con un simple cuadro de búsqueda y operaciones de teclas de acceso directo. No sólo sustituye al propio S...
hace 1 año
074.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: un organismo inteligente para el análisis de radiografías de tórax mediante macromodelos multimodales

Introducción completa MedRAX es una inteligencia artificial de última generación diseñada para el análisis de radiografías de tórax (CXR). Integra herramientas de análisis CXR de última generación y grandes modelos de lenguaje multimodal para procesar dinámicamente consultas médicas complejas sin formación adicional.MedRAX, a través de su diseño modular...
hace 1 año
074K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 1 año
074K
火山方舟:大模型训练与云计算服务,注册送150元等额算力

Volcano Ark: formación en Big Model y servicio de computación en la nube, inscríbase por 150 dólares de aritmética equivalente

Introducción Volcano Ark es una plataforma de computación en la nube lanzada por Volcano Engine que se centra en los servicios de grandes modelos, con el objetivo de proporcionar a las empresas una solución completa desde la selección del modelo, la formación hasta la aplicación. Basándose en la profunda acumulación de ByteDance en el campo de la IA, Volcano Ark integra los recursos de big models de varias empresas de IA de primer nivel....
hace 1 año
074K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力

Tongyi Thousand Questions: un gran modelo multimodal lanzado por Ali con funciones de respuesta de texto, comprensión de imágenes y análisis sintáctico de vídeos.

Introducción exhaustiva Tongyi Thousand Questions es un gran modelo inteligente desarrollado por Aliyun, cuyo objetivo es proporcionar una experiencia de interacción similar a la humana a través del aprendizaje profundo y la tecnología de procesamiento del lenguaje natural. Puede generar rápidamente copias creativas para añadir diversión a la vida, y servir como asistente de aprendizaje para ayudar a los usuarios a aprender fácilmente todo tipo de conocimientos. Con tecnología de vanguardia y...
hace 1 año
074K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

Uso de ordenadores abiertos E2B: ejecución segura de un sistema operativo de inteligencia artificial en el espacio aislado E2B

Introducción general E2B Open Computer Use es un proyecto de código abierto cuyo objetivo es proporcionar una experiencia segura de uso de ordenadores Linux basada en la nube a través de E2B Desktop Sandbox.E2B Sandbox proporciona un entorno gráfico de escritorio que los usuarios...
hace 1 año
074K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio: plataforma de creación de películas de IA con herramientas de gestión de pantalla dividida para configurar varios personajes y mantener la coherencia de los rostros.

Introducción general LTX Studio es una innovadora plataforma de creación de vídeo impulsada por IA diseñada para creadores, comercializadores, cineastas y estudios. Ofrece una operación de proceso completo desde la concepción de la historia, la generación de pantalla dividida, la adición de efectos cinéticos hasta la post-edición, ayudando a los usuarios a transformar conceptos creativos en...
hace 1 año
074K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

Doblaje de YouTube: traduzca vídeos de YouTube a diferentes idiomas y sincronice el doblaje en tiempo real

Introducción general El doblaje de YouTube es una plataforma de doblaje inteligente diseñada para ofrecer servicios de doblaje multilingüe a creadores y espectadores de vídeos. A través de la tecnología de IA, la plataforma es capaz de traducir y generar automáticamente doblajes de vídeos de YouTube, soportando múltiples idiomas y estilos de voz. Los usuarios sólo tienen que instalar...
hace 2 años
073.9K
Replit Agent:智能编程助手

Replit Agent: Asistente de programación inteligente

Introducción general Replit Agent es una herramienta de programación de IA de Replit, Inc. diseñada para ayudar a los usuarios a construir proyectos de software a través de la tecnología de procesamiento de lenguaje natural. Los usuarios sólo tienen que proporcionar instrucciones o preguntas sencillas (Prompt), y Replit Agent puede auto...
hace 1 año
073.9K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad

Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...
hace 1 año
073.9K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: generación de modelos de conversión de texto en voz específicos para cada hablante a partir de un texto de entrada

Introducción general Parler-TTS es una biblioteca de modelos de texto a voz (TTS) de código abierto desarrollada por Hugging Face, diseñada para generar habla de alta calidad y sonido natural. El modelo es capaz de generar habla a partir de un texto de entrada con un estilo de locutor específico (por ejemplo, género, tono, estilo de habla...
hace 1 año
073.8K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: asistente AI de código abierto para la grabación de reuniones, grabación automática del contenido de las reuniones para generar resúmenes.

Introducción general Amurex es un asistente de reuniones con inteligencia artificial de código abierto desarrollado por The Personal AI Company, diseñado para mejorar la eficacia de las reuniones mediante funciones inteligentes.
hace 1 año
073.7K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

Analytics GBI (XiYan-SQL): Análisis inteligente de datos de texto a SQL para ChatBI simplificado

Introducción completa Analyse GBI es un producto de análisis inteligente de datos basado en big models lanzado por AliCloud Bailian. El producto utiliza tecnología avanzada de procesamiento del lenguaje natural para ayudar a los usuarios a consultar y analizar datos a través del lenguaje natural, sin tener que dominar la compleja sintaxis SQL. Analizar GBI soporta múltiples fuentes de datos, incluyendo...
hace 1 año
073.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台

Centro Creativo AliMama: Plataforma inteligente de apoyo creativo al marketing bajo la ecología de Taobao

Introducción completa Alimama Creative Centre es la plataforma inteligente de soporte creativo de marketing de Alibaba, diseñada para proporcionar a los comerciantes de Taobao, Tmall y otras plataformas de comercio electrónico una gama completa de soporte creativo, desde gráficos hasta vídeos y páginas de destino. Mediante la combinación de capacidades de redacción inteligente de AI y plantillas masivas, el Centro Creativo mejora drásticamente la eficiencia del diseño...
hace 2 años
073.7K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: Cliente nativo de vídeo a subtítulos, conversión de subtítulos multilingües

Descripción general MemoAI es una potente herramienta de traducción de vídeo diseñada para convertir archivos de vídeo y audio en texto, subtítulos y notas. Ya sea un vídeo de YouTube, un podcast o un archivo local, MemoAI puede manejarlo con facilidad. Es compatible con más de 90 idiomas como chino, inglés, japonés...
hace 2 años
073.7K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: herramientas de tratamiento de fotos en línea, incrustación con un clic, eliminación de marcas de agua, restauración de fotos, edición de retratos

Introducción completa ZuoSugar (PicWish) es una plataforma inteligente de procesamiento de imágenes AI que proporciona una gran cantidad de herramientas de edición de fotos en línea y soporta el uso de todas las plataformas. Los usuarios pueden completar fácilmente con un solo clic keying, eliminación de marcas de agua, fotos borrosas se vuelven claras, zoom sin pérdida, recorte de imágenes, compresión de imágenes y fotos en blanco y negro....
hace 2 años
073.7K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

Voicenotes: notas de voz con inteligencia artificial, grabación y transcripción de voz, gestión inteligente del contenido de las reuniones

Introducción general Voicenotes es una aplicación de notas de voz inteligente diseñada para ayudar a los usuarios a grabar y gestionar fácilmente notas de voz y reuniones. La aplicación permite la transcripción de voz en más de 100 idiomas. Los usuarios simplemente dicen sus pensamientos y Voicenotes los transcribe automáticamente en texto....
hace 1 año
073.7K
Eightify:用AI快速总结YouTube视频的高效学习助手

Eightify: un asistente de aprendizaje eficaz para resumir rápidamente vídeos de YouTube con IA

Eightify Introducción general Eightify es una herramienta que utiliza la tecnología de inteligencia artificial de YouTube para ofrecerte puntos clave y resúmenes de tus vídeos en cuestión de segundos. Tanto si estás viendo formación empresarial, podcasts, entrevistas, noticias o conferencias, Eightify te ayuda...
hace 1 año
073.7K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...
hace 1 año
073.7K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: un macromodelo multimodal de audio para el diálogo de voz en tiempo real de extremo a extremo, una implementación de código abierto de la interacción de voz GPT-4o

Introducción general Ultravox es un innovador modelo multimodal de lenguaje amplio (LLM) diseñado para el procesamiento del habla en tiempo real. A diferencia de los sistemas tradicionales de reconocimiento del habla, Ultravox elimina la necesidad de una etapa separada de reconocimiento del habla de audio (ASR), y es capaz de convertir directamente el audio en un espacio de alta dimensión en...
hace 2 años
073.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: generación de efectos sonoros sincronizados y bandas sonoras para secuencias de vídeo, herramienta de coformación multimodal vídeo-audio.

Introducción general MMAudio es un proyecto de código abierto cuyo objetivo es generar audio sincronizado de alta calidad mediante el entrenamiento multimodal conjunto. Desarrollado por Ho Kei Cheng et al. en la Universidad China de Hong Kong, la función principal del proyecto es generar audio sincronizado a partir de la entrada de vídeo y/o texto.MM...
hace 2 años
073.7K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 1 año
073.6K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: un asistente inteligente de sobremesa basado en Gemini que puede ver, oír y hablar.

Introducción general Gemini Cursor es un asistente inteligente de escritorio basado en el modelo Gemini 2.0 Flash (experimental) de Google. Permite interacciones visuales, auditivas y de voz a través de una API multimodal, proporcionando un uso en tiempo real de baja latencia....
hace 1 año
073.6K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Pétalos: ejecución y puesta a punto de grandes modelos lingüísticos en la GPU compartida y distribuida, compartiendo los recursos de la GPU como una red BitTorrent.

Introducción general Petals es un proyecto de código abierto desarrollado por BigScience Workshop para ejecutar grandes modelos lingüísticos (LLM) mediante un enfoque de computación distribuida. Los usuarios pueden ejecutar LLMs en casa utilizando GPUs de consumo o Google Co...
hace 2 años
073.5K
Midreal AI:互动式AI文字冒险游戏和幻想小说创作

Midreal AI: AI interactiva Juegos de aventura de texto y escritura de ficción fantástica

Descripción general Midreal AI es un juego de aventuras de texto a través de diálogos atractivos e inspirados, que cuenta con tecnología de IA de vanguardia para ofrecer a los jugadores una experiencia narrativa envolvente. Los jugadores pueden establecer sus propios escenarios para explorar y experimentar diversos hilos narrativos a lo largo del juego. Esta plataforma es especialmente adecuada para...
hace 2 años
073.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: AI digital people con interacción fluida en tiempo real en tarjetas gráficas de la serie 30/40

Introducción general DH_live es un proyecto de humano digital en tiempo real basado en el aprendizaje sin muestras, cuyo objetivo es proporcionar a los usuarios una experiencia de transmisión en directo fluida e interactiva. El proyecto es compatible con las tarjetas gráficas NVIDIA de las series 30 y 40 y es capaz de funcionar en tiempo real a más de 25 fps. Los usuarios pueden...
hace 2 años
073.4K
They See Your Photos:基于 Google Vision 照片隐私信息分析

Ellos ven tus fotos: análisis de la información sobre la privacidad de las fotos basado en Google Vision

Introducción general They See Your Photos es una herramienta en línea fácil de usar diseñada para ayudar a los usuarios a comprender la información privada oculta en sus fotos. Los usuarios pueden subir cualquier imagen, y el sitio web analiza el contenido y los metadatos de la imagen mediante tecnología de inteligencia artificial para mostrar los detalles de lo que la foto puede revelar....
hace 1 año
073.4K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet: Creación e implantación rápidas de aplicaciones locales mediante descripciones de texto

Introducción general ToolJet es una plataforma de desarrollo de aplicaciones empresariales impulsada por IA que permite la creación de aplicaciones y agentes de IA personalizados con sencillas descripciones en lenguaje natural. Los usuarios simplemente describen la aplicación deseada y ToolJet se encarga de toda la configuración: interfaz de usuario, base de datos y consulta...
hace 1 año
073.3K
FinChat:智能股票研究平台,美股公开财报分析

FinChat: Plataforma inteligente de investigación bursátil, análisis de beneficios públicos en EE.UU.

Introducción general FinChat es una plataforma de investigación bursátil impulsada por IA diseñada para proporcionar a los inversores datos financieros y herramientas analíticas de alta calidad. Al integrar datos de más de 750 empresas e información de inversión de más de 100 superinversores, FinChat ayuda a los usuarios a acceder rápidamente a los mercados....
hace 1 año
073.3K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)

ClipZap AI Face Swap Tool: intercambio rápido de caras por IA para fotos y vídeos (gratis)

Descripción General ClipZap AI Face Replacement Tool es una herramienta líder de reemplazo de rostros por IA diseñada para las necesidades de reemplazo de rostros en fotos y vídeos. Utiliza tecnología avanzada de IA para reconocer automáticamente a las personas en vídeos e imágenes y realizar un reemplazo de caras de alta calidad. Ya sea para crear divertidos emoji...
hace 1 año
073.3K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: extensión de ayuda de IA que mejora la experiencia de desarrollo de VSCode, la anotación con un solo clic, la conversión y la generación de interfaz de usuario de código.

Introducción general AIDE (AI-assisted Development Extension) es una potente extensión de desarrollo asistido por IA para VSCode, centrada en proporcionar una asistencia de programación de IA única y útil. Es diferente de GitHu...
hace 1 año
073.3K
Dzine:可控的AI图像生成功能与画布设计工具,提供数百种图像风格样式

Dzine: capacidades de generación de imágenes AI controlables y herramientas de diseño de lienzos, que ofrecen cientos de estilos y estilos de imagen.

Introducción general Dzine (antes Stylar) es una plataforma de diseño de AI todo en uno que ofrece un flujo de trabajo integrado desde la generación de imágenes hasta la edición, una composición de imágenes y un control de estilos sin igual. Sus estilos predefinidos facilitan a los usuarios de todos los niveles la personalización de diseños sin...
hace 2 años
073.3K
TinyWow:免费使用多功能写作与图像在线编辑工具

TinyWow: herramienta multifuncional y gratuita de redacción y edición de imágenes en línea

Introducción general TinyWow es una completa plataforma en línea que ofrece una amplia gama de herramientas digitales gratuitas diseñadas para simplificar la vida digital de los usuarios. Ya se trate de gestión de PDF, edición de vídeo, manipulación de imágenes o ayuda a la escritura basada en IA, TinyWow tiene lo que los usuarios necesitan....
hace 1 año
073.2K
QuillBot:智能辅助改写与校对文本的写作工具

QuillBot: una herramienta de escritura que asiste de forma inteligente en la reescritura y corrección de textos.

Introducción general QuillBot es una plataforma de asistencia a la escritura en línea basada en IA y diseñada para ayudar a los usuarios a reescribir, corregir y optimizar rápidamente el contenido de los textos. Ofrece reescritura de textos, revisión gramatical, resumen de textos y traducción mediante tecnología de procesamiento del lenguaje natural, lo que resulta adecuado para estudiantes, profesionales en activo e internos....
hace 1 año
073.2K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - un modelo de análisis sintáctico de documentos multilingües de código abierto del Little Red Book hi lab

dots.ocr es un modelo de análisis sintáctico de documentos multilingües de código abierto del laboratorio Xiaohongshu hi, basado en un modelo de lenguaje visual (VLM) de 1.700 millones de parámetros, que puede realizar con eficacia la detección del diseño y el reconocimiento del contenido de los documentos manteniendo un buen orden de lectura.
hace 11 meses
073.2K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: un cliente de código abierto para traducir en tiempo real el contenido del chat de un juego

Introducción general DeepRant es una herramienta de traducción de código abierto para jugadores, diseñada para resolver el problema de las barreras lingüísticas en los servidores internacionales. Permite la traducción instantánea del texto del juego mediante atajos de teclado, admite que varios idiomas se traduzcan entre sí y permite a los jugadores entender y responder rápidamente a los mensajes del chat sin salir del juego....
hace 1 año
073.2K
Consensus:优秀的学术论文搜索引擎

Consenso: un excelente motor de búsqueda de trabajos académicos

Consensus es un motor de búsqueda que utiliza tecnología de IA para encontrar y resumir artículos de investigación científica. A través de la plataforma, los usuarios pueden hacer preguntas como "¿Puede la creatina ayudar a construir músculo?" o "¿Puede la meditación con pensamiento positivo mejorar el sueño?" y obtener información de más de 200 millones de artículos científicos...
hace 2 años
073.1K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

AR Drawing: una aplicación que utiliza la tecnología AR y AI para mejorar las habilidades de dibujo a mano realista.

Descripción general AR Drawing es una aplicación que utiliza la tecnología de realidad aumentada (RA) para ayudar a los usuarios a mejorar sus habilidades de dibujo. La aplicación ofrece más de 200 lecciones de dibujo guiadas paso a paso que cubren una variedad de plantillas de dibujo desde niveles principiantes hasta avanzados. Los usuarios pueden utilizar la cámara de su teléfono móvil para proyectar imágenes...
hace 2 años
073.1K
iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸

AI: Editor Inteligente de Fotos AI|Eliminación de Fondo de Imagen Gratis|Vestir a una Modelo|Cambio de Cara

iFoto Descripción general ifoto es una herramienta online gratuita de edición de fotos AI diseñada para el comercio electrónico que ofrece una serie de funciones para mejorar la presentación online de los productos. Transforma modelos de ropa en modelos realistas mediante tecnología de IA y proporciona diversos fondos de escenas reales para los productos. ifo...
hace 2 años
073.1K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: un proyecto de código abierto para crear y ejecutar inteligencias artificiales automatizadas

Introducción general AgentGPT es un proyecto de código abierto desarrollado por el equipo Reworkd y alojado en GitHub, diseñado para permitir a los usuarios crear, configurar y desplegar de forma autónoma inteligencias AI a través de un navegador. Los usuarios simplemente establecen un objetivo, y AgentGPT puede...
hace 1 año
073.1K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: flujos de trabajo corporales inteligentes basados en lenguaje natural para la automatización de escritorios y navegadores

Introducción general Eko es un marco JavaScript de nivel de producción diseñado para construir flujos de trabajo de agentes inteligentes eficientes mediante descripciones en lenguaje natural. Está diseñado para permitir a los desarrolladores automatizar tareas cotidianas utilizando tecnologías de IA sin necesidad de programac...
hace 1 año
073.1K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: herramienta todo en uno para la restauración y edición de imágenes lanzada por Tencent ARC

Introducción general BrushEdit es una herramienta integral de reparación y edición de imágenes desarrollada por Tencent ARC Labs. La herramienta se basa en la última tecnología de IA y es capaz de identificar y reparar automáticamente los defectos en las imágenes, mientras que el apoyo a la edición interactiva por users.BrushEdit combina una variedad de...
hace 2 años
073.1K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Aprendizaje por refuerzo de bajo coste para la capacidad de generalización de modelos de lenguaje visual

Introducción exhaustiva R1-V es un proyecto de código abierto cuyo objetivo es lograr avances en el modelado del lenguaje visual (VLM) mediante el aprendizaje por refuerzo (RL) de bajo coste. El proyecto utiliza mecanismos de recompensa verificables para motivar a los VLM a aprender habilidades genéricas de conteo. Sorprendentemente, R1-V's 2B ...
hace 1 año
073K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelización autorregresiva por bits de la generación de imágenes de alta resolución para una generación ilimitada de imágenes de alta resolución

Introducción general Infinity es un innovador marco de generación de imágenes de alta resolución desarrollado por el equipo de FoundationVision. El proyecto rompe con las limitaciones de los modelos tradicionales de generación de imágenes a través de un innovador enfoque de modelado autorregresivo visual a nivel de bits.Las principales características de Infinity...
hace 1 año
073K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台

GeekAI: asistente comercial de inteligencia artificial multifuncional autodesplegable con acceso completo al backend de operaciones API multimodelo.

Introducción completa GeekAI es un conjunto completo de soluciones de código abierto para los asistentes de AI basado en AI gran modelo de lenguaje API de implementación. El proyecto viene con un backend de gestión de operaciones , fuera de la caja , integrado con ChatGPT, Azure, ChatGLM, Xunfei Starfire, Wenxin Yiyin y muchos otros p...
hace 2 años
073K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合

Pika: Excelente Generación Creativa de Vídeo | Texto a Vídeo | Gráfico a Vídeo | Fusión de Imagen a Vídeo

Pika Introducción general Pika.art es una plataforma para convertir ideas en vídeos, diseñada para proporcionar a las personas creativas una herramienta para la creación de vídeos con IA. Tanto si quieres hacer clips divertidos, contenido para redes sociales o cortometrajes, Pika.art sigue la imaginación del usuario. Los usuarios...
hace 1 año
073K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: Genera modelos de código abierto de imagen a vídeo que admiten el control de la lente y el control de la amplitud de movimiento.

Introducción general Ruyi-Models es un proyecto de código abierto diseñado para generar vídeos de alta calidad a partir de imágenes. Desarrollado por el equipo IamCreateAI, el proyecto soporta la generación de vídeo cinemático a 768 de resolución, 24 fotogramas por segundo, 120 fotogramas en 5 segundos...
hace 2 años
072.9K
Descript:一站式视频与播客编辑,简单如编辑文档

Descript: Edición integral de vídeo y podcast, tan sencilla como editar un documento

Descript Descripción general Descript es una herramienta de edición de vídeo y podcasts potente pero fácil de usar. Tiene una precisión y velocidad de transcripción líderes en el sector y potentes herramientas de corrección, así como la capacidad de transcribir vídeo a texto con tecnología de IA y editar vídeo editando el texto. Además de...
hace 2 años
072.9K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: un mapa de referencia de retratos para generar vídeos coherentes con los personajes, rápida integración multiterminal

Introducción ConsisID es un proyecto de código abierto desarrollado por el grupo de Yuan Rong en la Universidad de Pekín, cuyo objetivo es lograr la generación de texto a vídeo coherente con la identidad (IPT2V) mediante técnicas de descomposición de frecuencias. El núcleo del proyecto es un sistema DiT (Diffusion Transfor...
hace 2 años
072.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: pequeño simio cálculo oral notas inversas, ingeniería inversa y algoritmos de descifrado

Introducción completa Ape Mouth Calculator Reverse Notes es un proyecto de código abierto que tiene como objetivo documentar y compartir el proceso y los métodos de ingeniería inversa de la aplicación Ape Mouth Calculator. El proyecto contiene una variedad de herramientas y técnicas inversas para usar las instrucciones , como Frida, dexdump , etc., para ayudar a los usuarios a entender y descifrar la suma aritmética oral del pequeño simio....
hace 2 años
072.9K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: herramienta de extensión de imagen AI de código abierto súper potente, image outpainting (pintado de imágenes)

Introducción general Diffusers Image Outpaint es una potente herramienta de expansión de imágenes AI creada por fffiloni, miembro de la comunidad Hugging Face. La herramienta utiliza técnicas avanzadas de modelado de difusión para...
hace 2 años
072.9K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código abierto para la comprensión de vídeos y rondas múltiples de diálogo

Introducción CogVLM2 es un modelo multimodal de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), basado en la arquitectura Llama3-8B, y cuyo objetivo es proporcionar un rendimiento comparable o incluso mejor que GPT-4V. El modelo permite la comprensión de imágenes, el diálogo...
hace 1 año
072.9K
Chatwise:共享知识变成收入的AI聊天机器人

Chatwise: el chatbot de inteligencia artificial que convierte el conocimiento en ingresos

Introducción general Chatwise es una plataforma sencilla y útil que se especializa en ayudar a los usuarios a convertir sus conocimientos en chatbots de IA que generan dinero. Todo lo que necesitas hacer es subir un archivo, artículo o enlace, y el sitio generará rápidamente un bot inteligente que otros pueden aprender de su contenido con una suscripción de pago, y usted puede...
hace 1 año
072.8K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频

VideoFX (Veo2): vídeo creativo generado por IA con alta reproducción del estado físico y salida de vídeo 4K nativo

Introducción general VideoFX es una innovadora herramienta de generación de vídeo de Google Labs diseñada para ayudar a los usuarios a crear fácilmente contenidos de vídeo creativos y visualmente impresionantes. La herramienta utiliza la avanzada tecnología Veo 2.0 para proporcionar una amplia gama de efectos de vídeo y funciones de edición...
hace 2 años
072.8K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模

PSHuman: Genera modelos realistas de retratos en 3D, utiliza una foto para generar modelos humanos en 3D.

Introducción general PSHuman es una herramienta de reconstrucción de retratos 3D de una sola imagen basada en la tecnología de difusión multivista. La herramienta es capaz de generar estructuras geométricas detalladas y modelos de retratos 3D realistas a partir de una única foto de una persona vestida.La tecnología central de PSHuman incluye la difusión multivista a escala cruzada, que es capaz de...
hace 2 años
072.8K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台

Fa Xing Bao: Asesor Jurídico de IA, Consultoría Jurídica de Inteligencia Artificial, Plataforma Jurídica de IA de Baidu

Introducción general LawXinbao es una plataforma de servicios jurídicos inteligentes lanzada por Baidu, que integra tecnología avanzada de inteligencia artificial con una base de conocimientos jurídicos profesionales. La plataforma se dedica a proporcionar a los usuarios servicios legales inteligentes convenientes y profesionales, incluyendo preguntas y respuestas legales inteligentes, análisis de casos, revisión de contratos y otras funciones. A través del aprendizaje profundo...
hace 1 año
072.8K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: transforma la letra en un modelo base de una canción completa, compatible con una amplia gama de estilos musicales.

Introducción general YuE es un modelo base de generación de canciones completas de código abierto que se centra en transformar letras de canciones en canciones completas. A diferencia de otros modelos que sólo generan fragmentos cortos de música no vocal, YuE es capaz de generar canciones completas con voz principal y coros de hasta varios minutos de duración. El modelo aborda la generación de música en...
hace 1 año
072.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: plataforma de producción de cursos humanos digitales de código abierto, clonación de vídeos de conferencias humanas digitales de generación PPT con un solo clic

Introducción exhaustiva Easegen es una plataforma de creación de cursos humanos digitales de código abierto que tiene como objetivo mejorar la eficiencia de la producción y gestión de contenidos de enseñanza a través de la tecnología de IA. La plataforma proporciona una solución integral desde la producción de cursos, la gestión de vídeo hasta el interrogatorio inteligente, que permite a los usuarios crear cursos digitales de vídeo explicados por humanos....
hace 2 años
072.8K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: una herramienta de código abierto para generar materiales de estudio de palabras de 4º curso utilizando DeepSeek.

Introducción completa "Vocabulary Book by DeepSeek" es un proyecto de código abierto desarrollado sobre la base del gran modelo de DeepSeek, con el objetivo de ayudar a los estudiantes de inglés a dominar el vocabulario del nivel 4 de inglés universitario (CET-4) de manera eficiente. El proyecto está alojado en GitHub...
hace 1 año
072.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

Whisk: carga varias imágenes y mezcla temas, escenas y estilos para crear obras de arte únicas.

Introducción general Whisk es una innovadora herramienta de generación de imágenes AI de Google Labs diseñada para mezclar diferentes temas, escenas y estilos mediante la carga de varias imágenes. A diferencia de las herramientas tradicionales de generación de imágenes que se basan en indicaciones de texto, Whisk utiliza principalmente imágenes como entrada...
hace 1 año
072.8K
Same:克隆网站UI生成生产级前端代码

Igual: Clonación de la interfaz de usuario de un sitio web para generar código front-end de producción

Introducción general Same es una sencilla y útil herramienta en línea diseñada para ofrecer a diseñadores y desarrolladores la posibilidad de replicar rápidamente interfaces web. Introduciendo una URL, genera una réplica píxel a píxel de la página de destino, ahorrando a los usuarios el tiempo de tener que redibujarla manualmente. El núcleo del sitio es la "copia...
hace 1 año
072.8K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Herramienta de conversión inteligente de documentos de Microsoft para convertir varios archivos al formato Markdown

Introducción general MarkItDown es una herramienta Python desarrollada por Microsoft diseñada para convertir diversos archivos y documentos ofimáticos al formato Markdown. La herramienta admite una amplia gama de tipos de archivo, como PDF, PowerPoint, Word, Excel, diagramas...
hace 2 años
072.8K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: un conjunto de herramientas para construir rápidamente interfaces de chat de IA con soporte para la integración de modelos y la gestión del flujo de datos.

Introducción Ant Design X es un conjunto de herramientas de código abierto de Ant Group, diseñado para ayudar a los desarrolladores a crear rápidamente interfaces de diálogo basadas en IA. Proporciona un amplio conjunto de componentes y plantillas, soporta la integración de modelos compatibles con los estándares OpenAI, y es adecuado para una variedad de aplicaciones tales como servicio al cliente inteligente, asistentes de IA, y otros...
hace 2 años
072.8K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: la herramienta de IA invisible que facilita las entrevistas técnicas a distancia

Introducción general Interviewcoder es una herramienta asistida por IA para entrevistas técnicas, diseñada para ayudar a los usuarios a generar rápidamente soluciones, optimizar código y depurar en tiempo real durante las entrevistas de programación. Se ejecuta como una aplicación de escritorio oculta que los usuarios pueden utilizar en Zoom, Googl...
hace 1 año
072.7K
ModelsLab:AI图像生成为主的API服务商|免费体验1000+模型

ModelsLab: AI Image Generation Based API Service Provider | ¡Más de 1000 modelos gratis!

Introducción general ModelsLab es una plataforma que ofrece una amplia gama de herramientas de generación de IA centradas en la transformación de texto en imágenes, vídeo, audio y modelos 3D. La plataforma proporciona a desarrolladores y empresas potentes servicios API que les permiten crear e integrar fácilmente contenidos generados por IA.Mode...
hace 2 años
072.7K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI face swap: open source second duck camera, deploy front and back-end complete enterprise AI face swap applet (arithmetic service payment, can be two open)

Introducción Completa LunaAI face swap applet es una aplicación de intercambio de caras desarrollada en base a uniapp y Vue framework. La aplicación hace uso de PHP, MySQL, Nginx y Redis para lograr la función de la operación de cambio de cara del usuario a través del applet. Los usuarios pueden utilizar este pequeño...
hace 2 años
072.7K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧

Tough Tongue AI: practica las habilidades comunicativas en entrevistas y en el lugar de trabajo con AI Dialogue

Introducción general Tough Tongue AI es una plataforma de inteligencia artificial diseñada para practicar conversaciones difíciles. Los usuarios pueden simular diversas situaciones de diálogo complejas, como entrevistas de trabajo, negociaciones salariales, presentaciones de ventas, etc., seleccionando escenarios preestablecidos o creando escenarios personalizados. La plataforma ofrece vídeos y...
hace 1 año
072.7K
飞书知识问答:使用飞书文档作为AI知识库

Flybook Knowledge Quiz: Utilización de los documentos de Flybook como base de conocimientos de IA

Introducción completa Flying Book Knowledge Q&A es una herramienta de gestión del conocimiento y de preguntas y respuestas impulsada por IA lanzada por Flying Book, que integra profundamente la tecnología de grandes modelos DeepSeek R1. Admite la búsqueda en red en tiempo real, el análisis sintáctico de archivos multiformato (incluidos documentos, imágenes, etc.) y puede acoplarse sin problemas a la base de conocimientos de la empresa para ayudar a utilizar...
hace 1 año
072.7K
Diagramming AI:使用AI在线设计UML图和工作流程图

Diagramación AI: Diseño de diagramas UML y diagramas de flujo de trabajo en línea utilizando AI

Introducción general Diagramming AI es una potente herramienta en línea que utiliza tecnología de inteligencia artificial para ayudar a los usuarios a diseñar y editar al instante diagramas UML y diagramas de flujo de trabajo. El sitio ofrece una variedad de formatos de diagramas, incluidos diagramas de flujo, diagramas de secuencia y diagramas de Gantt, y los usuarios...
hace 1 año
072.6K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: ajuste de grandes modelos para mejorar el razonamiento corporal inteligente y la toma de decisiones

Introducción general OpenManus-RL es un proyecto de código abierto desarrollado por UIUC-Ulab junto con el equipo OpenManus de la comunidad MetaGPT, alojado en GitHub. El proyecto mejora el modelado lingüístico a gran escala (LLM) mediante técnicas de aprendizaje por refuerzo (RL)....
hace 1 año
072.6K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM: un marco ligero y eficiente para razonar y servir grandes modelos lingüísticos

Introducción exhaustiva LightLLM es un marco de razonamiento y servicio basado en Python de Large Language Model (LLM) conocido por su diseño ligero, facilidad de extensión y rendimiento eficiente. El marco aprovecha una variedad de implementaciones de código abierto bien conocidas, incluyendo FasterTransfor...
hace 1 año
072.5K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)

Mebot: un asistente personal de inteligencia artificial que admite memoria a largo plazo para varios tipos de documentos (recomendado)

Descripción general Me.bot es un asistente personal de inteligencia artificial creado para la vida cotidiana. Actúa como tu segundo cerebro, ayudándote a organizar tus recuerdos, inspirar tu creatividad y amplificar tus ideas.Me.bot está impulsado por un potente modelo personal desarrollado internamente, con funciones avanzadas de cifrado y privacidad para garantizar...
hace 2 años
072.5K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: herramienta profesional de edición de audio en línea|producción de audiolibros|de texto a voz|separación de acompañamientos

Introducción general XAudioPro es una herramienta avanzada de edición y transcodificación de audio en tiempo real en línea que es a la vez profesional y portátil. Soporta funciones profesionales de edición de audio como cortar, recortar, copiar, borrar, restaurar y controlar la ganancia de amplitud. También ofrece servicios de eliminación de ruido, como reducción de ruido por sustracción espectral,...
hace 2 años
072.5K
Petal:使用AI分析和管理文档,检索多文档生成有据可查的答案

Petal: utiliza la IA para analizar y gestionar documentos, recuperando múltiples documentos para generar respuestas bien documentadas.

Introducción general Petal es una plataforma de análisis de documentos basada en IA diseñada para ayudar a los usuarios a gestionar y analizar documentos de forma eficiente. Con Petal, los usuarios pueden vincular su base de conocimientos a la plataforma y generar respuestas totalmente documentadas y fiables.Petal admite múltiples tipos de documentos...
hace 1 año
072.5K
WeaveFox:前端智能研发平台,能够根据设计图直接生成源代码

WeaveFox: una plataforma inteligente de desarrollo front-end que genera código fuente directamente a partir de los planos de diseño

Introducción general WeaveFox es una plataforma inteligente de I+D de front-end de IA lanzada por Ant Group, con el objetivo de mejorar la eficiencia y la calidad del desarrollo de front-end a través de la tecnología de IA. La plataforma se basa en el gran modelo multimodal Bailing desarrollado por Ant, capaz de generar código fuente front-end directamente a partir de los planos de diseño, y admite múltiples clientes y pilas tecnológicas....
hace 2 años
072.5K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: software de transcripción y traducción de voz en tiempo real que funciona nativamente sin conexión a Internet

Descripción general Si utilizas un MacBook, prueba AI Hear: puedes grabar audio, convertir voz local en tiempo real a texto y traducir, y eventualmente exportar subtítulos. Puedes utilizarlo como ayuda para escuchar reuniones internacionales y audiolibros en inglés. AI Hear es un software de ejecución local que proporciona...
hace 2 años
072.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: una API unificada para integrar la generación de voz bien conocida, la transcripción de voz y el modelado de voz

Introducción general Orate es un conjunto de herramientas de IA centrado en la generación y transcripción de voz. Proporciona una API unificada que se integra a la perfección con los principales proveedores de IA, como OpenAI, ElevenLabs y AssemblyAI, para ayudar a...
hace 1 año
072.4K