Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
Google Vids:从提示指令和文档开始创作营销讲解视频

Google Vids: Creación de vídeos explicativos de marketing a partir de instrucciones y documentos de aviso

Introducción general Google Vids es una herramienta de creación de vídeo basada en IA del paquete Google Workspace diseñada para ayudar a los usuarios a crear y compartir fácilmente contenido de vídeo relacionado con el trabajo. Con sencillas instrucciones e integración de clips, los usuarios pueden generar historias...
hace 1 año
059.9K
TableGPT2:表格数据集成的多模态模型

TableGPT2: un modelo multimodal para la integración de datos tabulares

Introducción general TableGPT2 es un modelo multimodal desarrollado por un equipo de la Universidad de Zhejiang, centrado en la integración y el procesamiento de datos tabulares. El modelo está preentrenado y perfeccionado para poder realizar tareas relacionadas con datos de tablas, al tiempo que mantiene unas sólidas capacidades de lenguaje y codificación de propósito general.TableGP...
hace 1 año
054.7K
Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容

Contexto: integración sin fisuras de varias fuentes de datos, automatización de agentes con múltiples funciones para completar el contenido de diferentes escenarios de trabajo.

Introducción general Context Autopilot es una herramienta inteligente de productividad AI de Context diseñada para mejorar la productividad del equipo a través de una profunda integración y automatización de la oficina. La herramienta aprovecha el primer motor de contexto del mundo, Context-1...
hace 1 año
054.7K
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。

Próximamente, Kling 1.5: "Modelos personalizados" entrena a los personajes con sus propias secuencias de vídeo.

La función "Modelo personalizado" de Kling AI permite a los usuarios entrenar a sus personajes subiendo de 10 a 30 vídeos (cada uno de al menos 10 segundos de duración). El proceso es muy diferente de los modelos tradicionales de entrenamiento de imágenes, ya que Kling AI utiliza secuencias de vídeo para...
hace 1 año
055.5K
EyeLevel(GroundX):多模态企业文档数据处理平台,从RAG源头消除LLMs幻觉

EyeLevel (GroundX): una plataforma multimodal de tratamiento de datos de documentos empresariales que elimina la ilusión de los LLM de la fuente RAG.

Introducción exhaustiva EyeLevel se centra en la prevención de ilusiones de datos mediante la conversión de contenidos empresariales complejos en datos aptos para el procesamiento de Large Language Modelling (LLM). Gracias a su exclusivo motor de transformación de datos y a su tecnología de procesamiento multimodal, EyeLevel es capaz de transformar tablas complejas, gráficos...
hace 1 año
056.1K
WebSpy:网站SEO指标分析和测试网站请求,优化网站性能

WebSpy: métricas SEO del sitio web para analizar y probar las solicitudes del sitio web y optimizar su rendimiento

Introducción general WebSpy es una potente herramienta de análisis y pruebas de sitios web diseñada para desarrolladores y probadores. Permite a los usuarios monitorizar y editar peticiones y respuestas HTTP de un sitio web, soportando múltiples tipos de peticiones (como GET, POST, PUT, PATCH, DE...
hace 1 año
052.2K
fal:为开发者提供富媒体类生成式大模型API服务

fal: API de macromodelado generativo para desarrolladores de clases multimedia enriquecidas

Introducción general fal es una plataforma de inferencia de IA en línea que ayuda a los usuarios a crear aplicaciones de IA en tiempo real con modelos generativos multimedia de alta calidad, incluyendo imágenes, vídeo y audio. No requiere arranque en frío, pago por uso. fal ofrece una amplia gama de modelos generativos preentrenados, como Stable Dif...
hace 1 año
075.3K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: persona digital interactiva de voz en tiempo real con clonación personalizada de imágenes y tonos, compatible con soluciones de voz de extremo a extremo y soluciones en cascada.

Introducción general VideoChat es un proyecto de persona digital de interacción de voz en tiempo real basado en tecnología de código abierto, que admite tanto esquemas de voz de extremo a extremo (GLM-4-Voice - THG) como esquemas en cascada (ASR-LLM-TTS-THG). El proyecto permite a los usuarios personalizar la ...
hace 1 año
062.6K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): asistente de voz local en tiempo real, versión de código abierto de Siri.

Introducción general Ichigo es un proyecto de IA de voz en tiempo real de código abierto que pretende ampliar los modelos de lenguaje basados en texto con capacidades de "escucha" nativa. El proyecto utiliza técnicas de fusión temprana inspiradas en el documento Chameleon de Meta.El objetivo de Ichigo es convertirse...
hace 1 año
062.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: genere datos de entrenamiento de IA mediante la API gratuita de big models, generación de datos de entrenamiento de big models a coste 0.

Introducción completa SFT-data-builder es un proyecto de código abierto diseñado para generar datos de entrenamiento SFT de alta calidad utilizando la API gratuita Big Model combinada con datos de dominio privado de los usuarios. La herramienta admite múltiples formatos de modelos de IA y ofrece generación con un solo clic, generación por lotes, edición flexible y...
hace 1 año
056.6K