Círculo de intercambio de inteligencia artificial

¡Día arqueando un peón y compartiendo por el rey!
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, una plataforma para construir modelos base de IA del mundo físico.

Introducción completa NVIDIA Cosmos es una plataforma de modelado basada en mundos para desarrolladores, diseñada específicamente para ayudar a los desarrolladores de IA de física a crear sus sistemas de IA de física mejor y más rápido. La plataforma ofrece una amplia gama de modelos preentrenados, incluidos modelos de difusión y autorregresivos...
hace 1 año
060.4K
将文字描述或文档转换为美观的概念示意图,快速为PPT或文章配图

Convierta descripciones de texto o documentos en bellos diagramas conceptuales e ilustre rápidamente PPT o artículos.

Creo que la probabilidad es que las imágenes, tablas, diagramas de flujo. Hoy recomendamos un texto AI libre a la herramienta visual, la textura es un poco de vaca, se siente como Figma una textura tan grande fábrica, simple y poderoso. Por supuesto, también puede ser un muy bonito y práctico notas, documentos herramienta ...
hace 1 año
056.2K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Creación de mini-inteligencias LLM con "estructura de grafo dirigido" en 100 líneas de código

Introducción general miniLLMFlow es un marco de desarrollo minimalista de Large Language Model (LLM) que contiene sólo 100 líneas de código central, demostrando la filosofía de diseño de "mantenerlo simple". El marco está diseñado específicamente para permitir a los asistentes de IA (por ejemplo, ChatGPT, Claude, etc.)...
hace 1 año
057.8K
GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力

GraphReader: inteligencia basada en grafos para mejorar el procesamiento de textos largos en modelos lingüísticos de gran tamaño

GraphReader: una inteligencia basada en grafos que mejora el tratamiento de textos largos para grandes modelos lingüísticos Experto en grafos: como un tutor experto en hacer mapas mentales, transforma textos largos en una clara red de conocimientos, lo que permite a la IA encontrar los distintos niveles necesarios para una respuesta tan fácilmente como explorar a lo largo de un mapa...
hace 1 año
046.8K
微信语音消息还能这样玩?小白也能用 Devbox 轻松实现公众号语音转文字!

¿Los mensajes de voz de WeChat se pueden reproducir así? Incluso un principiante puede utilizar Devbox para conseguir fácilmente la conversión de voz a texto de un número público.

A mucha gente le gustaría utilizar directamente la entrada de voz de WeChat, siempre es más rápido hablar que escribir. A diferencia de los formatos comunes .mp3 y .wav, la entrada de voz de WeChat utiliza el formato .amr por defecto. La imagen de abajo muestra el webhook de WeChat recibido por el servidor del desarrollador, indicando...
hace 1 año
044.4K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: Construye tu compañero de chat AI, diálogo de voz fácil e interacción inteligente.

Introducción Xiaozhi AI Chatbot es un proyecto de código abierto basado en la placa de desarrollo ESP32, diseñado para ayudar a los usuarios a construir su propio compañero de chat de IA. El proyecto fue desarrollado por Shrimp y se utiliza principalmente con fines didácticos para ayudar a más personas a iniciarse en el desarrollo de hardware de IA y entender cómo aplicar grandes modelos de lenguaje a...
hace 1 año
0218.1K
DashInfer-VLM,多模态SOTA推理性能,超vLLM!

¡DashInfer-VLM, rendimiento de inferencia SOTA multimodal, ultra-vLLM!

Introducción DashInfer-VLM es una arquitectura de inferencia para grandes modelos visuales multimodales VLM, especialmente optimizada para la aceleración de inferencia de modelos Qwen VL. La mayor diferencia entre DashInfer-VLM y otros marcos de aceleración de inferencia para VLM es que pone la parte VIT...
hace 1 año
055.4K
将描述业务流程的文档转换为业务流程图:以辅导公司上市文档为例

Conversión de un documento que describe un proceso de negocio en un diagrama de proceso de negocio: ejemplo de un documento para asesorar a una empresa que sale a bolsa

Alguien en el grupo preguntó: ¿Qué senior sabe que ai puede dibujar el diagrama de flujo de información de las empresas que cotizan en bolsa? Supongo que es el listado de documentos de asesoramiento relacionados con el proceso, de hecho, no necesita ninguna herramienta, siempre y cuando se puede dibujar un diagrama de flujo de la muestra, por lo que el gran modelo para generar código SVG puede ser, por supuesto, la sintaxis de sirena puede ser ...
hace 1 año
051.5K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: una plantilla Next.js para crear aplicaciones de IA con diálogo de voz en tiempo real

Introducción completa OpenAI Realtime API Next.js es un proyecto de código abierto basado en el framework Next.js , diseñado para ayudar a los desarrolladores a crear rápidamente aplicaciones de IA de voz en tiempo real . El proyecto integra la API en tiempo real de OpenAI y la tecnología WebRTC....
hace 1 año
049.7K
Film-Scan-Converter:扫描RAW图像格式的胶片转换为成品图像

Film-Scan-Converter: Convierte la película escaneada en formato de imagen RAW a imagen acabada.

Descripción general Film-Scan-Converter es un script Python de código abierto diseñado para procesar escaneos de película RAW tomados por cámaras digitales. El script es capaz de convertir escaneos de película en formato RAW en imágenes finales utilizables para...
hace 1 año
055.9K