Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo

escritos487 dirección web273 Libro0 hardware0 comentarios0

GLM-ASR - Serie de modelos de reconocimiento del habla de alto rendimiento y código abierto de Wisdom Spectrum AI

GLM-ASR es una familia de modelos de reconocimiento del habla de alto rendimiento de código abierto de Smart Spectrum AI, que incluye el modelo basado en la nube GLM-ASR-2512 y el modelo de código abierto GLM-ASR-Nano-2512.GLM-ASR-2512 es el modelo de reconocimiento del habla basado en la nube...

Últimos recursos sobre IA

hace 8 meses

054K

OpenAutoGLM - Modelo de agente de IA de código abierto para teléfonos móviles de Smart Spectrum AI

OpenAutoGLM es un modelo corporal inteligente de código abierto con capacidad de "uso del teléfono móvil", que puede comprender el contenido de la pantalla del teléfono móvil mediante la percepción multimodal, y generar automáticamente el flujo de operaciones para completar las tareas especificadas por el usuario. Los usuarios sólo tienen que utilizar el lenguaje natural para describir las necesidades, como "abrir Meituan para buscar una olla caliente cercana...".

Últimos recursos sobre IA

hace 8 meses

046.2K

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense - Herramientas de código abierto para la investigación en IA y la gestión del conocimiento, Las pintas más fuertes de NotebookLM

SurfSense es una herramienta de investigación y gestión del conocimiento de IA de código abierto. Altamente personalizable, puede conectarse a motores de búsqueda, Slack, Jira, Notion, YouTube, GitHub y muchas otras fuentes de datos externas para facilitar la integración de la información. Los usuarios pueden cargar...

Últimos recursos sobre IA

hace 8 meses

044.9K

GLM-4.6V - Serie de modelos multilingües multimodales de código abierto Wisdom Spectrum AI

GLM-4.6V es una serie de grandes modelos lingüísticos multimodales de código abierto de Smart Spectrum AI. La serie contiene dos versiones: GLM-4.6V (106B-A12B), la versión base para escenarios de nube y clúster de alto rendimiento, con la arquitectura Mixed Expert (MoE), un total de unos 106.000 millones de referencias y una activación...

Últimos recursos sobre IA

hace 8 meses

041.1K

InkSight - Herramienta de Google de código abierto para el reconocimiento de la escritura a mano con inteligencia artificial

InkSight es la herramienta de reconocimiento de escritura AI de código abierto de Google que convierte notas manuscritas en papel en archivos digitales editables con tinta (por ejemplo, en formato SVG). A diferencia de OCR tradicional , puede reconocer el contenido del texto , puede restaurar el estilo de escritura a mano , la estructura del párrafo y la marca de enfoque , soporte para el procesamiento multi-idioma .

Últimos recursos sobre IA

hace 8 meses

040K

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab modelos gráficos experimentales alfabetizados en anime de código abierto

NewBie-image-Exp0.1 es el primer modelo gráfico experimental de anime nacido de texto y de código abierto del equipo NewBieAI-Lab, que utiliza la arquitectura Next-DiT con parámetros 3.5B, optimizada para el estilo secundario. El modelo está optimizado para el estilo secundario mediante un codificador de texto dual (GEMMA3-4B...

Últimos recursos sobre IA

hace 8 meses

041.5K

LongCat-Image - Modelo de generación y edición de imágenes de código abierto del grupo estadounidense LongCat team

LongCat-Image es un modelo de generación y edición de imágenes de código abierto lanzado por el equipo LongCat de Meituan. Utilizando una arquitectura híbrida de columna vertebral (MM-DiT+Single-DiT), combinada con un codificador condicional de modelo de lenguaje visual (VLM), es capaz de lograr imágenes generadas por texto y múltiples rondas de edición de imágenes....

Últimos recursos sobre IA

hace 8 meses

037.7K

VibeVoice-Realtime - Modelo ligero de texto a voz en tiempo real de código abierto de Microsoft

VibeVoice-Realtime es el modelo ligero de texto a voz (TTS) en tiempo real de código abierto de Microsoft diseñado para una interacción de baja latencia y en tiempo real. Admite la entrada de texto en streaming , desde el primer token de texto se puede vocalizar , la latencia es de solo unos 300 ms , adecuado para un número dinámico...

Últimos recursos sobre IA

hace 8 meses

037.6K

Flowra - Herramienta de desarrollo de flujos de trabajo de IA de código abierto por Magic Hitch y el equipo Wooli WULI

Flowra es el motor de ejecución de gráficos de código abierto y las herramientas de desarrollo de paquetes de nodos de ModelScope joint woo mile WULI team, es el componente central de FlowBench. A través del flujo de trabajo de organización de grafo acíclico dirigido (DAG) , con almacenamiento en caché inteligente , programación paralela , soporte distribuido ...

Últimos recursos sobre IA

hace 8 meses

037.8K

RoboCOIN - Un conjunto de datos de robots reales de doble brazo de código abierto creado por Wisdom Source en colaboración con varias universidades.

RoboCOIN es el primer conjunto de datos de máquinas reales de robots de doble brazo a gran escala del mundo, de código abierto, creado por el Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín en colaboración con varias empresas y universidades. Contiene 15 tipos de plataformas robóticas, 180.000 trayectorias de operaciones reales y 421 tipos de escenarios de tareas. Su mayor característica es la adopción de un sistema de anotación jerárquica para desmontar la tarea...

Últimos recursos sobre IA

hace 8 meses

039.1K

Más información