Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo

escritos487 dirección web273 Libro0 hardware0 comentarios0

Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes

Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.

Últimos recursos sobre IA

hace 9 meses

038.7K

Handy - Herramienta de conversión de voz a texto de AI nativa, gratuita y de código abierto

Handy es una herramienta local de voz a texto de código abierto y gratuita, compatible con sistemas Windows, MacOS y Linux, desarrollada por Rust y React. Al procesar los datos de voz localmente sin subirlos a la nube, garantiza la privacidad y la seguridad, y es adecuada para la transcripción rápida y la introducción de texto.

Últimos recursos sobre IA

hace 9 meses

086.3K

FG-CLIP 2 - 360 Modelo de lenguaje visual multimodal de código abierto para gráficos

FG-CLIP 2 es el modelo gráfico de lenguaje visual multimodal (VL-M) líder en el mundo, lanzado por el Instituto de Investigación 360 Artificial Intelligence, que ha superado a modelos similares de Google y Meta en 29 pruebas comparativas autorizadas, lo que lo convierte en el VL-M más potente de la actualidad....

Últimos recursos sobre IA

hace 9 meses

039.8K

Micro Opinion BettaFish - Sistema de análisis de opiniones multiinteligencia de código abierto

BettaFish es un sistema de análisis de opinión multi-inteligencia de código abierto. Utilizando la arquitectura de cuerpo multi-inteligente, a través de Query, Media, Insight, Report y otros Agentes trabajan juntos para lograr la recuperación, extracción y presentación de informes de bucle cerrado. El sistema es compatible con ...

Últimos recursos sobre IA

hace 9 meses

078.8K

Ouro - Un nuevo modelo de lenguaje cíclico de código abierto del equipo ByteHopper Seed

Ouro es un nuevo tipo de Looped Language Models (LLMs) desarrollado por el equipo de ByteDance Seed, con la innovación central de construir directamente capacidades de inferencia en la fase de pre-entrenamiento a través de una estructura computacional recurrente de parámetros compartidos. El modelo utiliza 24 capas como bloque base, a través de...

Últimos recursos sobre IA

hace 9 meses

053.2K

ChronoEdit: NVIDIA y la Universidad de Toronto abren un marco de edición de imágenes basado en IA

ChronoEdit, un marco de edición de imágenes de IA de código abierto desarrollado conjuntamente por NVIDIA y la Universidad de Toronto, redefine la tarea de edición de imágenes como una tarea de generación de vídeo para garantizar que los resultados de la edición sean coherentes temporal y físicamente. Mediante la destilación de un modelo de generación de vídeo preentrenado con 14B...

Últimos recursos sobre IA

hace 9 meses

046.2K

LongCat-Flash-Omni - Un modelo de gran lenguaje completamente modal para Meituan Open Source

LongCat-Flash-Omni es un modelo de gran lenguaje de código abierto totalmente modal lanzado por el equipo LongCat de Meituan. Con una escala de parámetros de 560.000 millones (27.000 millones de parámetros activados), consigue capacidades de interacción de audio y vídeo en tiempo real de nivel de milisegundos manteniendo un gran número de parámetros.

Últimos recursos sobre IA

hace 9 meses

043.5K

Petri - Marco de auditoría de seguridad de IA de código abierto de Anthropic

Petri es un marco de auditoría de seguridad de IA de código abierto desarrollado por Anthropic que evalúa sistemáticamente la seguridad y la alineación del comportamiento de los modelos de IA. Mediante la simulación de un escenario real en el que un auditor automatizado participa en múltiples rondas de diálogo con un modelo objetivo, seguido de un agente juez que actúa sobre el modelo de...

Últimos recursos sobre IA

hace 9 meses

040.7K

Kimi Linear: una novedosa arquitectura híbrida de atención lineal de código abierto en el Lado Oscuro de la Luna

Kimi Linear es una nueva arquitectura híbrida de atención lineal de código abierto de Dark Side of the Moon, con Kimi Delta Attention (KDA) como núcleo, que optimiza el modelo de atención tradicional mediante un mecanismo de control más preciso, mejorando significativamente la eficiencia del hardware y la capacidad de control de la memoria...

Últimos recursos sobre IA

hace 9 meses

053.8K

FIBO - El primer texto JSON de código abierto del mundo con soporte nativo para generar modelos de imagen

FIBO es el primer modelo de imagen de generación de texto de código abierto del mundo con soporte nativo JSON desarrollado por Bria AI. Basado en la arquitectura DiT (Diffusion Transformer) con 8B parámetros, adopta el método de entrenamiento Flow Matching....

Últimos recursos sobre IA

hace 9 meses

046.4K

Más información