Detección visual de objetivos

Total 18 artículos

ordenar

Analizador de vídeo: analiza el contenido de los vídeos y genera descripciones detalladas.

Comprehensive Introduction Video Analyzer es una completa herramienta de análisis de vídeo que combina técnicas de visión por ordenador, transcripción de audio y procesamiento del lenguaje natural para generar descripciones detalladas del contenido del vídeo. La herramienta transcribe el contenido de audio extrayendo fotogramas clave del vídeo....

hace 1 año

0148.6K

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

0140.1K

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

0126.6K

RF-DETR: un modelo de código abierto para la detección visual de objetos en tiempo real

Introducción general RF-DETR es un modelo de detección de objetos de código abierto desarrollado por el equipo Roboflow. Se basa en la arquitectura Transformer y su característica principal es la eficiencia en tiempo real. Por primera vez, el modelo alcanza más de 60 AP de tiempo real en el conjunto de datos COCO de Microsoft....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

0117.8K

VLM-R1: un modelo de lenguaje visual para localizar objetivos de imagen mediante lenguaje natural

Introducción exhaustiva VLM-R1 es un proyecto de modelado visual del lenguaje de código abierto desarrollado por Om AI Lab y alojado en GitHub. El proyecto se basa en el enfoque R1 de DeepSeek, combinado con el modelo Qwen2.5-VL, a través del aprendizaje por refuerzo....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

098.9K

YOLOE: una herramienta de código abierto para la detección de vídeo en tiempo real y la segmentación de objetos

YOLOE es un proyecto de código abierto desarrollado por el Grupo de Inteligencia Multimedia (THU-MIG) de la Escuela de Software de la Universidad de Tsinghua, cuyo nombre completo es "You Only Look Once Eye". Está basado en el framework PyTorch , pertenece a la serie de extensiones YOLO ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos # Detección visual de objetivos

hace 1 año

097.2K

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

Introducción general Trackers es una biblioteca de herramientas Python de código abierto centrada en el seguimiento multiobjeto en vídeo. Integra varios algoritmos de seguimiento líderes, como SORT y DeepSORT, y permite a los usuarios combinar diferentes modelos de detección de objetos (como YOLO...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

095.1K

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos # Detección visual de objetivos

hace 1 año

088.9K

CogVLM2: modelo multimodal de código abierto para la comprensión de vídeos y rondas múltiples de diálogo

Introducción CogVLM2 es un modelo multimodal de código abierto desarrollado por el Grupo de Investigación de Minería de Datos de la Universidad de Tsinghua (THUDM), basado en la arquitectura Llama3-8B, y cuyo objetivo es proporcionar un rendimiento comparable o incluso mejor que GPT-4V. El modelo permite la comprensión de imágenes, el diálogo...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

086.7K

MedRAX: un organismo inteligente para el análisis de radiografías de tórax mediante macromodelos multimodales

Introducción completa MedRAX es una inteligencia artificial de última generación diseñada para el análisis de radiografías de tórax (CXR). Integra herramientas de análisis CXR de última generación y grandes modelos de lenguaje multimodal para procesar dinámicamente consultas médicas complejas sin formación adicional.MedRAX, a través de su diseño modular...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente # Detección visual de objetivos

hace 1 año

086.1K

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

Introducción general Vision Agent es un proyecto de código abierto desarrollado por LandingAI (Team Enda Wu) y alojado en GitHub, diseñado para ayudar a los usuarios a generar rápidamente código para resolver tareas de visión por ordenador. Utiliza un marco de agentes avanzado y modelos multimodales...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

085.1K

HumanOmni: un macromodelo multimodal para analizar emociones y acciones humanas en vídeo

Introducción general HumanOmni es un gran modelo multimodal de código abierto desarrollado por el equipo HumanMLLM y alojado en GitHub. Se centra en el análisis de vídeos humanos y puede procesar tanto la imagen como el sonido para ayudar a comprender las emociones, las acciones y el contenido de los diálogos. El proyecto utiliza 2...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

083.9K

HealthGPT: un gran modelo médico de apoyo al análisis de imágenes médicas y a las preguntas y respuestas diagnósticas

Introducción exhaustiva HealthGPT es un modelo avanzado de gran lenguaje visual médico que pretende lograr capacidades unificadas de comprensión y generación visual médica mediante la adaptación de conocimientos heterogéneos. El objetivo del proyecto es integrar la comprensión visual médica y las capacidades de generación en un marco autorregresivo unificado que mejore significativamente la...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

080.6K

Describe Anything: herramienta de código abierto para generar descripciones detalladas de imágenes y zonas de vídeo.

Introducción general Describe Anything es un proyecto de código abierto desarrollado por NVIDIA y varias universidades, cuyo núcleo es el modelo Describe Anything (DAM). Esta herramienta puede etiquetar imágenes o vídeos basándose en la...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

080.6K

Twelve Labs：理解视频内容的多模态AI解决方案，视频搜索、生成、嵌入API服务

Twelve Labs: soluciones de IA multimodal para la comprensión de contenidos de vídeo, búsqueda de vídeos, generación, incrustación de servicios API

Introducción general Twelve Labs es una empresa de IA multimodal centrada en la comprensión de vídeo, dedicada a ayudar a los usuarios a comprender y procesar grandes cantidades de contenido de vídeo mediante tecnologías avanzadas de IA. Sus tecnologías principales incluyen la búsqueda, generación e incrustación de vídeo, que son capaces de extraer características clave del vídeo como acciones, objetos...

Últimos recursos sobre IA # AI Servicios abiertos # Detección visual de objetivos

hace 1 año

080.4K

Gaze-LLE: herramienta de predicción de la mirada de una persona en vídeo

Synthesis Gaze-LLE es una herramienta de predicción del objetivo de la mirada basada en un codificador de aprendizaje a gran escala. Fue desarrollada por Fiona Ryan, Ajay Bati, Sangmin Lee, Daniel Bolya, Judy Hoffman y J...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

078.8K

Agentic Object Detection：无需标注和训练的视觉目标检测工具

Agentic Object Detection: una herramienta para la detección visual de objetos sin anotación ni entrenamiento

Introducción Agentic Object Detection es una herramienta avanzada de detección de objetivos de Landing AI. La herramienta realiza la detección mediante mensajes de texto, eliminando la necesidad de anotación de datos y entrenamiento de modelos, lo que simplifica enormemente el proceso de detección de objetivos tradicional...

Últimos recursos sobre IA # Detección visual de objetivos

hace 1 año

075.9K

Find My Kids: herramienta de vigilancia de la seguridad infantil mediante reconocimiento facial y notificaciones de WhatsApp

Introducción general Find My Kids es un proyecto de código abierto alojado en GitHub y creado por el desarrollador Tomer Klein. Combina la tecnología de reconocimiento facial DeepFace con la Green API de WhatsApp....

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 1 año

072.3K

No es eso.