Detecção visual de alvos

Total de 18 artigos

organizar em ordem

Trackers: biblioteca de ferramentas de código aberto para rastreamento de objetos de vídeo

Introdução geral Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, e permite que os usuários combinem diferentes modelos de detecção de objetos (como o YOLO...

5 meses atrás

018.2K

Describe Anything: uma ferramenta de código aberto para gerar descrições detalhadas de imagens e áreas de vídeo

Descrição geral O Describe Anything é um projeto de código aberto desenvolvido pela NVIDIA e por várias universidades, com o modelo Describe Anything (DAM) em seu núcleo. Essa ferramenta pode marcar imagens ou vídeos com base nas informações do usuário...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

5 meses atrás

019.9K

Find My Kids: ferramenta de monitoramento de segurança infantil por meio de reconhecimento facial e notificações do WhatsApp

Introdução geral O Find My Kids é um projeto de código aberto hospedado no GitHub e criado pelo desenvolvedor Tomer Klein. Ele combina a tecnologia de reconhecimento facial DeepFace com a API verde do WhatsApp...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

5 meses atrás

017.2K

YOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetos

O YOLOE é um projeto de código aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch, pertence à série YOLO de extensões ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Chaveamento de IA para alterar os planos de fundo # Detecção visual de alvos

6 meses atrás

021.4K

SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos

Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Chaveamento de IA para alterar os planos de fundo # Detecção visual de alvos

6 meses atrás

018.8K

RF-DETR: um modelo de código aberto para detecção de objetos visuais em tempo real

Introdução abrangente O RF-DETR é um modelo de detecção de objetos de código aberto desenvolvido pela equipe do Roboflow. Ele se baseia na arquitetura Transformer e seu principal recurso é a eficiência em tempo real. Pela primeira vez, o modelo atinge mais de 60 APs em tempo real no conjunto de dados Microsoft COCO...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

6 meses atrás

021.7K

HumanOmni: um macromodelo multimodal para análise de emoções e ações em vídeos humanos

Introdução geral O HumanOmni é um grande modelo multimodal de código aberto desenvolvido pela equipe HumanMLLM e hospedado no GitHub. Ele se concentra na análise de vídeos humanos e pode processar imagens e sons para ajudar a entender emoções, ações e conteúdo de diálogos. O projeto usou 2...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

6 meses atrás

017K

Vision Agent: uma inteligência visual para resolver várias tarefas de detecção visual de alvos

Introdução geral O Vision Agent é um projeto de código aberto desenvolvido pela LandingAI (Equipe Enda Wu) e hospedado no GitHub, projetado para ajudar os usuários a gerar código rapidamente para resolver tarefas de visão computacional. Ele usa uma estrutura de agente avançada e modelos multimodais...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

017.7K

MakeSense: uma ferramenta de anotação de imagens de uso gratuito para aumentar a eficiência do projeto de visão computacional

Introdução geral O Make Sense é uma ferramenta gratuita de anotação de imagens on-line criada para ajudar os usuários a preparar rapidamente conjuntos de dados para projetos de visão computacional. Ela não requer instalação complicada, basta abrir um acesso ao navegador para usá-la, é compatível com vários sistemas operacionais e é ideal para pequenos projetos de aprendizagem profunda. Os usuários podem...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

019.7K

YOLOv12: uma ferramenta de código aberto para detecção de alvos em imagens e vídeos em tempo real

Introdução abrangente O YOLOv12 é um projeto de código aberto desenvolvido pelo usuário do GitHub sunsmarterjie, com foco na tecnologia de detecção de alvos em tempo real. O projeto é baseado na série de estruturas YOLO (You Only Look Once), a introdução de notas ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

028K

VLM-R1: um modelo de linguagem visual para localizar alvos de imagem por meio de linguagem natural

Introdução geral O VLM-R1 é um projeto de modelagem de linguagem visual de código aberto desenvolvido pelo Om AI Lab e hospedado no GitHub. O projeto se baseia na abordagem R1 do DeepSeek, combinada com o modelo Qwen2.5-VL, por meio do aprendizado por reforço...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

021.7K

HealthGPT: um grande modelo médico para apoiar a análise de imagens médicas e as perguntas e respostas de diagnóstico

Introdução abrangente O HealthGPT é um modelo avançado de linguagem visual médica que visa a obter recursos unificados de geração e compreensão visual médica por meio da adaptação de conhecimento heterogêneo. O objetivo do projeto é integrar os recursos de geração e compreensão visual médica em uma estrutura autorregressiva unificada que aprimora significativamente o gráfico médico...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

018.5K

MedRAX: um corpo inteligente para análise de radiografias de tórax usando macromodelos multimodais

Introdução abrangente O MedRAX é uma inteligência de IA de última geração projetada para análise de radiografia de tórax (CXR). Ele integra ferramentas de análise de CXR de última geração e modelos multimodais de linguagem ampla para processar dinamicamente consultas médicas complexas sem treinamento adicional.

Recursos mais recentes de IA # Projeto de código aberto AI Java Aplicação do corpo inteligente ## Detecção visual de alvos

6 meses atrás

019.6K

Agentic Object Detection：无需标注和训练的视觉目标检测工具

Agentic Object Detection: uma ferramenta para detecção de objetos visuais sem anotação e treinamento

Introdução abrangente A Agentic Object Detection é uma ferramenta avançada de detecção de alvos da Landing AI. A ferramenta realiza a detecção por meio de prompts de texto, eliminando a necessidade de anotação de dados e treinamento de modelos, simplificando muito o processo de detecção de alvos tradicional...

Recursos mais recentes de IA # Detecção visual de alvos

7 meses atrás

017.5K

CogVLM2: modelo multimodal de código aberto para apoiar a compreensão de vídeos e várias rodadas de diálogo

Introdução abrangente O CogVLM2 é um modelo multimodal de código aberto desenvolvido pelo Grupo de Pesquisa em Mineração de Dados da Universidade de Tsinghua (THUDM), com base na arquitetura Llama3-8B e com o objetivo de oferecer desempenho comparável ou até melhor que o GPT-4V. O modelo oferece suporte à compreensão de imagens, ao diálogo em várias rodadas e à...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

020.8K

Gaze-LLE: ferramenta de previsão de alvos para o olhar de pessoas em vídeos

O Synthesis Gaze-LLE é uma ferramenta de previsão do alvo do olhar baseada em um codificador de aprendizado em larga escala. Ela foi desenvolvida por Fiona Ryan, Ajay Bati, Sangmin Lee, Daniel Bolya, Judy Hoffman e J...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

6 meses atrás

019K

Video Analyzer: analisa o conteúdo do vídeo e gera descrições detalhadas

O Comprehensive Introduction Video Analyzer é uma ferramenta abrangente de análise de vídeo que combina visão computacional, transcrição de áudio e técnicas de processamento de linguagem natural para gerar descrições detalhadas do conteúdo do vídeo. A ferramenta transcreve o conteúdo de áudio extraindo quadros-chave do vídeo...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

7 meses atrás

024.2K

Twelve Labs：理解视频内容的多模态AI解决方案，视频搜索、生成、嵌入API服务

Twelve Labs: soluções multimodais de IA para compreensão de conteúdo de vídeo, pesquisa de vídeo, geração e incorporação de serviços de API

Introdução geral A Twelve Labs é uma empresa de IA multimodal focada na compreensão de vídeos, dedicada a ajudar os usuários a compreender e processar grandes quantidades de conteúdo de vídeo por meio de tecnologias avançadas de IA. Suas principais tecnologias incluem pesquisa, geração e incorporação de vídeo, que são capazes de extrair os principais recursos do vídeo, como ações, objetos...

Recursos mais recentes de IA # Serviços abertos de IA # Detecção visual de alvos

7 meses atrás

017.4K

Não é isso.