Ferramenta de resumo de texto e áudio/vídeo com IA

Total de 56 artigos
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a compreensão humana do vídeo...
2 meses atrás
01.5K