시각적 표적 감지

총 18개 기사
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: 실시간 비디오 감지 및 객체 세분화를 위한 오픈 소스 도구

YOLOE는 칭화대학교 소프트웨어학부의 멀티미디어 인텔리전스 그룹(THU-MIG)에서 개발한 오픈 소스 프로젝트로, 정식 명칭은 "You Only Look Once Eye"입니다. YOLO 시리즈 확장에 속하는 PyTorch 프레임워크를 기반으로 합니다.
4개월 전
01.1K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: 동영상에서 임의의 움직이는 객체를 자동으로 분할하는 오픈 소스 도구

일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.
4개월 전
01.2K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: 컴퓨터 비전 프로젝트의 효율성을 높여주는 무료 이미지 주석 도구

일반 소개 Make Sense는 사용자가 컴퓨터 비전 프로젝트를 위한 데이터 세트를 빠르게 준비할 수 있도록 설계된 무료 온라인 이미지 주석 도구입니다. 복잡한 설치 없이 브라우저에 액세스하기만 하면 사용할 수 있고, 여러 운영 체제를 지원하며, 소규모 딥 러닝 프로젝트에 이상적입니다. 사용자는 다음을 수행할 수 있습니다.
6개월 전
01.7K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: 멀티모달 매크로 모델을 사용한 흉부 방사선 사진 분석용 지능형 바디

포괄적인 소개 MedRAX는 흉부 엑스레이(CXR) 분석을 위해 설계된 최첨단 AI 인텔리전스입니다. 최첨단 CXR 분석 도구와 멀티모달 대규모 언어 모델을 통합하여 추가 교육 없이 복잡한 의료 쿼리를 동적으로 처리하며, 모듈식 설계를 통해 MedRAX는 ...
5개월 전
01.9K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

동영상 분석기: 동영상 콘텐츠를 분석하고 자세한 설명을 생성합니다.

종합 소개 비디오 분석기는 컴퓨터 비전, 오디오 트랜스크립션 및 자연어 처리 기술을 결합하여 자세한 비디오 콘텐츠 설명을 생성하는 종합적인 비디오 분석 도구입니다. 이 도구는 비디오에서 주요 프레임을 추출하여 오디오 콘텐츠를 트랜스크립션합니다.
6개월 전
03.2K
Twelve Labs:理解视频内容的多模态AI解决方案,视频搜索、生成、嵌入API服务

Twelve Labs: 비디오 콘텐츠 이해, 비디오 검색, 생성, API 서비스 임베딩을 위한 멀티모달 AI 솔루션

회사 소개 Twelve Labs는 동영상 이해에 중점을 둔 멀티모달 AI 회사로, 고급 AI 기술을 통해 사용자가 대량의 동영상 콘텐츠를 이해하고 처리할 수 있도록 돕는 데 전념하고 있습니다. 핵심 기술로는 동영상 검색, 생성, 임베딩이 있으며, 동영상에서 동작, 사물 등 주요 특징을 추출할 수 있습니다.
6개월 전
01.8K