AI 공유 서클

왕을 위해 전당포와 나눔을 실천하는 날!

트래커: 동영상 개체 추적을 위한 오픈 소스 도구 라이브러리

일반 소개 트래커는 동영상에서 다중 객체 추적에 초점을 맞춘 오픈 소스 Python 도구 라이브러리입니다. 이 라이브러리는 SORT 및 DeepSORT와 같은 여러 주요 추적 알고리즘을 통합하고 사용자가 다양한 객체 감지 모델(예: YOLO...

1 년 전

096.4K

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...

1 년 전

0189.9K

무엇이든 설명하기: 이미지 및 동영상 영역에 대한 자세한 설명을 생성하는 오픈 소스 도구

일반 설명 Describe Anything은 NVIDIA와 여러 대학에서 개발한 오픈 소스 프로젝트로, 그 핵심은 DAM(Describe Anything Model)입니다. 이 도구는 사용자가 이미지나 동영상에 태그를 지정할 수 있습니다.

1 년 전

082.2K

Cooragent: 한 문장으로 다중 지능 작업 협업 도구 구축하기

일반 소개 쿠라젠트는 칭화대학교의 LeapLab에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 에이전트 협업 프레임워크로, 사용자가 한 문장 설명으로 지능형 AI 에이전트를 만들 수 있으며 복잡한 작업에서 여러 에이전트가 협업할 수 있도록 지원합니다. 이 프레임워크는 두 가지 기능을 제공합니다.

1 년 전

084.6K

InstantCharacter: 단일 이미지에서 일관된 문자를 생성하는 오픈 소스 도구

일반 소개 인스턴트캐릭터는 텐센트 후위안과 인스턴트엑스 팀이 개발한 오픈소스 프로젝트로, 깃허브에서 호스팅됩니다. 참조 이미지와 텍스트 설명이 포함된 일관된 모양의 캐릭터 맵을 생성합니다...

1 년 전

0108.8K

심층 연구 보고서 생성을 위한 Claude의 MCP 서비스

일반 소개 MCP 서버 딥 리서치는 인공지능과 웹 검색을 통해 복잡한 문제에 대한 구조화된 연구 보고서를 자동으로 생성하는 오픈 소스 도구입니다. 사용자가 연구 질문을 입력하면 도구가 질문을 분석하고, 권위 있는 정보를 검색하고, 출처 신뢰도를 평가합니다...

1 년 전

076.1K

딥 리콜: 대규모 모델을 위한 엔터프라이즈급 메모리 프레임워크를 제공하는 오픈 소스 도구

포괄적인 소개 딥 리콜은 대규모 언어 모델(LLM)을 위해 설계된 오픈 소스 엔터프라이즈급 메모리 프레임워크입니다. 효율적인 문맥 검색 및 통합을 통해 고도로 개인화된 응답성을 제공합니다. 이 프레임워크는 메모리 서비스, 추론 서비스, 코디네이터를 포함한 3계층 아키텍처를 사용하여 다음을 지원합니다.

1 년 전

088.4K

CleverBee: 인용 연구를 생성하는 오픈 소스 AI 연구 도우미

일반 소개 CleverBee는 GitHub에서 호스팅되고 SureScaleAI에서 개발한 오픈 소스 AI 연구 도우미입니다. 웹 브라우징 기술과 대규모 언어 모델(예: Gemini 및 Claude)을 결합하여 사용자를 돕습니다.

1 년 전

078K

판타지토킹: 사실적으로 말하는 인물 사진을 생성하는 오픈 소스 툴

일반 소개 판타지토킹은 판타지-AMAP 팀이 개발한 오픈 소스 프로젝트로, 오디오 드라이브를 통해 사실적으로 말하는 인물 비디오를 생성하는 데 중점을 두고 있습니다. 이 프로젝트는 오디오 인코더 Wa와 결합된 고급 비디오 확산 모델 Wan2.1을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

080.6K

Paper2Code: 머신 러닝 논문을 실행 가능한 코드로 자동 변환하기

일반 소개 Paper2Code는 머신러닝 논문에 대한 코드 구현 부족 문제를 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 LLM(대규모 언어 모델링) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획을 사용합니다 ...

1 년 전

084.5K