여러 고급 음성 합성 서비스를 통합하는 오픈 소스 운영 프로젝트
일반 소개 오픈 보이스 캔버스는 ItusiAI 팀에서 개발한 오픈 소스 음성 합성 플랫폼입니다. 50개 이상의 언어를 지원하며, 텍스트를 자연스러운 음성으로 변환하고 오디오를 업로드하여 개인화된 음성을 복제할 수 있습니다. 이 프로젝트는 Ope...
Libra: 대화를 통해 로컬 AI 인텔리전스를 생성하는 클라이언트(내부 테스트)
일반 소개 Libra는 자연어 대화를 통해 로컬에서 실행되는 AI 지능을 생성하는 것이 핵심 기능인 Greenbit.ai의 혁신적인 도구입니다. "바이브 에이전트"라고 불리는 이 도구는 사용자가 자신의 요구 사항을 간단한 용어로 설명하고 빠르게 생성할 수 있습니다.
VideoMind: 타임스탬프별 동영상 포지셔닝 콘텐츠 및 Q&A 오픈 소스 프로젝트
일반 소개 비디오마인드는 긴 동영상을 위한 추론, Q&A 및 요약 생성에 중점을 둔 오픈 소스 멀티모달 AI 도구입니다. 홍콩 폴리테크닉 대학교의 예 리우와 싱가포르 국립대학교의 쇼 랩 팀이 개발했습니다. 이 도구는 비디오에 대한 인간의 이해를 모방합니다...
슈퍼코더: 명령줄 터미널 실행을 위한 지능형 코드 도우미
일반 소개 슈퍼코더는 터미널에서 실행되는 지능형 도구로 프로그래머를 위해 설계되었습니다. AI 기술을 사용하여 사용자가 코드를 검색하고, 프로젝트 구조를 보고, 파일을 편집하고, 버그를 수정할 수 있도록 도와주며, 이 프로젝트는 GitHub의 huytd에서 오픈 소스이며 다음을 지원합니다.
Emigo: Emacs에서 AI를 사용한 복잡한 프로그래밍 작업을 위한 도우미
일반 소개 Emigo는 GitHub의 MatthewZMD가 개발한 Emacs용으로 설계된 오픈 소스 AI 프로그래밍 도우미입니다. 대규모 언어 모델(LLM)을 통합하여 프로그래머가 Emacs에서 코드 분석을 완료할 수 있도록 도와줍니다....
SegAnyMo: 동영상에서 임의의 움직이는 객체를 자동으로 분할하는 오픈 소스 도구
일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.
세로형 이중 스타일 비교 단서 단어를 생성하는 ChatGPT
큐 워드 미야자키 하야오의 드라마틱한 정면 클로즈업 초상화. 구도가 완벽하게 대칭을 이루며...
Gemini 2.5와 Three.js가 만나면 데모 애니메이션을 가르치는 솔루션이 완성됩니다!
Three.js는 웹 페이지에 '3차원' 이미지를 표시할 수 있는 도구입니다. 개발자가 웹 페이지에 큐브, 구 등의 3D 모양을 그릴 수 있는 도구 세트를 제공합니다. 또한 이러한 3D 도형을 움직일 수 있도록 허용하므로 ...
GeminiCode: 터미널에서 실행되는 Gemini 2.5 기반 AI 프로그래밍 도우미
일반 소개 GeminiCode는 개발자들이 주말 여가 시간에 개발한 터미널에서 실행되는 AI 프로그래밍 도우미입니다. Google의 Gemini 2.5 Pro 모델을 기반으로 하며 컴퓨터의 현재 디렉토리에 있는 파일을 읽고 수정할 수 있습니다. 이...
GenXD: 임의의 3D 및 4D 장면의 동영상을 생성하기 위한 오픈 소스 프레임워크
일반 소개 GenXD는 싱가포르 국립대학교(NUS)와 마이크로소프트 팀이 개발한 오픈 소스 프로젝트입니다. 불충분한 데이터와 모델 설계 복잡성으로 인한 실제 3D 및 4D 생성 문제를 해결하기 위해 임의의 3D 및 4D 장면을 생성하는 데 중점을 둡니다. 이 프로젝트는 ...