사운드 컨트롤은 음악 크리에이터를 전방위적으로 지원하는 혁신적인 AI 음악 제작 플랫폼입니다. 오디오 컨트롤에는 AI 작사, 작곡, 반주 생성, 전문 녹음 등 다양한 기능이 있습니다. 사용자는 간단한 가사나 멜로디 스니펫만 입력하면 AI가 록, 랩, 발라드 등을 아우르는 완전한 노래 콘텐츠를 빠르게 생성할 수 있습니다.
안티스펙트럼은 첨단 AI 기술을 기반으로 한 혁신적인 온라인 AI 음악 변환 플랫폼으로, 오디오 파일(MP3, FLAC 등)을 펜타토닉 및 간단한 악보로 변환해줍니다. 안티스펙트럼에는 음악의 반주에서 보컬을 분리하는 보컬 분리 기능이 있어 음악 제작과 믹싱을 쉽게 할 수 있습니다. 안티스펙트럼은 미디 파일 변환을 지원합니다...
Replay는 딥러닝 기술을 기반으로 한 고급 AI 음악 반주 분리 도구입니다. 이 도구는 오디오 콘텐츠를 자동으로 분석하고 리드 보컬, 보컬 및 백킹 트랙과 같은 트랙을 정확하게 분리하여 별도의 오디오 파일을 생성하는 것을 지원하며, MP3, WAV, FL과 같은 많은 일반적인 오디오 형식을 지원합니다.
후위안비디오-아바타는 텐센트 혼합원 팀과 텐센트 뮤직 티엔친 연구소가 공동으로 출시한 고급 음성 디지털 휴먼 모델입니다. 이 모델은 사용자가 업로드한 캐릭터 이미지와 오디오를 기반으로 자연스러운 표정을 생성하는 혁신적인 멀티모달 확산 트랜스포머 아키텍처를 기반으로 합니다.
헤이젠은 간소화된 동영상 제작 프로세스를 지원하는 AI 기반 디지털 휴먼 동영상 제작 플랫폼으로, 사용자가 전문가 수준의 디지털 휴먼 동영상을 빠르게 제작할 수 있도록 지원합니다. 이 플랫폼은 고급 AI 기술을 기반으로 하여 사용자가 디지털 캐릭터의 이미지와 음성을 완벽하게 제어할 수 있으며, 다양한 배경을 포함한 풍부한 자료 라이브러리를 제공합니다.
Make는 조직이 자동화된 프로세스를 기반으로 효율성과 혁신을 개선할 수 있도록 지원하는 AI 기반의 코딩 없는 자동화 플랫폼입니다. 이 플랫폼은 마케팅, 영업, 재무 등 다양한 비즈니스 시나리오를 지원하는 2,000개 이상의 사전 구축된 앱을 제공합니다. Make의 핵심 기능에는 코드 없는 시각적 프로세스 생성, AI...
MiMo-VL은 비주얼 코더, 크로스 모달 프로젝션 레이어 및 언어 모델로 구성된 Xiaomi의 오픈 소스 멀티모달 그랜드 모델입니다. 비주얼 코더는 기본 해상도 입력을 지원하고 더 많은 디테일을 보존하는 Qwen2.5-ViT를 기반으로 하며, 언어 모델은 복잡한 프로젝션을 위해 설계된 Xiaomi의 자체 개발 MiMo-7B를 기반으로 합니다.
Olovka AI는 학생들을 위한 AI 학술 작문 지원 플랫폼으로, 학생의 학업 수준, 전공 분야 및 논문 유형에 따라 정확한 작문 조언과 지원을 제공합니다. 지능형 알고리즘을 기반으로 하는 Olovka AI는 학생들이 고품질의 학술 논문을 빠르게 작성할 수 있도록 도와줍니다.
Fish Audio는 텍스트 음성 변환(TTS)과 음성 복제를 지원하는 강력한 생성형 AI 음성 합성 도구입니다. 사용자는 텍스트만 입력하면 자연스럽고 부드러운 음성 변환을 지원하며, 플랫폼은 다양한 시나리오와 사용자에 맞게 선택할 수 있는 다양한 언어와 음성 스타일을 제공합니다.
시그넴마는 구글 딥마인드의 세계에서 가장 강력한 수어 통역 AI 모델로, 미국 수어(ASL)를 영어 텍스트로 정확하게 번역할 수 있도록 지원합니다. 이 모델은 시각 데이터와 텍스트 데이터를 결합하여 수화 동작을 실시간으로 포착하고 이를 텍스트로 빠르게 번역하는 다중 모드 학습을 기반으로 합니다....
FLUX.1 Kontext는 문맥 인식 이미지 처리 기술을 제공하는 Black Forest Labs의 이미지 생성 및 편집 모델입니다. 이 모델은 텍스트 및 이미지 단서에 대한 반응을 이해하고 개체 수정, 스타일 변환, 배경 교체와 같은 작업을 수행하면서 모서리를 유지합니다.
스피릿 코드 IDE는 통이 스피릿 코드가 출시한 AI 네이티브 통합 개발 환경(IDE)으로, 천문 3대 모델에 깊이 적용되었으며 강력한 프로그래밍 지능체 모드를 통해 프로젝트 인식, 코드 검색, 터미널 작업 실행 등 작업의 자율적 완수를 지원합니다. MCP 도구를 지원하며 Magic Hitch MCP Square의 3...
바젤은 바이트댄스에서 오픈소스화한 멀티모달 기본 모델로, 140억 개의 파라미터가 있으며 이 중 70억 개가 활성화되어 있습니다. 모델 베이스와 두 개의 독립적인 인코더로 이미지의 픽셀 수준과 의미 수준 특징을 각각 캡처하는 혼합 트랜스포머 전문가 아키텍처(MoT)는 이미지, 텍스트, 비디오의 효율적인 처리를 지원합니다....
DeepSeek-R1은 항저우에 본사를 둔 DeepSeek에서 출시한 고성능 AI 추론 모델로, OpenAI의 o1 공식 버전을 벤치마킹했습니다. 이 모델은 대규모 강화 학습 기법을 기반으로 사후 학습되며 수학, 코드 및 자연어로 추론하는 데 매우 적은 양의 레이블 데이터만 필요합니다.
팬텀보트 AI는 광고, 프로모션, 애니메이션 등 다양한 유형의 동영상 콘텐츠를 효율적으로 일괄 생성할 수 있도록 지원하는 강력한 원스톱 AI 단편 영화 제작 플랫폼입니다. 이 플랫폼은 미드저니, 런웨이 및 기타 세계 최고의 AI 모델을 기반으로 하며, 크리에이터에게 대본 작성부터 촬영까지 다양한 서비스를 제공합니다.
KeLing 2.1은 레이서에서 출시한 AI 동영상 생성 모델로, 현재 KeLing AI 동영상 플랫폼에서 사용할 수 있습니다. 이 모델에는 표준, 고화질 및 마스터의 세 가지 버전이 포함되어 있으며 720P, 1080P 및 영화 수준의 효과를 제공하여 다양한 창작 요구를 충족합니다. 빠른 제작에 적합한 표준 버전의 생성 속도는 ...
리틀 라크는 AI 기술을 기반으로 콘텐츠 제작의 경계를 재구성하여 더 간단하고 효율적이며 흥미롭게 제작할 수 있도록 셰어 이미지에서 출시한 지능형 제작 에이전트입니다. 리틀 라크는 동영상, 디지털 팝업 동영상, 디자인 도면 및 배경용 사진의 제로 임계값 생성을 지원하며, 사용자는 명령만 입력하면 AI가 효율적으로 완료합니다.
드래프팅 AI 커뮤니티는 사용자에게 풍부한 창의적인 디자인 리소스와 도구를 제공하는 온라인 AI 창작 영감 플랫폼입니다. 이 플랫폼은 이미지 사진, 전자상거래 디자인, 명절 테마, 3D 일러스트레이션, 아바타 디자인, 샤오홍슈 소재, 인물 디자인 등 다양한 디자인 분야를 다루며 다양한 사용자의 요구를 충족합니다.
노코드란 무엇인가요? 노코드는 미션에서 출시한 제로 코드 AI 개발 플랫폼입니다. 사용자는 프로그래밍 경험이 없어도 자연어를 통해 요구 사항을 설명하기만 하면 웹 사이트 페이지, 유틸리티, 작은 게임, 이벤트 페이지 및 기타 애플리케이션을 빠르게 생성할 수 있으며, NoCode는 1초 만에 200...
개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.
일반 소개 러비더비는 사용자에게 가상 캐릭터와 실시간 대화형 경험을 제공하는 데 중점을 둔 인공지능 기반 채팅 앱입니다. 사용자는 자신만의 캐릭터를 만들거나 기존 캐릭터를 선택하여 로맨틱, 우정 또는 기타 유형의 대화를 시작할 수 있습니다. 이 앱은 고도로 사용자 정의 가능한 캐릭터 세트를 통해 작동합니다...
일반 소개 리얼타임보이스챗은 음성을 통한 인공 지능과의 실시간 자연스러운 대화에 초점을 맞춘 오픈 소스 프로젝트입니다. 사용자가 마이크를 사용하여 음성을 입력하면 시스템이 브라우저를 통해 오디오를 캡처하여 텍스트로 빠르게 변환하고 대규모 언어 모델(LLM)을 생성하여 다시 ...
일반 소개 MiMo는 수학적 추론과 코드 생성에 중점을 두고 Xiaomi에서 개발한 오픈 소스 대규모 언어 모델링 프로젝트입니다. 핵심 제품은 기본 모델(Base), 감독 미세 조정 모델(SFT), 기본 모델에서 학습된 강력한 화학...을 포함하는 MiMo-7B 모델 제품군입니다.
Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.
일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.
개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
일반 소개 로컬 딥 리서치는 사용자가 심층 연구를 수행하고 복잡한 문제에 대한 상세한 보고서를 생성할 수 있도록 설계된 오픈 소스 AI 연구 도우미입니다. 로컬 실행을 지원하므로 사용자가 클라우드 서비스에 의존하지 않고도 연구 작업을 완료할 수 있습니다. 이 도구는 ...
일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
일반 소개 쿠라젠트는 칭화대학교의 LeapLab에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 에이전트 협업 프레임워크로, 사용자가 한 문장 설명으로 지능형 AI 에이전트를 만들 수 있으며 복잡한 작업에서 여러 에이전트가 협업할 수 있도록 지원합니다. 이 프레임워크는 두 가지 기능을 제공합니다.
포괄적인 소개 딥 리콜은 대규모 언어 모델(LLM)을 위해 설계된 오픈 소스 엔터프라이즈급 메모리 프레임워크입니다. 효율적인 문맥 검색 및 통합을 통해 고도로 개인화된 응답성을 제공합니다. 이 프레임워크는 메모리 서비스, 추론 서비스, 코디네이터를 포함한 3계층 아키텍처를 사용하여 다음을 지원합니다.
일반 소개 Paper2Code는 머신러닝 논문에 대한 코드 구현 부족 문제를 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 LLM(대규모 언어 모델링) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획을 사용합니다 ...
종합 소개 DeepWiki-Open은 GitHub, GitLab 및 Bitbucket의 코드 리포지토리에 대한 구조화된 문서를 자동으로 생성하도록 설계된 오픈 소스 프로젝트입니다. AI 기술을 사용하여 코드 구조, 파일 콘텐츠 및 논리적 관계를 분석하고 신속하게 생성합니다.
일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...
일반 빠른 프롬프트는 프롬프트 단어(프롬프트) 관리와 빠른 입력에 중점을 둔 오픈 소스 브라우저 확장 프로그램입니다. 사용자는 프롬프트 라이브러리를 생성, 구성 및 저장하고 미리 설정된 프롬프트 콘텐츠를 웹 페이지의 입력 상자에 빠르게 삽입할 수 있습니다. 이 도구는 특히 ...
일반 소개 Suna는 Kortix AI에서 개발한 오픈 소스 범용 AI 에이전트로, Apache 2.0 라이선스를 기반으로 GitHub에서 호스팅되며 사용자가 무료로 다운로드, 수정 및 자체 호스팅할 수 있습니다. 자연어 대화를 사용하여 사용자에게 다음과 같은 도움을 줍니다.
일반 소개 Corgea는 개발자와 보안팀이 코드의 취약점을 발견, 분석하고 자동으로 수정할 수 있도록 지원하는 데 중점을 둔 AI 기반 코드 보안 플랫폼입니다. 이 플랫폼은 Snyk, Semgrep 등 기존의 정적 애플리케이션 보안 테스트(SAST) 도구 세트와 함께 작동하여 이를 수행합니다.
일반 소개 Spring.new는 마케팅 관리자와 제품 관리자가 맞춤형 워크플로우와 소규모 애플리케이션을 신속하게 구축할 수 있도록 지원하는 데 중점을 둔 AI 기반 온라인 플랫폼입니다. 사용자는 자연어 입력을 통해 요구 사항을 설명할 수 있으며, 자동으로 연결을 생성합니다.
일반 설명 Strawberry는 사용자가 일상적인 작업을 자동화하고 효율성을 향상시킬 수 있도록 설계된 AI 비서가 내장된 스마트 브라우저입니다. AI 기술을 통합하여 웹 콘텐츠를 실시간으로 이해하고 빠른 검색, 콘텐츠 작성과 같은 복잡한 작업을 수행한다는 점에서 기존 브라우저와 차별화됩니다.
포괄적인 소개 Potpie AI는 개발자에게 맞춤형 AI 엔지니어링 어시스턴트를 제공하는 데 중점을 둔 오픈 소스 플랫폼입니다. AI 에이전트가 코드 구조와 로직을 심층적으로 이해하고 코드 베이스의 지식 그래프를 구축하여 디버깅, 테스트, 코드 생성과 같은 작업을 자동화할 수 있습니다. 사용자는 간단한...
일반 소개 빌랑은 엔지니어링 팀의 생산성 향상에 초점을 맞춘 AI 기반 플랫폼으로, 비즈니스 관리자가 개발자 성과에 대한 인사이트를 얻고 팀 효율성을 최적화하도록 돕는 것이 핵심 목표입니다. 코드 베이스를 분석하고 AI 기술을 통해 프로젝트 관리 도구를 통합하여 데이터 기반 인사이트 보고서를 생성합니다....
일반 소개 Extrovert는 기업 영업팀이 비즈니스 관계를 효율적으로 구축하고 유지할 수 있도록 지원하는 데 중점을 둔 AI 기반 LinkedIn 관계 관리 도구입니다. AI를 통해 잠재 고객의 LinkedIn 역학을 분석하여 개인화된 댓글, 좋아요, 비공개 메시지 작성 기능을 제공합니다.
포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...
일반 소개 Zev는 사용자가 자연어로 터미널 명령을 빠르게 쿼리하고 생성할 수 있도록 도와주는 사용하기 쉬운 명령줄 인터페이스(CLI) 도구입니다. 복잡한 명령 구문을 기억할 필요 없이 Zev는 일상적인 언어로 사용자의 요구 사항을 설명하여 터미널 명령을 생성합니다. Ope...
UNO는 바이트댄스 인텔리전트 크리에이션 팀이 개발한 오픈 소스 이미지 생성 프레임워크입니다. FLUX.1 모델을 기반으로 하며 "적은 것에서 더 많은 것"으로 일반화 접근 방식을 통해 단일 피사체 및 다중 피사체 맞춤형 이미지 생성에 중점을 둡니다.UNO는 확산 변환기를 사용합니다...
일반 소개 PostRoast는 인공 지능을 사용하여 사용자가 소셜 미디어 콘텐츠를 최적화할 수 있도록 도와주는 온라인 도구로, Platform X(이전의 트위터)용 게시물 분석에 중점을 두고 있습니다. 사용자가 콘텐츠를 업로드하면 PostRoast가 AI 알고리즘을 사용하여 콘텐츠를 분석합니다...
일반 소개 Dia는 초현실적인 대화 오디오를 생성하는 데 중점을 두고 나리 랩스에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 텍스트 스크립트를 한 번의 프로세스로 사실적인 다중 문자 대화로 변환하고 감정과 억양 제어를 지원하며 비언어적 표현까지 생성합니다....
일반 소개 베이크 글꼴은 디자이너, 크리에이터 및 브랜드를 위한 독특하고 개인화된 글꼴 솔루션을 제공하는 것을 목표로 하는 Bake AI의 3D 타이포그래피 글꼴 디자인 및 생성에 중점을 둔 온라인 툴입니다. 이 플랫폼을 통해 사용자는 다양한 글꼴 스타일을 탐색할 수 있습니다...
일반 소개 "아내가 나에게 소리치는 이유"는 인공지능을 통해 파트너의 감정 반응과 의사소통 패턴을 이해할 수 있도록 설계된 독특한 결혼 관계 시뮬레이션 웹사이트입니다. 사용자는 다양한 시나리오를 입력하고 가상 파트너의 반응을 경험하며 실제와 같은 시뮬레이션을 할 수 있습니다.