DeerFlow는 복잡한 연구 작업을 효율적으로 완료하기 위해 설계된 바이트 점프 오픈 소스 심층 연구 프레임워크입니다. 이 프레임워크는 여러 언어 모델(예: Qwen)과 도구(예: 검색 엔진, 크롤러, Python 실행 환경)를 통합하고 고품질 연구 보고서, 팟캐스트 등을 빠르게 생성할 수 있습니다 ...
Dolphin은 322M 매개변수, 작은 크기, 빠른 작동을 갖춘 바이트 점프 오픈 소스 경량 문서 구문 분석 대형 모델입니다. 이 모델은 페이지 수준 레이아웃 분석을 기반으로 문서의 요소 (예 : 제목, 표, 수식 등)를 식별 한 다음 구문 분석 된 각 요소의 내용을 식별하는 2 단계 구문 분석 접근 방식을 기반으로합니다 ...
프롬프트파일럿은 볼케이노 엔진이 바이트댄스 산하의 볼케이노 엔진에서 출시한 AI 프롬프트 최적화 플랫폼입니다. 이 플랫폼은 사용자의 의도를 심층적으로 분석하고 막연한 아이디어를 AI가 정확하게 실행할 수 있는 전문적인 지침으로 변환하여 모델이 고품질의 결과를 산출하도록 보장합니다. 대화형 지침에 기반한 프롬프트피...
채용 스튜디오는 채용팀이 직무별 면접 질문을 효율적으로 만들 수 있도록 지원하는 AI 채용 면접 지원 툴입니다. 이 도구는 AI 기술을 기반으로 면접 질문을 생성하고, 후속 질문을 제안하며, 다양한 답변 품질에 대한 평가 기준을 생성합니다. 이 도구는 STAR 방식을 지원합니다...
QVQ-Max는 이미지와 비디오 콘텐츠를 "읽기"하고 분석 및 문제 해결을 위한 정보와 결합할 수 있는 알리토닉스의 최첨단 시각 추론 모델로, QVQ-72B-Preview의 업그레이드 버전입니다. QVQ-Max는 이미지 및 비디오 콘텐츠를 "읽기"하고 분석, 추론 및 문제 해결을 위해 정보를 결합할 수 있는 QVQ-72B-Preview의 업그레이드 버전입니다.QVQ-Max의 주요 기능에는 이미지 구문 분석, 비디오 분석 및 ...
에이전트 제로는 범용적이고 사용자 정의가 가능한 지능형 비서를 만들기 위한 오픈 소스 AI 프레임워크입니다. 동적 학습과 진화를 통해 다양한 작업을 처리할 수 있으며, 이전 경험과 솔루션을 기억하여 후속 작업을 보다 효율적으로 완료하는 지속적 메모리 기능을 갖추고 있습니다.
Klic Studio(구 Krillin AI)는 동영상 제작자와 콘텐츠 내보내기를 위해 설계된 AI 기반 동영상 번역, 더빙 및 음성 복제 도구입니다. 전체 프로세스의 원클릭 배포를 지원하여 한 번의 클릭으로 다운로드부터 완성된 출력까지 비디오를 완성할 수 있으며, Jieyin, Xiaohongshu, B ...에 맞게 조정되었습니다.
이력서 빌더는 구직자를 위해 설계된 전문 AI 이력서 작성 도구입니다. 이 도구는 AI 기술을 결합하여 직무 설명을 기반으로 키워드와 작성 제안을 제공하여 사용자가 채용 요건에 정확히 부합하는 이력서를 작성할 수 있도록 도와줍니다. 이 플랫폼에는 25개 이상의 사용자 정의 가능한 이력서 템플릿과 슈퍼 ...
ConverzAI는 채용 프로세스를 최적화하는 AI 기술 기반의 채용 플랫폼입니다. 이 플랫폼은 가상 채용 담당자(AI 에이전트)를 배치하여 지원자 추적 시스템(ATS)에서 후보자 정보를 자동으로 수집하고 초기 심사를 수행하는 것을 기반으로 합니다. 이 플랫폼은 전화, 이메일, SMS 등 여러 채널을 사용합니다...
Mercor는 구직 및 채용 프로세스를 간소화하는 글로벌 채용을 위한 AI 기반 플랫폼입니다. 구직자는 이력서를 업로드하여 20분간의 AI 면접을 완료하고, Mercor는 사용자의 정보를 전 세계 기업의 수천 개의 구인 요청과 매칭하여 원격 근무 기회를 빠르게 찾습니다.Mercor 핵심 기능...
Clacky AI는 개발자를 위한 클라우드 기반 개발 환경(CDE)으로, L3 수준의 AI 프로그래밍 어시스턴트 제작에 특화되어 있습니다. 이 도구는 Python, Node.js, Golang, Ruby, Java를 비롯한 여러 프로그래밍 언어를 지원하며 개발자가 빠르게...
MagicTryOn은 절강대학교 컴퓨터 과학 기술 대학이 생체 및 기타 조직과 협력하여 출시한 고급 비디오 가상 체험 프레임워크입니다. 이 프레임워크는 기존의 U-Net 아키텍처를 혁신적인 확산 트랜스포머(DiT) 아키텍처로 대체하고, 완전히 스스로 인식하는 기계와 결합하여 ...
판다위키는 사용자가 지능형 지식 관리 시스템을 빠르게 구축할 수 있도록 도와주는 오픈 소스 AI 지식베이스 구축 시스템입니다. 이 시스템은 강력한 AI 빅 모델 기능을 기반으로 하며, AI 지원 생성, Q&A 및 검색 기능을 제공하여 지식 관리의 효율성과 지능을 크게 향상시킵니다.
애니퓨전은 AI 기술을 기반으로 한 온라인 AI 만화 및 애니메이션 이미지 제작 플랫폼으로, 창작자가 그림 실력이 없어도 전문가 수준의 만화 및 애니메이션 작품을 제작할 수 있도록 도와줍니다. 사용자가 설명 메시지를 입력하기만 하면 AI가 만화 페이지와 캐릭터 이미지를 자동으로 생성합니다. 이 플랫폼은 직관적인 레이아웃을 제공합니다...
제로서치는 알리바바 통이랩의 오픈소스 혁신적 대형 모델 검색 엔진 프레임워크입니다. 이 프레임 워크는 검색 엔진의 시뮬레이션을 기반으로 실제 검색 엔진과 상호 작용할 필요가 없으며 자체 사전 학습 지식의 대규모 모델을 사용하여 관련 문서 또는 노이즈 문서를 생성하여 교육 비용을 크게 줄입니다 (80% 이상 감소 ...
ChatUI는 Alibaba 팀에서 출시 한 오픈 소스 지능형 대화 UI 구성 요소 라이브러리로, 반응 형 디자인으로 데스크톱 브라우저와 모바일 장치 및 기타 터미널에 자동으로 적용되는 TypeScript로 작성된 React 프레임 워크를 기반으로합니다.ChatUI는 국제화 기능을 지원합니다 ...
MotionGo는 지능형 대화 및 독점 애니메이션 라이브러리를 기반으로하는 AI 기반 PPT 애니메이션 플러그인으로 사용자가 빠르고 효율적으로 프레젠테이션을 만들 수 있도록 도와줍니다.MotionGo는 7,000 가지 이상의 애니메이션 효과를 제공하고 FlowCode 기능을 지원하며 기존 애니메이션의 한계를 극복하고 복잡한 동작을 달성합니다....
유다오 리틀 P는 넷이즈 유다오에서 출시한 AI 전과목 학습 도우미로, 초등학교, 중학교, 고등학교 전과목 Q&A를 다루고 개인화된 학습 조언을 제공하는 유다오 즈이 교육 빅 모델을 탑재하여 초중고 학생들을 위해 설계되었습니다. 인공지능 단어 검색 및 인공지능 번역 기능을 갖춘 Youdao Little P는 학생들이 언어 문제를 빠르게 해결할 수 있도록 도와줍니다.
Sparkify는 Google에서 출시한 AI 애니메이션 동영상 생성 플랫폼입니다. 이 플랫폼은 Gemini 2.5 및 Veo2 모델을 기반으로 하며, 사용자가 질문이나 복잡한 개념을 입력하면 Sparkify가 관련 지식 포인트를 설명하는 직관적인 짧은 애니메이션 동영상을 2분 안에 생성합니다. 이 플랫폼은 텍스트, 이미지 및 ...
인덱스-애니소라는 베일리 베일리의 고급 애니메이션 동영상 생성 모델 오픈소스입니다. 이 모델은 단일 사진을 기반으로 일관된 애니메이션 비디오를 생성하고 드라마, 국가 애니메이션, VTuber 콘텐츠 등과 같은 다양한 스타일을 지원할 수 있습니다. 이 모델은 확산 모델 아키텍처를 기반으로하며 시공간 마스크 모듈과 결합 된 3D ...
시어 리틀 잉은 바이트 점프에서 출시한 AI 동영상 편집 애플리케이션으로, 제로 베이직 사용자를 위해 설계되었으며 간단하고 편리한 조작이 가능합니다. 이 애플리케이션에는 AI 지능형 분석 기능이 있으며, 자료의 장면, 캐릭터 및 기타 요소를 정확하게 식별하여 사용자에게 지능형 편집 지침을 제공할 수 있습니다. 자동화 된 필름 기능을 기반으로 사용자는 고품질을 빠르게 생성 할 수 있습니다.
Magic Resume는 고급 AI 기술을 기반으로 한 온라인 AI 이력서 최적화 도구로, 사용자가 전문적이고 개인화된 이력서를 빠르게 작성할 수 있도록 도와줍니다. 이 도구는 지능형 수정, 문법 검사, 전문가 제안을 지원하여 텍스트 표현의 전문성을 자동으로 향상시킵니다. 모든 데이터는 개인정보 보호와 보안을 위해 로컬에 저장됩니다.
Job AI 이력서는 효율적이고 편리한 지능형 이력서 생성 및 최적화 플랫폼입니다. 이 플랫폼은 AI 기술을 기반으로 사용자가 전문적이고 개인화된 이력서를 빠르게 생성할 수 있도록 도와줍니다. 사용자는 기본 정보와 경력만 입력하면 다양한 직무를 포괄하는 2800개 이상의 아름다운 템플릿을 제공하여 단시간에 고품질의 이력서를 생성할 수 있습니다.
NovaCV는 지능형 이력서 생성 도구입니다. 이 도구는 고급 AI 기술을 기반으로 사용자가 전문적인 이력서를 빠르게 작성할 수 있도록 도와주며, AI 이력서 도우미는 원클릭 직업 설명 생성, 언어의 지능적인 꾸밈, 표현 최적화, 실시간 오류 수정, 중국어 및 영어 번역을 지원합니다.
V-JEPA 2는 메타 AI의 12억 개의 파라미터가 포함된 비디오 데이터를 기반으로 한 대규모 세계 모델입니다. 이 모델은 100만 시간 이상의 비디오와 100만 장의 이미지를 통한 자가 지도 학습을 기반으로 학습되었으며, 실제 세계의 사물, 동작, 작동을 이해합니다.
imgAK는 고급 딥러닝 기술을 기반으로 사용자에게 다양하고 강력한 이미지 편집 기능을 제공하는 원스톱 AI 이미지 처리 도구로, 오래된 사진의 스크래치, 깨짐, 색 바램을 복구하고 흑백 사진에 자동으로 색을 입혀 새로운 느낌을 주는 등 새로운 룩과 느낌을 찾고 있는 분들에게 완벽한 선택입니다.
AopsAI는 오래된 사진을 역동적인 짧은 동영상으로 변환하는 온라인 AI 도구입니다. 이 도구는 첨단 AI 기술을 기반으로 정지된 사진을 '움직이게' 만들어 과거의 아름다운 순간을 재현합니다. 사용자가 사진을 업로드하고 이메일 주소를 제공하면 AopsAI가 24시간 이내에 자동으로 동영상을 생성하여 다음 주소로 전송합니다.
두바오 빅모델 1.6(두바오-Seed-1.6)은 바이트댄스에서 출시한 멀티모달 딥씽킹 빅모델입니다. 이 모델은 텍스트, 이미지, 동영상 등 다양한 입력 형식을 지원하며 고품질 텍스트 출력을 생성할 수 있습니다. 이 모델의 컨텍스트 창은 256k 길이이며 최대 입력 길이는 최대 2...
아이푸시트는 주로 음악 창작자, 교사, 학생, 음악 애호가를 위한 AI 기술 기반의 음악 처리 플랫폼입니다. 이 플랫폼은 클릭 한 번으로 오디오 파일을 펜타토닉 악보로 변환하고, 보컬과 백킹 트랙을 빠르게 분리하고, 사용자가 입력한 멜로디 또는 코드에 따라 완전한 음악 작품을 자동으로 생성하며, MP3를 지원합니다....
스플래시는 사용자가 개인화된 음악을 쉽게 만들 수 있도록 도와주는 혁신적인 AI 음악 제작 플랫폼입니다. 이 플랫폼은 고급 AI 기술을 기반으로 텍스트 투 송, 텍스트 투 랩, 제너레이티브 텍스트 투 뮤직 기능을 제공하여 사용자는 텍스트만 입력하면 AI가 멜로디와 노래 효과를 생성할 수 있습니다.
뮤직뮤즈는 첨단 AI 기술을 기반으로 한 음악 창작 플랫폼입니다. 사용자가 음악 스타일, 분위기, 리듬 등 간단한 설명만 입력하면 전문적인 음악 지식 없이도 AI가 필요에 맞는 음악 작품을 빠르게 생성합니다. 이 플랫폼은 팝, 록, 클래식 등 다양한 스타일을 지원하며, 분위기에 따라 음악을 생성할 수 있습니다.
Jammable은 사용자가 음악을 업로드하거나 기존 작품을 선택하면 AI가 좋아하는 가수의 목소리나 스타일을 모방하여 새로운 커버 버전을 만들 수 있는 AI 음악 커버 플랫폼으로, 몇 초 만에 결과가 나오는 고품질 음악을 빠르게 생성하고 인기 있는 사운드, 음악 편집 및 공동 작업 기능을 제공합니다....
o3-pro는 복잡한 질문을 처리하고 정확한 답변을 제공하도록 설계된 OpenAI의 o3 추론 모델의 업그레이드 버전입니다. 이 모델은 웹 검색, 파일 분석, 이미지 추론, Python 프로그래밍과 같은 ChatGPT의 전체 도구 제품군에 대한 호출을 지원하여 강력한 실행력을 보여줍니다....
AIFlowy는 Java 개발을 기반으로 하는 오픈 소스 엔터프라이즈급 AI 애플리케이션 개발 플랫폼으로, 바이트 코즈, 텐센트 메타 웨어, 디파이 및 기타 제품에 대응합니다. 지능형 대화 로봇, 개인 지식 기반 구축, AI 워크플로우 오케스트레이션, 대규모 모델 관리 및 기타 기능을 지원하여 완벽한 시스템 관리 모델을 제공합니다.
우아한 요야는 중커 웬지가 출시한 멀티모달 리터러티브 비디오 플랫폼으로, AI 멀티모달 기술을 기반으로 비디오 콘텐츠 제작의 전체 체인을 강화합니다. 사용자는 테마 요구 사항 만 입력하면 플랫폼에서 스크립트, 이미지, 비디오를 빠르게 생성 할 수 있으며 지능형 편집, 음성 합성 및 캐릭터 입 드라이브 및 기타 작업, 출력을 완료 할 수 있습니다 ...
Uthana는 강력한 AI 3D 캐릭터 애니메이션 생성 플랫폼입니다. 사용자가 텍스트 설명을 입력하거나 참고 동영상을 업로드하거나 모션 라이브러리를 검색하면 AI가 모든 골격 구조를 가진 모델에 적용할 수 있는 사실적인 애니메이션을 빠르게 생성할 수 있습니다. 이 플랫폼에는 스타일 마이그레이션, API 통합, 커스터마이징 등 다양한 기능이 탑재되어 있습니다.
펭귄 리딩 컴패니언은 초등학생과 중고등학생을 위해 설계된 텐센트의 인공지능 독서 도우미입니다. 펭귄 리딩 컴패니언은 텐센트의 하이브리드 빅 모델과 메타머신 플랫폼을 의무 교육 언어 교과 과정 프로그램 및 교과 과정 표준(2022년판)과 결합하여 학생들에게 개인화된 독서 추천, 다양한 독서 모드(집중, 소리 내어 읽기, 듣기...)를 제공합니다.
붐컷은 리틀 섀도우 테크놀로지가 출시한 AI 크로스보더 마케팅 동영상 로컬라이제이션 툴입니다. 이 도구는 고급 립싱크 드라이브 및 톤 복제 기술을 기반으로 하는 강력한 기능을 갖추고 있어 다양한 국가 및 지역의 사용자의 언어 요구 사항을 충족하는 다국어 버전의 음성 동영상을 신속하게 생성할 수 있습니다.
Mobvoi MCP 서버는 GoDoQ에서 출시한 멀티모달 AI 기능을 통합하기 위한 툴입니다. Mobvoi MCP 서버는 음성 생성, 사운드 복제, 이미지 기반 디지털 피플, 비디오 더빙 및 비디오 번역을 통합한 멀티모달 AI 도구로, 사용자가 텍스트를 입력하면 유연하게 호출할 수 있습니다.Mobvoi MCP S...
Rowboat는 다중 지능형 신체 어시스턴트 구축을 지원하는 오픈 소스 로우코드 AI IDE로, 시각적 인터페이스와 AI 지원 개발 기능을 기반으로 사용자가 지능형 신체 워크플로를 빠르게 설계, 구성 및 테스트할 수 있도록 도와줍니다. 사용자가 자연어로 요구 사항을 설명할 수 있도록 지원하는 Rowboat는 ...
샹탕 루잉은 샹탕 테크놀로지가 출시한 AI 디지털 휴먼 동영상 제작 플랫폼입니다. 이 플랫폼은 빅 모델 기술을 기반으로 얼굴 특징, 의상, 헤어스타일 등을 포함한 매우 사실적인 디지털 인간 이미지와 개인화 제작을 지원합니다. 이 플랫폼은 사운드 복제, 비디오 생성, 자동화된 데이터 주석, 실시간 상호 작용 및 기타 기능을 갖추고 있습니다....
조이할로는 중국어용으로 설계된 징동의 오픈소스 AI 디지털 휴먼 모델로, 오디오를 사실적인 말하기 비디오로 변환하는 것을 지원하며, 입술 움직임 예측 정확도를 높이기 위해 반분리 구조를 사용하여 wav2vec2 모델을 기반으로 오디오 기능을 내장하고 영어 비디오 생성을 지원합니다....
머스트 파이어 AI는 단편 동영상 크리에이터를 위한 국내 AI 디지털 휴먼 생성 플랫폼입니다. 사용자는 실제 인물을 촬영한 3분 분량의 영상을 업로드하면 0.1mm의 미세한 표현 정확도로 매우 사실적인 디지털 휴먼 이미지를 빠르게 생성할 수 있습니다. 이 플랫폼은 음성 합성 및 음성 샘플 녹음을 지원하여 실제 사람과 유사한 AI 음성 모델을 생성할 수 있습니다.
Thetawave AI는 대학생을 위해 설계된 고급 AI 노트 필기 도구입니다. Thetawave AI는 수업 내용을 구조화되고 학습하기 쉬운 노트로 실시간 캡처하고 PDF, Word 및 기타 문서 업로드를 지원하며, 이는 자동으로 명확하고 요약된 노트로 변환됩니다. 이 도구의 주요 기능은 실시간 변환을 포함합니다...
위즈덤 스펙트럼 CoCo는 위즈덤 스펙트럼의 AICO 플랫폼에서 출시한 최초의 엔터프라이즈급 슈퍼 어시스턴트 에이전트로, 전달 지향성, 메모리 메커니즘, 원활한 임베딩이라는 세 가지 핵심 기능을 갖추고 있습니다. 정부 업무 분야에서 CoCo는 정책을 해석하고 솔루션을 맞춤화하며 시행 효과를 추적하여 정책이 효율적으로 시행될 수 있도록 지원합니다.
draw.io는 브라우저 기반 플랫폼에서 실행되는 무료 온라인 그리기 도구로, 소프트웨어 설치가 필요 없어 언제 어디서나 다이어그램을 만들고 편집할 수 있습니다. draw.io는 순서도, 마인드맵, 네트워크 토폴로지 다이어그램, 간트 차트 등 다양한 다이어그램 유형을 지원하여 다양한 시나리오의 요구를 충족합니다. 작업...
Forage-Migo는 텍스트, 언어, 시각 및 데이터 처리를 지원하는 강력한 멀티모달 AI 기능을 갖춘 AI 기반 학습 및 연구 혁신 플랫폼으로, 다양한 분야의 다양한 요구를 충족할 수 있습니다. 미고는 지능형 Q&A, 웹페이지 지원 읽기, 문학 읽기, 학술 글쓰기, 논문 읽기, 화학 ...
사이언스원은 중국과학원 자동화연구소가 공동으로 출시한 지능형 과학 연구 플랫폼입니다. 이 플랫폼은 대규모 과학 기반 모델 구축을 기반으로 하며, 다학제 협업을 통해 지능형 과학 연구의 새로운 패러다임을 촉진하여 과학 연구의 전 과정을 지원하며, ScienceOne의 핵심 제품에는 S1 ...
Q봇은 텐센트 QQ 브라우저에서 출시한 AI 기능이 통합된 스마트 브라우저입니다. 이 브라우저에는 텍스트, 음성 및 이미지 검색을 지원하고 빠르고 정확하게 답변을 제공할 수 있는 AI 검색과 같은 다양한 실용적인 기능이 탑재되어 있으며, AI 검색 기능은 웹 콘텐츠를 빠르게 해석하여 마인드맵을 생성할 수 있도록 지원합니다.
FiaMind는 효율적인 정보 관리와 창의적 지원을 위해 설계된 AI 마인드 매핑 도구입니다. FiaMind는 유연한 무제한 캔버스를 갖추고 있으며 논리 다이어그램, 마인드맵, 조직도 및 기타 형태를 포함하여 다양한 레이아웃 요구 사항을 충족하기 위해 마인드맵을 자유롭게 분할하고 결합할 수 있도록 지원합니다.
커튼은 사용자가 단편적인 지식 포인트를 구조화된 개요 양식에 따라 체계화할 수 있도록 도와주는 AI 개요 노트 도구로, 원클릭 마인드맵 생성을 지원합니다. 커튼은 복잡한 정보를 직관적인 그래픽으로 표현하고, 생각을 빠르게 정리하며, 이해력과 기억력을 향상시키는 데 도움을 줍니다.
StartAI는 디자이너와 크리에이티브 작업자를 위해 설계된 Adobe Photoshop 기반의 AI 페인팅 소프트웨어입니다. 이 소프트웨어는 디자인 효율성을 개선하고 창의력을 자극하는 AI 기술을 기반으로 하며 텍스트 기반 그리기, 부분 다시 그리기, 선 채색, 비파괴 확대/축소, 고화질 복원 등을 지원합니다.
Italian AI는 400개 이상의 모델과 10만 개의 드로잉 스타일이 포함된 이중 언어 입력을 지원하는 선도적인 AI 드로잉 및 디자인 맞춤화 플랫폼입니다. 사용자는 텍스트 설명을 입력하거나 이미지를 업로드하여 요구 사항을 충족하는 이미지를 빠르게 생성할 수 있습니다.
메타미러는 인간과 컴퓨터의 공생 엔진을 기반으로 한 인공지능 영상 제작 도구로, 창의적인 영감에서 완성된 영상까지 효율적인 제작을 지원합니다. 이 도구는 자동 스크립트 생성, 캐릭터 스타일 통일, 멀티모달 융합 및 지능형 워크플로우 등을 갖추고 있으며, 창의적인 비디오 스크립트, 멀티모달 분할 화면 디자인을 빠르게 생성하고 클릭 한 번으로 전체 비디오를 합성할 수 있습니다....
버밀리언 버드 AI 디텍션은 텐센트의 하이브리드 보안팀인 버밀리언 버드 랩에서 출시한 AI 탐지 플랫폼으로, 사용자가 AI가 생성한 이미지와 텍스트 콘텐츠를 식별할 수 있도록 도와줍니다. 버밀리언 버드 AI 감지는 이미지의 숨겨진 특징, 상식적인 논리에 맞지 않는 콘텐츠, '워터마크' 로고 등을 분석하여 이미지가 AI에 의해 생성되었는지 여부를 빠르게 판별하는 것을 기반으로 합니다.
진뮤직 그랜드 모델은 텐센트 AI 랩과 텐센트 TME 티엔친 랩이 공동으로 출시한 고급 AI 음악 창작 그랜드 모델입니다. 이 모델은 사용자가 입력한 키워드, 설명 문구 또는 영어와 중국어로 된 오디오 클립을 기반으로 고품질 스테레오 오디오 또는 멀티 트랙 악보를 지능적으로 생성합니다.
슛미 AI는 아이시 테크놀로지가 국내 시장에 맞춰 출시한 혁신적인 AI 동영상 생성 플랫폼으로, 픽스버스의 국내 버전입니다. 이 플랫폼은 간단한 텍스트 프롬프트 또는 업로드된 이미지를 기반으로 고품질의 동적 동영상 콘텐츠를 빠르게 생성할 수 있도록 지원합니다. 최신 V4.5 버전의 플랫폼은 비디오 품질, 애니메이션 부드러움이 개선되었습니다...
네일 이타이는 기업이 디지털 비즈니스 애플리케이션을 빠르게 구축할 수 있도록 지원하기 위해 알리바바에서 출시한 로우코드 애플리케이션 개발 플랫폼입니다. 시각적 드래그 앤 드롭 및 구성 방식을 통해 코딩 방법을 모르는 비즈니스 담당자도 필요에 맞는 애플리케이션을 쉽게 개발할 수 있어 개발 문턱과 비용을 크게 줄일 수 있습니다.
Seed-Music은 사용자가 녹음한 10초 분량의 오디오를 완전한 음악 작품으로 변환하는 것을 지원하는 ByteDance에서 출시한 AI 음악 생성의 대규모 모델입니다. 자동 회귀 언어 모델과 확산 방법을 기반으로 스타일 설명, 오디오 레퍼런스, 악보 및 사운드 큐와 같은 멀티모달 사용자 입력을 생성하여 높은 수준의...
사운드 컨트롤은 음악 크리에이터를 전방위적으로 지원하는 혁신적인 AI 음악 제작 플랫폼입니다. 오디오 컨트롤에는 AI 작사, 작곡, 반주 생성, 전문 녹음 등 다양한 기능이 있습니다. 사용자는 간단한 가사나 멜로디 스니펫만 입력하면 AI가 록, 랩, 발라드 등을 아우르는 완전한 노래 콘텐츠를 빠르게 생성할 수 있습니다.
안티스펙트럼은 첨단 AI 기술을 기반으로 한 혁신적인 온라인 AI 음악 변환 플랫폼으로, 오디오 파일(MP3, FLAC 등)을 펜타토닉 및 간단한 악보로 변환해줍니다. 안티스펙트럼에는 음악의 반주에서 보컬을 분리하는 보컬 분리 기능이 있어 음악 제작과 믹싱을 쉽게 할 수 있습니다. 안티스펙트럼은 미디 파일 변환을 지원합니다...
Replay는 딥러닝 기술을 기반으로 한 고급 AI 음악 반주 분리 도구입니다. 이 도구는 오디오 콘텐츠를 자동으로 분석하고 리드 보컬, 보컬 및 백킹 트랙과 같은 트랙을 정확하게 분리하여 별도의 오디오 파일을 생성하는 것을 지원하며, MP3, WAV, FL과 같은 많은 일반적인 오디오 형식을 지원합니다.
후위안비디오-아바타는 텐센트 혼합원 팀과 텐센트 뮤직 티엔친 연구소가 공동으로 출시한 고급 음성 디지털 휴먼 모델입니다. 이 모델은 사용자가 업로드한 캐릭터 이미지와 오디오를 기반으로 자연스러운 표정을 생성하는 혁신적인 멀티모달 확산 트랜스포머 아키텍처를 기반으로 합니다.
헤이젠은 간소화된 동영상 제작 프로세스를 지원하는 AI 기반 디지털 휴먼 동영상 제작 플랫폼으로, 사용자가 전문가 수준의 디지털 휴먼 동영상을 빠르게 제작할 수 있도록 지원합니다. 이 플랫폼은 고급 AI 기술을 기반으로 하여 사용자가 디지털 캐릭터의 이미지와 음성을 완벽하게 제어할 수 있으며, 다양한 배경을 포함한 풍부한 자료 라이브러리를 제공합니다.
Make는 조직이 자동화된 프로세스를 기반으로 효율성과 혁신을 개선할 수 있도록 지원하는 AI 기반의 코딩 없는 자동화 플랫폼입니다. 이 플랫폼은 마케팅, 영업, 재무 등 다양한 비즈니스 시나리오를 지원하는 2,000개 이상의 사전 구축된 앱을 제공합니다. Make의 핵심 기능에는 코드 없는 시각적 프로세스 생성, AI...
MiMo-VL은 비주얼 코더, 크로스 모달 프로젝션 레이어 및 언어 모델로 구성된 Xiaomi의 오픈 소스 멀티모달 그랜드 모델입니다. 비주얼 코더는 기본 해상도 입력을 지원하고 더 많은 디테일을 보존하는 Qwen2.5-ViT를 기반으로 하며, 언어 모델은 복잡한 프로젝션을 위해 설계된 Xiaomi의 자체 개발 MiMo-7B를 기반으로 합니다.
Olovka AI는 학생들을 위한 AI 학술 작문 지원 플랫폼으로, 학생의 학업 수준, 전공 분야 및 논문 유형에 따라 정확한 작문 조언과 지원을 제공합니다. 지능형 알고리즘을 기반으로 하는 Olovka AI는 학생들이 고품질의 학술 논문을 빠르게 작성할 수 있도록 도와줍니다.
Fish Audio는 텍스트 음성 변환(TTS)과 음성 복제를 지원하는 강력한 생성형 AI 음성 합성 도구입니다. 사용자는 텍스트만 입력하면 자연스럽고 부드러운 음성 변환을 지원하며, 플랫폼은 다양한 시나리오와 사용자에 맞게 선택할 수 있는 다양한 언어와 음성 스타일을 제공합니다.
시그넴마는 구글 딥마인드의 세계에서 가장 강력한 수어 통역 AI 모델로, 미국 수어(ASL)를 영어 텍스트로 정확하게 번역할 수 있도록 지원합니다. 이 모델은 시각 데이터와 텍스트 데이터를 결합하여 수화 동작을 실시간으로 포착하고 이를 텍스트로 빠르게 번역하는 다중 모드 학습을 기반으로 합니다....
FLUX.1 Kontext는 문맥 인식 이미지 처리 기술을 제공하는 Black Forest Labs의 이미지 생성 및 편집 모델입니다. 이 모델은 텍스트 및 이미지 단서에 대한 반응을 이해하고 개체 수정, 스타일 변환, 배경 교체와 같은 작업을 수행하면서 모서리를 유지합니다.
스피릿 코드 IDE는 통이 스피릿 코드가 출시한 AI 네이티브 통합 개발 환경(IDE)으로, 천문 3대 모델에 깊이 적용되었으며 강력한 프로그래밍 지능체 모드를 통해 프로젝트 인식, 코드 검색, 터미널 작업 실행 등 작업의 자율적 완수를 지원합니다. MCP 도구를 지원하며 Magic Hitch MCP Square의 3...
바젤은 바이트댄스에서 오픈소스화한 멀티모달 기본 모델로, 140억 개의 파라미터가 있으며 이 중 70억 개가 활성화되어 있습니다. 모델 베이스와 두 개의 독립적인 인코더로 이미지의 픽셀 수준과 의미 수준 특징을 각각 캡처하는 혼합 트랜스포머 전문가 아키텍처(MoT)는 이미지, 텍스트, 비디오의 효율적인 처리를 지원합니다....
DeepSeek-R1은 항저우에 본사를 둔 DeepSeek에서 출시한 고성능 AI 추론 모델로, OpenAI의 o1 공식 버전을 벤치마킹했습니다. 이 모델은 대규모 강화 학습 기법을 기반으로 사후 학습되며 수학, 코드 및 자연어로 추론하는 데 매우 적은 양의 레이블 데이터만 필요합니다.
팬텀보트 AI는 광고, 프로모션, 애니메이션 등 다양한 유형의 동영상 콘텐츠를 효율적으로 일괄 생성할 수 있도록 지원하는 강력한 원스톱 AI 단편 영화 제작 플랫폼입니다. 이 플랫폼은 미드저니, 런웨이 및 기타 세계 최고의 AI 모델을 기반으로 하며, 크리에이터에게 대본 작성부터 촬영까지 다양한 서비스를 제공합니다.