최신 AI 리소스

共 2985 篇文章
UnifoLM-WMA-0 - 宇树科技开源的世界模型动作架构

UnifoLM-WMA-0 - 유슈 테크놀로지 오픈 소스 월드 모델 액션 아키텍처

UnifoLM-WMA-0은 일반 로봇 학습을 위해 설계된 유슈 테크놀로지의 여러 로봇 온톨로지 클래스에 걸친 오픈 소스 월드 모델-액션 아키텍처입니다. 월드 모델과 액션 아키텍처로 구성된 월드 모델은 로봇과 환경 상호 작용의 물리적 법칙을 이해하고, 액션 아키텍처는 특정 동작을 담당합니다.
6개월 전
042.9K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Google의 AI 가상 피팅 앱

도플은 구글의 AI 가상 피팅 앱입니다. 사용자가 전신 사진을 업로드하면 애플리케이션은 자신의 신체 디지털 버전에 옷 사진이나 스크린샷을 '착용'하고, 정적인 사진에서 AI가 생성한 동영상으로 변환하여 사용자가 옷이 신체에 미치는 효과를 더욱 실감나게 느낄 수 있도록 지원합니다.
9개월 전
042.9K
JoyHallo - 京东开源的AI数字人模型

조이할로 - 징동의 오픈소스 AI 디지털 휴먼 모델

조이할로는 중국어용으로 설계된 징동의 오픈소스 AI 디지털 휴먼 모델로, 오디오를 사실적인 말하기 비디오로 변환하는 것을 지원하며, 입술 움직임 예측 정확도를 높이기 위해 반분리 구조를 사용하여 wav2vec2 모델을 기반으로 오디오 기능을 내장하고 영어 비디오 생성을 지원합니다....
9개월 전
042.8K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - 직면 지능과 칭화 오픈 소스 엔드투엔드 TTS 모델

VoxCPM은 Facade Intelligence와 칭화대학교 선전 국제대학원이 공동으로 오픈소스화한 음성 생성 모델로, 엔드투엔드 확산 자동 회귀 아키텍처를 채택하여 텍스트에서 직접 연속 음성 표현을 생성함으로써 기존의 이산적 명료화의 한계를 극복합니다. 계층적 언어 모델링과 유한 상태 양자화를 통해 ...
6개월 전
042.8K
商汤商量:日日新(SenseNova)超千亿参数模型,商量智能助手

SenseNova: 매일 1000억 개 이상의 파라미터 모델, 컨설팅 지능형 비서(SenseNova)

포괄적 인 소개 Shangtang Consultation은 Shangtang Technology에서 개발 한 슈퍼 1000 억 매개 변수 AI 언어 빅 모델 플랫폼으로 SenseChat으로 알려져 있으며,이 플랫폼은 Shangtang의 강력한 MaaS (서비스 형 모델) 서비스와 산술 지원을 기반으로 사용자에게 광범위한 AI 콘텐츠를 제공합니다 ...
1 년 전
042.8K
JustCMS:AI驱动的无头内容管理系统,利用 AI 快速创作内容(付费)

JustCMS: AI를 사용하여 콘텐츠를 빠르게 생성하는 AI 기반 헤드리스 콘텐츠 관리 시스템(유료)

일반 소개 JustCMS는 바쁜 콘텐츠 제작자를 위해 설계된 혁신적인 콘텐츠 관리 시스템입니다. 인공지능 기술을 활용하여 콘텐츠 제작부터 게시까지 프로세스의 모든 단계를 지원하며, 헤드리스 아키텍처를 사용하여 콘텐츠 전송의 속도와 유연성을 보장합니다. 사용자는 ...
1 년 전
042.7K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图

커튼 - AI 개요 노트 도구, 복잡한 정보를 한 번의 클릭으로 마인드맵 생성

커튼은 사용자가 단편적인 지식 포인트를 구조화된 개요 양식에 따라 체계화할 수 있도록 도와주는 AI 개요 노트 도구로, 원클릭 마인드맵 생성을 지원합니다. 커튼은 복잡한 정보를 직관적인 그래픽으로 표현하고, 생각을 빠르게 정리하며, 이해력과 기억력을 향상시키는 데 도움을 줍니다.
9개월 전
042.7K
NeverEnds:使用文字描述生成效果逼真的视频

NeverEnds: 텍스트 설명이 포함된 사실적인 동영상 생성

일반 소개 네버엔즈는 고급 모델을 통해 텍스트를 동영상으로 변환하여 모든 종류의 스토리를 위한 무한한 창작 공간을 제공하는 싱가포르의 플랫폼입니다. 사용자는 이 플랫폼에서 자유롭게 창의성을 표현하고 감정을 전달할 수 있을 뿐만 아니라 브랜드 이미지를 구축할 수 있습니다. 이 플랫폼은 독특한 것으로 유명합니다...
2 년 전
042.7K
MuseSteamer - 百度推出的视频生成大模型

뮤즈스티머 - 바이두, 동영상 생성을 위한 대형 모델 출시

뮤즈스팀은 바이두에서 출시한 멀티모달 동영상 생성을 위한 대형 모델입니다. 이 모델은 사용자가 제공한 텍스트 설명이나 이미지를 기반으로 고품질의 동적 동영상 콘텐츠를 빠르게 생성할 수 있으며, 다양한 시나리오의 제작 요구 사항을 충족하기 위해 다양한 선명도 및 기능 버전을 지원합니다.
9개월 전
042.7K
探饭 - 字节跳动推出的AI美食推荐工具

스카우팅 라이스 - 워드프레스에서 출시한 AI 음식 추천 도구

탄라이스는 바이트댄스의 자회사인 지터버그가 출시한 인공지능 음식 추천 도구로, 빈백 빅 모델을 기반으로 사용자에게 개인화된 음식 추천, 상점 검색 비교, 음식 팁 및 기타 서비스를 제공합니다. 탄라이스는 사용자의 취향과 위치를 기반으로 주변 레스토랑과 요리를 정확하게 추천하고, 주문 보조를 지원하며, 단체 구매 및 테이크아웃 서비스를 제공합니다....
9개월 전
042.6K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - 워드프레스 시드 팀의 범용 로보틱스 모델

Seed GR-3는 새로운 환경과 복잡한 명령에 적응할 수 있는 강력한 일반화 기능을 갖춘 바이트댄스에서 개발한 범용 로봇 모델입니다. 이 모델은 시각, 언어 및 동작 정보를 융합하고 로봇 데이터, VR 인체 궤적 데이터 및 공개 그래픽 데이터의 3-in-1 학습 방법을 기반으로 새로운 물체에 대한 반응 능력을 향상시킵니다....
8개월 전
042.6K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - 아이디어에서 창작까지 전 과정을 지원하는 AI 소설 지원 글쓰기 플랫폼

스퀴블러는 작가를 위해 설계된 강력한 AI 지원 글쓰기 플랫폼으로, 구상부터 창작, 출판에 이르는 전 과정을 도와줍니다. 이 플랫폼은 소설, 시나리오, 단편 소설 등 다양한 스토리 템플릿을 제공합니다. 사용자는 초기 컨셉만 입력하면 AI가 개요, 캐릭터, 장면 등을 생성할 수 있습니다.
7개월 전
042.6K
Tizzy.ai - 百度推出的AI搜索应用

Tizzy.ai - 바이두에서 출시한 AI 검색 앱

Tizzy.ai는 바이두에서 출시 한 AI 지능형 검색 애플리케이션으로, 강력한 지능형 검색 기능을 갖춘 바이두의 빅 모델 기술을 기반으로하며 질문에 빠르게 답하고 깊이 생각하고 의사 결정을 지원할 수 있습니다.Tizzy.ai는 인터페이스가 간단하고 광고와 팝업이 없으며 가이드 하단에 ...
8개월 전
042.5K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - Ali, 실시간 텍스트 기반 대화형 아바타 생성 프레임워크 출시

옴니토커는 알리바바의 실시간 텍스트 기반 대화형 아바타 생성 프레임워크입니다. 이 프레임워크는 텍스트, 이미지, 오디오 및 비디오와 같은 여러 모달 입력을 동시에 처리하고 스트리밍 방식을 기반으로 자연스러운 음성 응답을 생성할 수 있습니다. 핵심은 씽커-토커 아키텍처를 기반으로 하며, 씬...
9개월 전
042.5K
宠TA - 京东推出的AI宠物互动产品

펫타 - 징동에서 출시한 인공지능 반려동물 상호작용 제품

Pet TA는 징동에서 출시한 AIGC 반려동물 인터랙티브 제품으로, 반려동물 애호가들에게 재미있고 따뜻한 온라인 인터랙티브 플랫폼을 제공할 수 있습니다. 사용자가 반려동물을 위한 다양하고 귀여운 옷과 액세서리를 선택하고, 맞춤형으로 꾸밀 수 있도록 지원하며, 반려동물의 디지털 이미지를 만들어 반려동물과 풍부한 상호작용을 할 수 있습니다. 이 플랫폼은 다음을 제공합니다.
8개월 전
042.4K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - 오픈 소스 AI 워크플로 자동화 도구

ChatFlow는 복잡한 요구사항을 효율적인 워크플로로 전환할 수 있도록 지원하는 오픈 소스 AI 워크플로 자동화 도구입니다. 사용자가 코드 프레임워크, 테스트 케이스를 빠르게 생성할 수 있도록 지원하는 AI 기술 기반 도구는 소프트웨어 아키텍처를 작성하고 설계하는 데 도움을 줄 수 있습니다.
8개월 전
042.4K
Make - AI无代码自动化工作流搭建平台

Make - 코드가 필요 없는 AI의 자동화된 워크플로 구축 플랫폼

Make는 조직이 자동화된 프로세스를 기반으로 효율성과 혁신을 개선할 수 있도록 지원하는 AI 기반의 코딩 없는 자동화 플랫폼입니다. 이 플랫폼은 마케팅, 영업, 재무 등 다양한 비즈니스 시나리오를 지원하는 2,000개 이상의 사전 구축된 앱을 제공합니다. Make의 핵심 기능에는 코드 없는 시각적 프로세스 생성, AI...
9개월 전
042.3K
MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - 상하이 AI Lab과 북경대학교 오픈 소스 문서 구문 분석 모델

MinerU2.5는 상하이 인공지능 연구소와 북경대학교 팀이 공동으로 개발한 분리형 시각 언어 모델로, 고해상도 문서 이미지 구문을 효율적으로 처리하는 데 중점을 두고 있습니다. 핵심 혁신은 "글로벌 레이아웃 감지 후 로컬 콘텐츠 인식"의 2단계 설계에 있습니다. 첫 번째 단계는 저해상도...
5개월 전
042.3K
EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LG의 하이브리드 추론 모델

엑사온 4.0은 범용 자연어 처리와 고급 추론 기능을 결합한 한국 LG AI 리서치의 하이브리드 추론 그랜드 모델입니다. 이 모델은 한국어, 영어, 스페인어를 지원하며 32B 전문가용 버전과 12B 엔드-사이드 버전으로 나뉩니다. 전문가용 버전은 법률, 회계...
8개월 전
042.2K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - 두뇌 크기의 협업 프레임워크를 구현한 Wisdom Spectrum의 오픈 소스 교차 온톨로지

RoboOS 2.0은 로봇이 단일 지능에서 그룹 협업 지능으로 전환하는 것을 촉진하는 교차 온톨로지 두뇌-두뇌 협업을 위한 오픈 소스 프레임워크입니다. 이 프레임워크는 '빅 브레인' 아키텍처를 사용하여 클라우드 브레인은 복잡한 의사 결정과 협업을 담당하고 스몰 브레인 모듈은 특정 기술을 실행하는 데 집중하는 효율적인 분업을 달성합니다.
8개월 전
042.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

하이퍼볼릭 에이전트 키트: 에이전트에게 자체 컴퓨팅 리소스, 자율적인 GPU 관리, 블록체인 운영 및 소셜 퍼블리싱 기능을 제공합니다.

일반 소개 하이퍼볼릭 에이전트키트는 블록체인과 컴퓨팅 파워를 결합하여 AI 에이전트를 실행하기 위한 템플릿을 제공하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 코인베이스의 CDP 에이전트킷을 기반으로 하며, 터미널을 지원하기 위한 수정 및 확장 기능을 갖추고 있습니다.
1 년 전
042.2K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

링코드 IDE - 통이 링코드, AI 네이티브 개발 환경 도구 출시

스피릿 코드 IDE는 통이 스피릿 코드가 출시한 AI 네이티브 통합 개발 환경(IDE)으로, 천문 3대 모델에 깊이 적용되었으며 강력한 프로그래밍 지능체 모드를 통해 프로젝트 인식, 코드 검색, 터미널 작업 실행 등 작업의 자율적 완수를 지원합니다. MCP 도구를 지원하며 Magic Hitch MCP Square의 3...
9개월 전
042.1K
RedOne - 小红书最新推出的社交大模型

RedOne - 리틀 레드북의 최신 소셜 메가 모델

레드원은 리틀 레드북에서 도입한 소셜 네트워크에 특화된 대규모 언어 모델입니다. 이 모델은 사회 및 문화적 지식을 통합하고, 멀티태스킹 기능을 강화하며, 인간의 선호도를 조정하는 3단계 훈련 전략을 통해 훈련되며, RedOne은 소셜 작업 성능, 유해 콘텐츠 탐지 및 검색에서 기본 모델보다 훨씬 뛰어난 성능을 발휘합니다....
7개월 전
042.1K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 추론, 코드 및 인텔리전스를 위한 스마트 스펙트럼 오픈 소스 SOTA 모델

GLM-4.5는 추론, 코드 생성 및 지능형 신체 기능을 통합하여 지능형 신체 애플리케이션을 위해 설계된 Smart Spectrum의 오픈 소스 SOTA 모델입니다. 이 모델은 혼합 전문가(MoE) 아키텍처를 기반으로 하며 3,550억 개의 파라미터가 포함된 GLM-4.5와 1,600억 개의 파라미터가 포함된 두 가지 버전이 있습니다.
8개월 전
042K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - Google의 일반 세계 모델

Genie 3는 매우 역동적이고 일관된 가상 세계를 실시간으로 생성할 수 있는 Google DeepMind의 차세대 범용 세계 모델로, 물리 현상과 자연 생태계를 시뮬레이션하고 판타지 및 역사 시나리오를 생성할 수 있도록 지원합니다. 텍스트 프롬프트를 통해 사용자는 ...
7개월 전
041.9K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - Quintessence의 고급 AI 음악 제작 모델

Mureka V7.5는 중국 작곡에 중점을 둔 쿤룬 월드 와이드의 최첨단 AI 음악 생성 모델입니다. 이 모델은 음색과 연주 기법을 정확하게 재현하여 자연스럽고 부드럽고 감성적인 보컬을 생성합니다. 최적화된 자동 음성 인식(ASR) 기술을 기반으로 하는 Mureka V...
7개월 전
041.8K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Amoy Group의 효율적인 VLA 모델

CombatVLA는 아모이 그룹의 퓨처 라이프 랩 팀이 개발한 혁신적인 3D 액션 롤플레잉 게임(ARPG) 전용 모델로, 3B 파라메트릭 스케일로 구축된 시각-언어-행동(VLA) 모델로, 모션 트래커를 통해 인간 플레이어의 동작을 수집합니다.
7개월 전
041.8K
绘想 - 百度推出的AI视频生成平台

페인팅 씽킹 - 바이두가 출시한 AI 동영상 생성 플랫폼

페인팅은 사용자가 개인화된 동영상을 쉽게 제작할 수 있도록 AI 기술을 기반으로 바이두에서 출시한 AI 동영상 생성 플랫폼입니다. 직관적인 인터페이스, 강력한 도구, 영감 추천 기능을 갖춘 페인팅은 크리에이터에게 창의적인 영감을 제공하고, 동일한 작업의 핵심을 지원하며, 유사한 동영상을 빠르게 생성하고, 창작 과정을 간소화할 수 있습니다.
9개월 전
041.8K
11ai - ElevenLabs推出个人AI语音助理

11ai - ElevenLabs, 개인용 AI 음성 비서 출시

11ai는 일레븐랩스에서 출시한 인공지능 음성비서로, 자연스럽고 부드러운 대화를 통해 사용자의 업무 효율성을 높여주는 음성 상호작용을 핵심으로 하며, 5,000개 이상의 음성을 지원하고 사용자가 전용 음성을 커스터마이징할 수 있어 더욱 개인화된 어시스턴트입니다. 지연 시간이 짧은 음성 인터랙션으로 ...
9개월 전
041.8K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 쿤룬웨이의 최신 음성 생성 프레임워크

MoE-TTS는 사전 학습된 대규모 언어 모델(LLM)과 음성 전문가 모듈을 결합하는 혼합 전문가(MoE) 아키텍처를 기반으로 하는 쿤룬완웨이가 도입한 음성 합성 프레임워크로, 텍스트 모듈 파라미터는 고정하고 음성 모듈 파라미터만 업데이트하여 강력한 텍스트 추론 기능을 유지합니다...
7개월 전
041.8K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - AI 사진 조작 도구, 한 번의 클릭으로 오래된 사진을 모션 비디오로 바꾸세요!

AopsAI는 오래된 사진을 역동적인 짧은 동영상으로 변환하는 온라인 AI 도구입니다. 이 도구는 첨단 AI 기술을 기반으로 정지된 사진을 '움직이게' 만들어 과거의 아름다운 순간을 재현합니다. 사용자가 사진을 업로드하고 이메일 주소를 제공하면 AopsAI가 24시간 이내에 자동으로 동영상을 생성하여 다음 주소로 전송합니다.
9개월 전
041.7K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 중국과학원 자동화 연구소 및 기타 기관에서 출시한 지능형 연구 플랫폼입니다.

사이언스원은 중국과학원 자동화연구소가 공동으로 출시한 지능형 과학 연구 플랫폼입니다. 이 플랫폼은 대규모 과학 기반 모델 구축을 기반으로 하며, 다학제 협업을 통해 지능형 과학 연구의 새로운 패러다임을 촉진하여 과학 연구의 전 과정을 지원하며, ScienceOne의 핵심 제품에는 S1 ...
9개월 전
041.7K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropic의 가장 강력한 프로그래밍 모델

Claude Opus 4.1은 복잡한 작업을 효율적으로 처리할 수 있도록 설계된 Anthropic의 최신 대규모 언어 모델입니다. 이 모델은 프로그래밍 영역에서 탁월한 성능을 발휘하여 고품질 코드를 생성하고 최대 32k의 단일 출력을 지원하며 다양한 프로그래밍 스타일에 적응할 수 있습니다....
7개월 전
041.7K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technology의 3D 가우시안 시맨틱 데이터 세트

InteriorGS는 큐나 테크놀로지가 도입한 고품질 3D 가우시안 시맨틱 데이터 세트입니다. 이 데이터 세트에는 집, 편의점, 예식장, 박물관 등 80개 이상의 실내 환경을 포함하는 1,000개의 3D 장면이 포함되어 있습니다. 이 데이터 세트에는 755개 카테고리의 554,000개 이상의 객체 인스턴스가 포함되어 있습니다...
7개월 전
041.7K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - 알리 통이의 오디오 생성 모델링

씽크사운드는 알리 통이 스피치 팀이 도입한 최초의 CoT(연쇄적 사고) 오디오 생성 모델입니다. 이 모델은 CoT 추론의 도입을 기반으로 비디오 이미지에 정확하게 일치하는 음향 효과를 생성하여 기존 기술이 화면의 동적 세부 사항과 공간 관계를 포착하기 어렵다는 문제를 해결할 수 있습니다.
9개월 전
041.6K
Mu - 微软推出的小参数语言模型,支持Windows智能体

Mu - Microsoft, Windows 인텔리전트 지원을 위한 작은 매개 변수 언어 모델 도입

Mu는 3억 3천만 개의 매개변수만 있는 Microsoft의 소규모 매개변수 언어 모델로, NPU와 에지 디바이스에서 효율적으로 실행되도록 설계되었습니다. 이 모델은 인코더-디코더 아키텍처를 기반으로 하며 하드웨어 인식 최적화, 모델 양자화 및 작업별 미세 조정을 통해 초당 100개 이상의 토큰 응답 속도를 달성합니다.Mu...
9개월 전
041.6K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

시드 디퓨전 - ByteHopper의 최신 디퓨전 언어 모델

시드 확산은 코드 생성 작업을 처리하기 위해 ByteHop에서 도입한 실험적인 확산 언어 모델입니다. 이 모델은 2단계 확산 훈련, 제약된 순차 학습, 향상된 효율적인 병렬 디코딩과 같은 기술을 기반으로 하며, 추론 속도를 2,146 토큰/초로 크게 개선하여... 보다 빠른 2,146 토큰/초로 향상시킵니다.
8개월 전
041.6K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - 구글 오픈 소스 프로그래밍 에이전트

Gemini CLI는 개발자에게 강력한 AI 기능을 제공하기 위해 Gemini 빅 모델을 개발자의 엔드포인트에 통합한 Google의 오픈 소스 AI 프로그래밍 도구입니다. 이 도구는 코드를 이해하고, 파일을 조작하고, 명령을 실행하고, 동적으로 문제를 해결하여 개발자가 효율적으로 생성 코드를 작성할 수 있도록 도와줍니다.
9개월 전
041.5K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

펭귄 독서 도우미 - 초등학생과 중고등학생을 위한 텐센트의 AI 독서 도우미

펭귄 리딩 컴패니언은 초등학생과 중고등학생을 위해 설계된 텐센트의 인공지능 독서 도우미입니다. 펭귄 리딩 컴패니언은 텐센트의 하이브리드 빅 모델과 메타머신 플랫폼을 의무 교육 언어 교과 과정 프로그램 및 교과 과정 표준(2022년판)과 결합하여 학생들에게 개인화된 독서 추천, 다양한 독서 모드(집중, 소리 내어 읽기, 듣기...)를 제공합니다.
9개월 전
041.5K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

훈위안비디오-아바타 - 텐센트 하이브리드 오픈 소스 음성 디지털 휴먼 모델

후위안비디오-아바타는 텐센트 혼합원 팀과 텐센트 뮤직 티엔친 연구소가 공동으로 출시한 고급 음성 디지털 휴먼 모델입니다. 이 모델은 사용자가 업로드한 캐릭터 이미지와 오디오를 기반으로 자연스러운 표정을 생성하는 혁신적인 멀티모달 확산 트랜스포머 아키텍처를 기반으로 합니다.
9개월 전
041.4K
Hailuo Video Agent - MiniMax推出的AI视频创作Agent

Hailuo 비디오 에이전트 - MiniMax의 AI 비디오 제작 에이전트

하이뤄 비디오 에이전트는 미니막스에서 출시한 문턱 없는 AI 비디오 제작 에이전트로, 오픈 베타 버전입니다. 간단한 텍스트 입력 또는 이미지 업로드를 통해 클릭 한 번으로 고품질의 창의적인 동영상을 생성할 수 있으며, 다음과 같은 다양한 응용 시나리오를 다룰 수 있습니다.
9개월 전
041.3K
商汤如影 - 商汤科技推出的AI数字人视频制作平台

샹탕 루이 - 샹탕 테크놀로지가 출시한 AI 디지털 휴먼 비디오 제작 플랫폼

샹탕 루잉은 샹탕 테크놀로지가 출시한 AI 디지털 휴먼 동영상 제작 플랫폼입니다. 이 플랫폼은 빅 모델 기술을 기반으로 얼굴 특징, 의상, 헤어스타일 등을 포함한 매우 사실적인 디지털 인간 이미지와 개인화 제작을 지원합니다. 이 플랫폼은 사운드 복제, 비디오 생성, 자동화된 데이터 주석, 실시간 상호 작용 및 기타 기능을 갖추고 있습니다....
9개월 전
041.3K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

초안 작성 AI 커뮤니티 - AI 크리에이티브 콘텐츠 디자인 플랫폼, 다양한 크리에이티브 요구 사항을 충족하는 다양한 디자인 리소스

드래프팅 AI 커뮤니티는 사용자에게 풍부한 창의적인 디자인 리소스와 도구를 제공하는 온라인 AI 창작 영감 플랫폼입니다. 이 플랫폼은 이미지 사진, 전자상거래 디자인, 명절 테마, 3D 일러스트레이션, 아바타 디자인, 샤오홍슈 소재, 인물 디자인 등 다양한 디자인 분야를 다루며 다양한 사용자의 요구를 충족합니다.
10개월 전
041K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn - ZJU 및 Vivo 등의 비디오 가상 체험 프레임워크

MagicTryOn은 절강대학교 컴퓨터 과학 기술 대학이 생체 및 기타 조직과 협력하여 출시한 고급 비디오 가상 체험 프레임워크입니다. 이 프레임워크는 기존의 U-Net 아키텍처를 혁신적인 확산 트랜스포머(DiT) 아키텍처로 대체하고, 완전히 스스로 인식하는 기계와 결합하여 ...
9개월 전
041K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAI의 최신 AI 음성 모델

gpt-realtime은 자연스럽고 부드러운 음성을 생성하기 위해 오디오의 직접 처리를 지원하는 OpenAI의 고급 음성 모델입니다. 이 모델은 여러 언어와 스타일을 지원하고 웃음과 같은 비언어적 단서를 이해하며 언어 간에 전환할 수 있습니다.
7개월 전
040.9K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - Quintessence의 AI 음악 생성 모델

Mureka V7은 쿤룬 월드와이드에서 출시한 고급 AI 음악 생성 모델입니다. 이 모델은 보다 일관성 있고 예술적인 음악 작품을 생성하기 위해 세부 사항을 채우기 전에 음악의 전체 구조를 계획하는 것을 지원하는 MusiCoT 기술을 기반으로 합니다.
8개월 전
040.8K
Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard - 알리 퀀 오픈 소스 보안 모델

Qwen3Guard는 보안 탐지를 위해 설계된 Qwen3 기본 모델을 기반으로 미세 조정된 보안 보호 모델입니다. 프롬프트 및 응답에 대한 정확한 보안 분류를 제공하고 위험 수준을 제공하며 영어, 중국어 및 다국어 환경을 지원합니다.Qwen3Guard는 두 가지 프로 버전으로 제공됩니다.
6개월 전
040.8K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpialGen - Qunar Technologies의 오픈 소스 3D 씬 생성 모델

스페이셜젠은 확산 모델 아키텍처를 기반으로 하는 쿠나 테크놀로지의 오픈 소스 3D 장면 생성 모델로, 텍스트 설명, 참조 이미지 및 3D 공간 레이아웃을 기반으로 시공간적으로 일관된 멀티뷰 이미지를 생성하고 3D 가우시안 장면 생성 및 로밍 비디오 렌더링을 지원합니다.
7개월 전
040.7K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Microsoft의 제로 샘플 음성 합성 모델

DragonV2.1은 Microsoft의 고급 제로 샘플 텍스트 음성 변환(TTS) 모델입니다. 트랜스포머 아키텍처를 기반으로 하는 이 모델은 다국어 및 제로 샘플 음성 복제를 지원하며 5~90초의 음성 프롬프트만으로 자연스럽고 표현력 있는 음성을 생성합니다.
7개월 전
040.6K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: 텍스트, 이미지 및 오디오 멀티모달 이해 및 분석을 지원하는 엔드사이드 멀티모달 이해 모델

종합 소개 인피니메그레즈는 하드웨어와 소프트웨어의 공동 설계를 통해 효율적인 멀티모달 이해와 분석을 목표로 하는 인피닛 코어 돔(인피닛 AI)이 개발한 엣지 인텔리전스 솔루션입니다. 프로젝트의 핵심은 그래프를 지원하는 Megrez-3B 모델입니다.
1 년 전
040.6K
羚珑 - 京东推出的AI商品图设计工具

Antelope - 징동에서 출시한 AI 제품 이미지 디자인 도구

앤털로프는 징동에서 출시한 지능형 디자인 도구로, 전자상거래 판매자와 개인에게 효율적이고 편리한 디자인 솔루션을 제공합니다. 지능형 키잉, 지능형 레이아웃, 지능형 컬러 매칭 및 기타 기능을 통해 사용자가 제품, 광고 배너, 상점 페이지 및 기타 종류의 전자 상거래 상점의 주요 그림을 충족하는 고품질 디자인 작품을 신속하게 생성 할 수 있습니다....
9개월 전
040.5K
ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPT 에이전트 - OpenAI의 범용 지능형 AI 에이전트

ChatGPT 에이전트는 여러 기능을 결합하여 복잡한 작업을 자율적으로 완료하는 OpenAI의 범용 AI 에이전트입니다. 사용자는 자연어로 자신의 요구 사항을 설명하기만 하면 에이전트가 웹 검색, 정보 추출, 코드 실행 등 적절한 도구를 자동으로 선택할 수 있습니다.
8개월 전
040.4K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 다국어 번역 및 더빙을 지원하는 AI 디지털 휴먼 비디오 제작 플랫폼

헤이젠은 간소화된 동영상 제작 프로세스를 지원하는 AI 기반 디지털 휴먼 동영상 제작 플랫폼으로, 사용자가 전문가 수준의 디지털 휴먼 동영상을 빠르게 제작할 수 있도록 지원합니다. 이 플랫폼은 고급 AI 기술을 기반으로 하여 사용자가 디지털 캐릭터의 이미지와 음성을 완벽하게 제어할 수 있으며, 다양한 배경을 포함한 풍부한 자료 라이브러리를 제공합니다.
9개월 전
040.4K
琴乐大模型 - 腾讯推出的AI音乐创作模型

피아노 음악 빅 모델 - 텐센트에서 출시한 AI 음악 작곡 모델

진뮤직 그랜드 모델은 텐센트 AI 랩과 텐센트 TME 티엔친 랩이 공동으로 출시한 고급 AI 음악 창작 그랜드 모델입니다. 이 모델은 사용자가 입력한 키워드, 설명 문구 또는 영어와 중국어로 된 오디오 클립을 기반으로 고품질 스테레오 오디오 또는 멀티 트랙 악보를 지능적으로 생성합니다.
9개월 전
040.3K
ViMax - 香港大学开源的多智能体视频生成框架

홍콩대학교의 오픈 소스 멀티 인텔리전트 바디 비디오 생성 프레임워크인 ViMax

ViMax는 홍콩대학교 데이터 과학 연구소의 오픈 소스 다중 지능 바디 비디오 생성 프레임워크로, 크리에이티브 입력부터 비디오 출력까지 전체 프로세스를 자동화할 수 있습니다. 스크립트 생성, 장면 디자인, 샷 계획 및 비디오 렌더링 등을 통합하여 사용자가 자연어 설명을 통해 일관된 영화 및 텔레비전 등급 비디오를 생성할 수 있도록 지원합니다.
4개월 전
040.3K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro: 비즈니스 분석, 연말 보고 등 모든 사용자 지정 주제에 대한 상세 보고서를 생성합니다.

일반 설명 보고서 mAIstro는 자연어 처리 기술을 통해 사용자가 사용자 정의 보고서를 쉽게 만들 수 있도록 설계된 강력한 도구입니다. 이 도구는 랭체인 기술을 활용하여 사용자가 제공한 주제와 구조를 세부적인 보고서로 변환합니다.
12개월 전
040.2K
AI Agent Company Researcher:自动化公司信息研究情报员

AI 에이전트 기업 연구원: 자동화된 기업 정보 조사 인텔리전스

일반 설명 AI 기업 리서치 어시스턴트는 기업 리서치 및 리드 생성 프로세스를 자동화하도록 설계된 인공지능 기반 도구입니다. 이 도구는 LangGraph 및 FireCrawl과 같은 기술을 사용하여 단 몇 분 만에 상세한 기업 리서치 보고서를 생성할 수 있습니다. 사용자는 간단히 다음을 수행하면 됩니다.
1 년 전
040.2K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - 에이전트 중심 사용자 상호작용 인터페이스를 위한 Google의 오픈 소스 선언적 프로토콜입니다.

A2UI(에이전트-사용자 인터페이스)는 AI 에이전트를 위한 복잡한 대화형 인터페이스를 생성하는 문제를 해결하는 Google의 오픈 소스 에이전트 중심 인터페이스 프로토콜입니다. AI 에이전트가 사용자 인터페이스, 클라이언트 애플리케이션의 구조를 설명할 수 있는 선언적 JSON 형식을 통해 ...
3 개월 전
040.1K
ML-Master – 上海交大推出的AI专家Agent

ML-Master - SJTU에서 출시한 AI 전문가 에이전트

ML-Master는 상하이교통대학교 인공지능 학교의 에이전트 팀이 출시한 AI 전문 지능입니다. OpenAI의 권위 있는 벤치마크 테스트인 MLE 벤치에서 평균 29.3%의 메달 비율로 1위를 차지하며 Microsoft의 RD-Agent...를 능가하는 우수한 성적을 거두었습니다.
9개월 전
040K
Klic Studio - AI音视频翻译配音工具,一键部署全流程

Klic Studio - AI 오디오/비디오 번역 및 더빙 도구, 원클릭으로 전체 프로세스를 배포할 수 있는 도구

Klic Studio(구 Krillin AI)는 동영상 제작자와 콘텐츠 내보내기를 위해 설계된 AI 기반 동영상 번역, 더빙 및 음성 복제 도구입니다. 전체 프로세스의 원클릭 배포를 지원하여 한 번의 클릭으로 다운로드부터 완성된 출력까지 비디오를 완성할 수 있으며, Jieyin, Xiaohongshu, B ...에 맞게 조정되었습니다.
9개월 전
040K
Magistral - Mistral AI 推出的系列推理模型

Magistral - Mistral AI의 추론 모델 시리즈

Magistral은 투명한 다국어 및 도메인별 추론 기능에 중점을 둔 Mistral AI의 추론 모델입니다. 이 모델은 오픈 소스 버전(Magistral Small)과 엔터프라이즈 버전(Magistral Medium)으로 구성되어 있으며, 후자는 ...
9개월 전
040K