AI 공유 서클

최신 AI 제품, 프로젝트, 프레임워크, 논문 해석 등을 매일 공유합니다.

Mureka V7.5 - Quintessence의 고급 AI 음악 제작 모델

Mureka V7.5는 중국 작곡에 중점을 둔 쿤룬 월드 와이드의 최첨단 AI 음악 생성 모델입니다. 이 모델은 음색과 연주 기법을 정확하게 재현하여 자연스럽고 부드럽고 감성적인 보컬을 생성합니다. 최적화된 자동 음성 인식(ASR) 기술을 기반으로 하는 Mureka V...

최신 AI 리소스

12개월 전

062.5K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

스카이워크 딥 리서치 에이전트 v2 - 쿤룬의 딥 리서치 인텔리전스 업그레이드 버전

스카이워크 딥 리서치 에이전트 V2는 쿤룬 웨이브가 출시한 딥 리서치 지능형 기관으로, 다중 모드 정보의 통합 및 분석에 중점을 두고 있으며, 스카이워크 딥 리서치 에이전트 V2는 텍스트, 그래프, ...

최신 AI 리소스

12개월 전

060K

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

훈위안-게임크래프트 - 차세대 게임용 인터랙티브 비디오를 생성하기 위한 텐센트 훈위안의 오픈 소스 프레임워크입니다.

훈위안-게임크래프트는 텐센트 훈위안 팀의 오픈 소스 인터랙티브 게임 비디오 생성 프레임워크입니다. 단일 사진 및 프롬프트에서 프레임워크를 사용하여 매우 역동적인 게임 비디오를 생성하고, 키보드와 마우스를 통해 사용자가 비디오 콘텐츠를 실시간으로 제어할 수 있도록 지원합니다.

최신 AI 리소스

12개월 전

065.8K

Skywork UniPic 2.0 - 쿤룬완웨이의 효율적인 오픈 소스 멀티 모달 모델링

스카이워크 유니픽 2.0은 이미지 생성, 편집, 이해에 초점을 맞춘 효율적인 멀티모달 모델로, 퀸테센스가 오픈소스로 제공합니다. 이 모델은 2B 매개변수 SD3.5-Medium 아키텍처를 기반으로 하며 사전 교육, 점진적인 이중 작업 강화 전략 및 공동 교육을 통해 실현됩니다....

최신 AI 리소스

12개월 전

063.8K

RynnRCP - 알리 다르마 연구소의 첫 오픈 소스 로보틱스 컨텍스트 프로토콜

RynnRCP는 알리 다르마 연구소의 오픈 소스 로봇 컨텍스트 프로토콜(RCP)로, 구현된 지능 개발의 문턱을 낮추고 전체 개발 과정을 개방합니다.RynnRCP는 RCP 프레임워크와 로봇모션 모듈로 구성되며, 기능 추상화와 다중 프로토콜 지원을 통해 RCP 프레임워크는...

최신 AI 리소스

12개월 전

072.9K

RynnEC - 알리 다르마 연구소의 오픈 소스 세계 이해 모델

린넥은 알리바바 달마 연구소에서 도입한 세계 이해 모델로, 구체화된 지능 작업에 중점을 두고 있습니다. 이 모델은 비디오 데이터와 자연어를 결합한 멀티모달 융합 기술을 기반으로 하며, 장면의 객체를 여러 차원에서 파싱하여 객체 이해, 공간 인식, 비디오 대상 분할 등의 기능을 지원할 수 있습니다.

최신 AI 리소스

12개월 전

074.6K

Matrix-3D - 쿤룬 월드 와이드 오픈 소스 3D 월드 생성 프레임워크

Matrix-3D는 탐색 가능한 파노라마 3D 월드를 생성하는 데 중점을 둔 스카이워크 AI 팀의 오픈 소스 프레임워크입니다. 이 프레임워크는 파노라마 비디오 생성 및 3D 재구성 기술을 결합하여 단일 이미지 또는 텍스트 프롬프트에서 고품질의 전방향 탐색 가능한 3D 월드를 생성합니다....

최신 AI 리소스

12개월 전

071K

GLM-4.5V - 스마트 스펙트럼의 멀티모달 오픈 소스 시각적 추론 모델

GLM-4.5V는 스마트 스펙트럼에서 도입한 세계 최고의 오픈 소스 시각적 추론 모델로, 총 매개변수가 1,060억 개, 활성화된 매개변수가 120억 개에 달합니다. 이 모델은 강력한 시각적 이해 및 추론 기능을 갖춘 차세대 텍스트 기반 모델 GLM-4.5-Air를 기반으로 학습되어 이미지, 비디오, 동영상 등을 처리할 수 있습니다.

최신 AI 리소스

12개월 전

072.9K

Genie 3 - Google의 일반 세계 모델

Genie 3는 매우 역동적이고 일관된 가상 세계를 실시간으로 생성할 수 있는 Google DeepMind의 차세대 범용 세계 모델로, 물리 현상과 자연 생태계를 시뮬레이션하고 판타지 및 역사 시나리오를 생성할 수 있도록 지원합니다. 텍스트 프롬프트를 통해 사용자는 ...

최신 AI 리소스

12개월 전

062.7K

Claude Opus 4.1 - Anthropic의 가장 강력한 프로그래밍 모델

Claude Opus 4.1은 복잡한 작업을 효율적으로 처리할 수 있도록 설계된 Anthropic의 최신 대규모 언어 모델입니다. 이 모델은 프로그래밍 영역에서 탁월한 성능을 발휘하여 고품질 코드를 생성하고 최대 32k의 단일 출력을 지원하며 다양한 프로그래밍 스타일에 적응할 수 있습니다....

최신 AI 리소스

12개월 전

066.7K