AI 공유 서클

최신 AI 제품, 프로젝트, 프레임워크, 논문 해석 등을 매일 공유합니다.
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Amoy Group의 효율적인 VLA 모델

CombatVLA는 아모이 그룹의 퓨처 라이프 랩 팀이 개발한 혁신적인 3D 액션 롤플레잉 게임(ARPG) 전용 모델로, 3B 파라메트릭 스케일로 구축된 시각-언어-행동(VLA) 모델로, 모션 트래커를 통해 인간 플레이어의 동작을 수집합니다.
2개월 전
019.6K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - DeepSeek의 최신 오픈 소스 AI 모델

DeepSeek V3.1은 이전 버전인 V3를 기반으로 중요한 업그레이드가 이루어진 차세대 AI 모델로, 모델이 사고 모드와 비사고 모드 사이를 유연하게 전환할 수 있는 하이브리드 추론 아키텍처를 도입하여 사고 능력을 크게 향상시켰습니다.
2개월 전
021.2K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - 알리 통이 오픈 소스 이미지 편집 모델

Qwen-Image-Edit는 알리 통이가 소개한 다목적 이미지 편집 모델로, 200억 개의 매개변수가 있는 Qwen-Image 아키텍처를 기반으로 구축되었습니다. 이 모델은 시맨틱 및 외관 편집 기능을 모두 결합하여 이미지에 대한 낮은 수준의 시각적 외관 편집(예: 추가, 삭제...)을 수행할 수 있습니다.
2개월 전
021K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 쿤룬웨이의 최신 음성 생성 프레임워크

MoE-TTS는 사전 학습된 대규모 언어 모델(LLM)과 음성 전문가 모듈을 결합하는 혼합 전문가(MoE) 아키텍처를 기반으로 하는 쿤룬완웨이가 도입한 음성 합성 프레임워크로, 텍스트 모듈 파라미터는 고정하고 음성 모듈 파라미터만 업데이트하여 강력한 텍스트 추론 기능을 유지합니다...
2개월 전
022.7K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - Quintessence의 고급 AI 음악 제작 모델

Mureka V7.5는 중국 작곡에 중점을 둔 쿤룬 월드 와이드의 최첨단 AI 음악 생성 모델입니다. 이 모델은 음색과 연주 기법을 정확하게 재현하여 자연스럽고 부드럽고 감성적인 보컬을 생성합니다. 최적화된 자동 음성 인식(ASR) 기술을 기반으로 하는 Mureka V...
2개월 전
022.1K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

스카이워크 딥 리서치 에이전트 v2 - 쿤룬의 딥 리서치 인텔리전스 업그레이드 버전

스카이워크 딥 리서치 에이전트 V2는 쿤룬 웨이브가 출시한 딥 리서치 지능형 기관으로, 다중 모드 정보의 통합 및 분석에 중점을 두고 있으며, 스카이워크 딥 리서치 에이전트 V2는 텍스트, 그래프, ...
2개월 전
019.5K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

훈위안-게임크래프트 - 차세대 게임용 인터랙티브 비디오를 생성하기 위한 텐센트 훈위안의 오픈 소스 프레임워크입니다.

훈위안-게임크래프트는 텐센트 훈위안 팀의 오픈 소스 인터랙티브 게임 비디오 생성 프레임워크입니다. 단일 사진 및 프롬프트에서 프레임워크를 사용하여 매우 역동적인 게임 비디오를 생성하고, 키보드와 마우스를 통해 사용자가 비디오 콘텐츠를 실시간으로 제어할 수 있도록 지원합니다.
2개월 전
024.7K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - 쿤룬완웨이의 효율적인 오픈 소스 멀티 모달 모델링

스카이워크 유니픽 2.0은 이미지 생성, 편집, 이해에 초점을 맞춘 효율적인 멀티모달 모델로, 퀸테센스가 오픈소스로 제공합니다. 이 모델은 2B 매개변수 SD3.5-Medium 아키텍처를 기반으로 하며 사전 교육, 점진적인 이중 작업 강화 전략 및 공동 교육을 통해 실현됩니다....
2개월 전
022.6K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - 알리 다르마 연구소의 첫 오픈 소스 로보틱스 컨텍스트 프로토콜

RynnRCP는 알리 다르마 연구소의 오픈 소스 로봇 컨텍스트 프로토콜(RCP)로, 구현된 지능 개발의 문턱을 낮추고 전체 개발 과정을 개방합니다.RynnRCP는 RCP 프레임워크와 로봇모션 모듈로 구성되며, 기능 추상화와 다중 프로토콜 지원을 통해 RCP 프레임워크는...
2개월 전
023.1K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - 알리 다르마 연구소의 오픈 소스 세계 이해 모델

린넥은 알리바바 달마 연구소에서 도입한 세계 이해 모델로, 구체화된 지능 작업에 중점을 두고 있습니다. 이 모델은 비디오 데이터와 자연어를 결합한 멀티모달 융합 기술을 기반으로 하며, 장면의 객체를 여러 차원에서 파싱하여 객체 이해, 공간 인식, 비디오 대상 분할 등의 기능을 지원할 수 있습니다.
2개월 전
022.3K