CWM - 메타 페어 오픈 소스 코드 월드 언어 모델
CWM(코드 월드 모델)은 메타 페어 팀이 공개한 320억 개의 파라미터를 가진 오픈 소스 월드 언어 모델로, 코드 생성 및 추론을 위해 설계되었습니다. 코드 실행 프로세스를 시뮬레이션하고 변수 상태 변화를 예측하고 미리 예측할 수 있는 '월드 모델'이라는 개념을 도입했습니다.
네오베이트 코드 - Ant 오픈소스의 지능형 프로그래밍 도우미
네오베이트 코드는 앤트그룹 알리페이 경험 기술 부서의 오픈소스 지능형 프로그래밍 도우미로, 인공지능 기술을 통해 개발 효율성을 향상시킵니다. 대화형 개발 기능을 통해 개발자는 자연어를 통해 요구 사항을 설명할 수 있으며, Neovate Code는 이를 이해하고 해당 세대를 생성할 수 있습니다.
Audio2Face - NVIDIA의 오픈 소스 AI 3D 얼굴 애니메이션 생성 모델
Audio2Face는 오디오 입력을 사실적인 3D 얼굴 애니메이션으로 변환할 수 있는 NVIDIA의 오픈 소스 AI 툴입니다. 음소 및 억양과 같은 오디오의 음성 특징을 분석하여 정밀한 립싱크와 미묘한 감정 표현을 생성하여 가상 캐릭터에 생생한 사람 표정을 부여합니다.
Qwen3-VL - 알리클라우드 통이 첸첸 오픈 소스 멀티모달 시각 언어 매크로 모델
Qwen3-VL은 알리클라우드 통이 첸첸 팀의 오픈소스 멀티모달 시각 언어 대형 모델로, 235억 개의 참조와 약 471GB의 모델 파일이 있으며, 인스트럭션 및 사고 버전을 포함하고, 향상된 MRope 인터리브 레이아웃, 딥스택 및 기타 기술을 채택하여 시각 변환을 효과적으로 사용할 수 있습니다 ...
Qwen3Guard - 알리 퀀 오픈 소스 보안 모델
Qwen3Guard는 보안 탐지를 위해 설계된 Qwen3 기본 모델을 기반으로 미세 조정된 보안 보호 모델입니다. 프롬프트 및 응답에 대한 정확한 보안 분류를 제공하고 위험 수준을 제공하며 영어, 중국어 및 다국어 환경을 지원합니다.Qwen3Guard는 두 가지 프로 버전으로 제공됩니다.
루시 편집 - 오픈 소스 AI 동영상 편집 도구, 자연어 설명 편집
루시 에디터는 Decart AI에서 개발한 오픈 소스 AI 동영상 편집 툴입니다. 사용자는 복잡한 미세 조정이나 마스크 사용 없이도 "캐릭터를 북극곰으로 바꿔" 또는 "장면을 2D 만화 스타일로 바꿔"와 같은 간단한 자연어 설명을 통해 동영상을 편집할 수 있습니다....
롱캣-플래시-씽킹 - 메이투안 오픈소스를 위한 효율적인 추론 모델
롱캣-플래시-씽킹은 미션 롱캣 팀이 출시한 효율적인 추론 모델로, 롱캣-플래시-챗의 빠른 속도를 유지하면서 더욱 강력하고 전문적으로 진화했습니다. 이 모델은 논리, 수학, 코드, 지능을 기반으로 합니다.
크로노스 - 칭화대와 마이크로소프트의 공동 오픈 소스 금융 K 차트 기본 모델
크로노스는 칭화대학교와 마이크로소프트 리서치 아시아가 공동으로 오픈소스화한 최초의 금융시장용 기본 K-선 차트 모델입니다. 주식, 암호화폐 및 기타 자산의 시초가, 고가, 저가, 종가, 거래량 등 K-선 데이터를 분석하여 향후 가격 변동을 예측할 수 있습니다.
Wan2.2-Animate - 통이 완샹 오픈 소스의 액션 생성을 위한 제너레이티브 모델
완2.2-애니메이트는 통이완샹의 오픈 소스 액션 생성 모델로, 액션 모방과 롤플레잉의 두 가지 모드를 지원합니다. 사용자는 캐릭터 사진과 참조 비디오 만 입력하면 모델이 비디오 캐릭터의 움직임과 표정을 그림 캐릭터로 마이그레이션하여 그림 캐릭터에 역동적 인 표현을 제공 할 수 있습니다 ...
InternVLA-A1 - 상하이 AI 랩, 대형 모델 구현을 위한 운영 기능의 오픈 소스 통합
InternVLA-A1은 상하이 인공 지능 연구소에서 오픈소스로 제공하는 대규모 구현 작업 모델입니다. 통합을 이해하고, 상상하고, 실행할 수 있는 능력을 갖추고 있으며, 작업을 정확하게 완료할 수 있습니다. 이 모델은 실제 및 시뮬레이션 운영 데이터를 융합하고 대규모 가상-실제 하이브리드 장면 에셋을 통해 대규모 멀티모달 구축을 자동화합니다.