Intern-S1-mini - 상하이 AI Lab의 경량 과학적 멀티모달 모델 오픈 소스
Intern-S1-mini는 상하이 인공 지능 연구소(SAL)에서 출시한 파라미터 스케일 8B의 경량 과학 멀티모달 매크로 모델로, Intern-S1의 강력한 기능을 계승하여 범용 및 전문 과학 기능을 모두 결합하여 신속한 배포 및 2차 개발에 적합합니다. 성능 측면에서, 나는 ...
나노 바나나 - Google의 AI 이미지 편집 모델
나노 바나나는 간단한 텍스트 프롬프트에 따라 기존 이미지를 고품질로 수정할 수 있도록 세밀하고 사실적인 이미지를 생성하는 Google의 AI 이미지 생성 및 편집 모델인 Gemini 2.5 플래시 이미지의 코드명입니다.
지니 인비저너 - 베이항 등이 참여하는 Jiyuan의 오픈 소스 범용 로봇 플랫폼
지니 인비저너(GE)는 지니 로보틱스 팀이 싱가포르 국립대학교, 베이징 항공 우주 대학교 및 기타 기관과 협력하여 개발한 로봇 운영을 위한 통합 플랫폼입니다. 로봇이 '먼저 상상한 다음 행동'함으로써 작업을 더 잘 이해하고 수행할 수 있도록 지원합니다.
DINOv3 - 메타 AI의 차세대 자체 감독 비전 기본 모델
DINOv3는 메타 AI의 차세대 자기 지도 비전 기반 모델로, 자기 지도 학습 패러다임을 사용하여 라벨링 데이터 없이 이미지 특징을 학습합니다. 데이터 준비를 개선하고 그램 앵커링을 도입하여 특징 저하 문제를 해결하고 일반화 성능을 향상시킵니다....
매트릭스 게임 2.0 - KunlunWanwei가 개발한 인터랙티브 월드 모델
Matrix-Game 2.0은 쿤룬 스카이워크 AI에서 자체 개발한 인터랙티브 월드 모델입니다. Matrix-Game 2.0은 범용 시나리오를 위한 업계 최초의 오픈 소스 실시간 롱 시퀀스 인터랙티브 생성 모델로, 멀티플레이어에서 25FPS로 실행할 수 있습니다.
바이촨-M2 - 바이촨 인텔리전스, 오픈 소스 의료 서비스 강화 빅 모델 출시
바이촨-M2는 바이촨 인텔리전스가 출시한 오픈소스 의료용 증강 매크로 모델입니다. 이 모델은 의료 분야에서 우수한 성능을 발휘하며, 특히 헬스벤치 리뷰에서 60.1점을 기록하여 OpenAI의 gpt-oss120b 및 기타 여러 오픈 소스 모델을 능가하는 글로벌 ...
Qwen-Flash - 통이 치엔콴의 고성능, 저비용 언어 모델
퀀플래시는 알리바바 통이 천문 시리즈에 도입된 고성능, 저비용 언어 모델로, 빠른 응답과 간단한 작업의 효율적인 처리를 위해 설계되었습니다. 고급 전문가 혼합(MoE) 아키텍처를 기반으로 희소 전문가 네트워크에 의해 실현됩니다....
SkyReels-A3 - 쿤룬왕웨이의 오디오 기반 디지털 휴먼 제작 도구
SkyReels-A3는 쿤룬 월드 와이드 그룹의 오디오 기반 디지털 휴먼 제작 툴입니다. SkyReels-A3는 오디오 기반 디지털 휴먼 제작 도구로, 간단한 입력(예: 인물 이미지 및 음성)을 통해 고품질의 동적 비디오 콘텐츠를 생성하고, 정적인 사진을 '생동감 있게' 만들고, 기존 비디오의 대사를 캐릭터가 자동으로 일치하는 새로운 립싱크로 대체할 수 있습니다....
미니맥스 스피치 2.5 - 미니맥스의 음성 생성 모델
미니막스 스피치 2.5는 미니막스 팀이 개발한 고급 음성 생성 모델입니다. 특히 다국어 표현력, 음색 재현 정확도 및 언어 범위 측면에서 음성 합성 분야의 중요한 발전입니다. 이 모델은 40개 언어를 지원합니다...
GPT-5 - 통합 인텔리전스 시스템인 OpenAI가 도입한 가장 강력한 언어 모델
GPT-5는 OpenAI가 여러 가지 업그레이드를 통해 출시한 최신 언어 모델입니다. 문제의 복잡성에 따라 효율적인 모드와 심층 사고 모드를 자동으로 전환하여 빠른 응답과 정확한 답변을 가능하게 하는 실시간 라우터가 내장된 통합 지능 시스템입니다.GPT-5에는 푸시용을 포함하여 여러 버전이 있습니다....