MiniCPM-V 4.5 - Modèle multimodal intelligent à facettes à source ouverte de 8B paramètres
MiniCPM-V 4.5 est un modèle multimodal paramétrique 8B open-source pour Facade Intelligence, construit sur la base de Qwen3-8B et SigLIP2-400M, avec la capacité de traiter efficacement les images et les vidéos. Il offre d'excellentes performances en matière de consommation de jetons visuels, de ...
Aivilization - une plateforme de simulation sociale multi-agents lancée par HKUST
Aivilization est la première plateforme de simulation sociale de corps multi-intelligents développée par l'Université des sciences et technologies de Hong Kong. Elle constitue un bac à sable numérique visuel où les utilisateurs peuvent créer et guider des milliers d'intelligences IA afin d'observer l'évolution sociale de la future coexistence entre l'homme et l'IA. La plateforme prend en charge...
Grok 2.5 - Le modèle d'IA open source xAI de Musk
Grok 2.5 est un modèle d'IA open source de l'entreprise xAI d'Elon Musk. Avec 269 milliards de paramètres, il est basé sur l'architecture Mixed Expertise (MoE) pour des performances et une inférence puissantes. Le modèle a été testé sur des connaissances scientifiques de haut niveau (GPQA), des connaissances générales (MMLU, MM...
Draw A Fish - Site gratuit de dessin de poissons AI en ligne, aquariums virtuels partagés
Draw A Fish est un site simple et amusant de dessin de poissons en ligne où les utilisateurs peuvent dessiner des poissons qui seront placés dans un aquarium virtuel partagé à l'échelle mondiale. Draw A Fish ne nécessite aucune inscription, est facile à utiliser et ne prend que quelques secondes pour créer et partager.
ToonComposer - Outil d'animation générative d'IA open source de Tencent
ToonComposer est un outil d'animation générative par IA lancé conjointement par l'Université chinoise de Hong Kong, Tencent PCG ARC Lab et l'Université de Pékin. Grâce à la technologie générative post keyframe, la génération d'images intermédiaires et le processus de coloration sont intégrés dans un processus automatisé, ne nécessitant qu'une esquisse et un...
Intern-S1-mini - Modèle scientifique multimodal léger mis à disposition par le Shanghai AI Lab
Intern-S1-mini est un macromodèle scientifique multimodal léger avec une échelle de paramètres de 8B lancé par le Shanghai Artificial Intelligence Laboratory (SAL). Il hérite des puissantes capacités d'Intern-S1, combinant à la fois des capacités scientifiques générales et spécialisées, et convient à un déploiement rapide et à un développement secondaire. En termes de performances, I...
Nano Banana - Modèle d'édition d'images par l'IA de Google
Nano Banana est le nom de code de Gemini 2.5 Flash Image, un modèle de génération et d'édition d'images par IA de Google qui génère des images détaillées et photoréalistes à partir de simples invites textuelles permettant d'apporter des modifications de haute qualité à des images existantes.
Genie Envisioner - Plate-forme robotique polyvalente à code source ouvert de Jiyuan, en collaboration avec Beihang et d'autres organismes
Genie Envisioner (GE) est une plateforme unifiée pour les opérations robotiques développée par l'équipe de Genie Robotics en collaboration avec l'Université nationale de Singapour, l'Université d'aéronautique et d'astronautique de Pékin et d'autres institutions. Elle permet aux robots de mieux comprendre et d'exécuter des tâches en "imaginant d'abord, puis en agissant".
DINOv3 - Modèle de base de vision auto-supervisée de nouvelle génération de Meta AI
DINOv3 est un modèle de base de vision auto-supervisée de nouvelle génération de Meta AI qui utilise un paradigme d'apprentissage auto-supervisé pour apprendre les caractéristiques des images sans données d'étiquetage. Il résout le problème de la dégradation des caractéristiques en améliorant la préparation des données et en introduisant l'ancrage Gram, et améliore la généralisation...
Matrix-Game 2.0 - Interactive World Model développé par KunlunWanwei
Matrix-Game 2.0 est un modèle de monde interactif développé par Kunlun SkyWork AI. Matrix-Game 2.0 est le premier modèle de génération interactive à longue séquence, en temps réel et à source ouverte, pour des scénarios à usage général. Il est capable de fonctionner à 25 FPS dans de multiples...