BAGEL - Modèle de base multimodale open source lancé par Wordpress
BAGEL est un modèle de base multimodal mis à disposition par ByteDance avec 14 milliards de paramètres, dont 7 milliards sont actifs. Le modèle de base et l'architecture experte de transformateur mixte (MoT), qui capture les caractéristiques au niveau du pixel et au niveau sémantique d'une image avec deux encodeurs indépendants respectivement, permettent un traitement efficace de l'image, du texte, de la vidéo...
DeepSeek-R1 - Modèle d'inférence IA de DeepSeek, performance alignée sur la version OpenAI o1
DeepSeek-R1 est un modèle d'inférence IA très performant lancé par DeepSeek, une société basée à Hangzhou, qui se compare à la version officielle o1 d'OpenAI. Le modèle est post-entraîné sur la base de techniques d'apprentissage par renforcement à grande échelle et ne nécessite qu'une très petite quantité de données étiquetées pour raisonner en mathématiques, en code et en langage naturel...
Phantom Boat AI - Plate-forme unique de création de courts métrages d'IA, génération par lots de divers types de contenu vidéo
Phantom Boat AI est une puissante plateforme de création de courts-métrages en IA qui prend en charge la génération efficace par lots de divers types de contenu vidéo, y compris les publicités, les promotions, les animations et plus encore. La plateforme est basée sur Midjourney, Runway et d'autres modèles d'IA de renommée mondiale, et offre aux créateurs une large gamme de services allant de l'écriture de...
Circuit Tracer - L'outil open source d'Anthropic pour visualiser le fonctionnement interne d'un modèle
Circuit Tracer est un outil open source d'Anthropic permettant d'étudier le fonctionnement interne de grands modèles de langage. Basé sur la génération de graphes d'attribution (attribution graphs) pour révéler les étapes internes que le modèle subit lors de la génération d'une sortie particulière ...
Google AI Edge Gallery - Google lance une application d'IA pour aider les téléphones portables à exécuter des modèles d'IA
Google AI Edge Gallery est une application expérimentale de Google qui permet aux utilisateurs d'expérimenter et d'utiliser des modèles d'apprentissage automatique (ML) et d'intelligence artificielle générative (GenAI) sur des appareils natifs. L'application est prise en charge sur les appareils Android.
Data Agent - Une nouvelle génération d'intelligence des données pour l'entreprise par Volcano Engine
Data Agent est une nouvelle génération d'intelligence des données d'entreprise lancée par Volcano Engine, qui se concentre sur l'analyse des données et le marketing intelligent. Data Agent intègre les données structurées et non structurées au sein de l'entreprise, et génère des rapports de recherche complets et approfondis basés sur une recherche et une analyse approfondies.
Keling 2.1 - Modèles de génération de vidéos par l'IA à partir de Shutterstock
KeLing 2.1 est un modèle de génération de vidéos d'IA lancé par Racer, qui est maintenant disponible sur la plateforme vidéo d'IA de KeLing. Le modèle comprend trois versions : standard, haute qualité et master, offrant des effets 720P, 1080P et de niveau film pour répondre aux différents besoins créatifs. La version standard de la vitesse de génération, adaptée à la production rapide...
Little Lark - Agent de création intelligent par Shear Image
Little Lark est un agent de création intelligent lancé par Shear Image, basé sur la technologie de l'IA pour redéfinir les limites de la création de contenu, rendant la création plus simple, plus efficace et plus intéressante. Little Lark prend en charge la création sans seuil de vidéos, de vidéos pop-up numériques, de dessins de conception et d'images d'arrière-plan. Les utilisateurs n'ont qu'à entrer une commande, et l'IA complète efficacement...
Drafting AI Community - Plateforme de conception de contenu créatif en IA, une variété de ressources de conception pour répondre aux différents besoins créatifs.
Drafting AI Community est une plateforme d'inspiration créative en ligne qui offre aux utilisateurs une multitude de ressources et d'outils de conception créative. La plateforme couvre une variété de domaines de conception, y compris les photos d'images, la conception de commerce électronique, les thèmes de vacances, les illustrations 3D, la conception d'avatars, les matériaux Xiaohongshu, la conception de portraits, etc., pour répondre aux besoins des différents utilisateurs.
Ming-lite-omni - Macromodèles multimodaux unifiés open source par l'équipe Ant 100
Ming-Lite-Omni est un grand modèle multimodal unifié open source de l'équipe Bailing Big Model d'Ant Group, construit sur l'architecture efficace Mixture of Experts (MoE).Ming-Lite-Omni prend en charge le traitement du texte, des images, de l'audio et de la...