Hugging Face présente SmolVLM, un petit modèle multimodal qui peut fonctionner sur des appareils finaux
SmolVLM est un petit modèle multimodal avec 2 milliards de paramètres qui peut accepter n'importe quelle combinaison d'images et de textes en entrée et générer du texte en sortie. Après avoir lancé le modèle de langage léger SmolLM en juillet, la plateforme de développement d'applications d'IA Hugging Face ...