Hugging Face stellt SmolVLM vor, ein kleines multimodales Modell, das auf Endgeräten laufen kann
SmolVLM ist ein kleines multimodales Modell mit 2 Milliarden Parametern, das beliebige Kombinationen von Bild- und Texteingaben akzeptieren und Textausgaben erzeugen kann. Nach der Einführung des leichten Sprachmodells SmolLM im Juli hat die KI-App-Entwicklungsplattform Hugging Face ...