BAGEL - Open Source multimodales Basismodell von Wordpress
BAGEL ist ein multimodales Basismodell, das von ByteDance mit 14 Milliarden Parametern, von denen 7 Milliarden aktiv sind, zur Verfügung gestellt wird. Die Modellbasis und die Mixed Transformer Expert Architecture (MoT), die Merkmale auf Pixelebene und semantischer Ebene eines Bildes mit zwei unabhängigen Kodierern erfasst, unterstützen die effiziente Verarbeitung von Bildern, Texten, Videos und...
DeepSeek-R1 - KI-Inferenzmodell von DeepSeek, Leistung angepasst an OpenAI o1 Release
DeepSeek-R1 ist ein hochleistungsfähiges KI-Inferenzmodell, das von dem in Hangzhou ansässigen Unternehmen DeepSeek entwickelt wurde und mit der offiziellen Version o1 von OpenAI verglichen wird. Das Modell wird auf der Grundlage groß angelegter Reinforcement-Learning-Techniken nachtrainiert und benötigt nur eine sehr geringe Menge an gelabelten Daten, um in Mathematik, Code und natürlicher Sprache zu folgern...
Phantom Boat AI - Plattform zur Erstellung von KI-Kurzfilmen aus einer Hand, Stapelgenerierung verschiedener Arten von Videoinhalten
Phantom Boat AI ist eine leistungsstarke KI-Plattform zur Erstellung von Kurzfilmen aus einer Hand, die die effiziente Stapelgenerierung verschiedener Arten von Videoinhalten unterstützt, darunter Werbespots, Promos, Animationen und mehr. Die Plattform basiert auf Midjourney, Runway und anderen weltweit führenden KI-Modellen und bietet Kreativen eine breite Palette an Dienstleistungen vom...
Circuit Tracer - das Open-Source-Tool von Anthropic zur Visualisierung der inneren Funktionsweise eines Modells
Circuit Tracer ist ein Open-Source-Tool von Anthropic zur Untersuchung der internen Funktionsweise großer Sprachmodelle. Es basiert auf der Erzeugung von Attributionsgraphen (Attributionsgraphen), um die internen Schritte aufzuzeigen, die das Modell bei der Erzeugung einer bestimmten Ausgabe durchläuft...
Google AI Edge Gallery - Google lanciert AI-App zur Unterstützung von Mobiltelefonen mit AI-Modellen
Google AI Edge Gallery ist eine experimentelle KI-App von Google, mit der Nutzer Machine Learning (ML) und generative künstliche Intelligenz (GenAI) auf nativen Geräten erleben und nutzen können. Die App wird auf Android-Geräten unterstützt.
Data Agent - Eine neue Generation von Data Intelligence der Unternehmensklasse von Volcano Engine
Data Agent ist eine neue Generation von Data Intelligence für Unternehmen, die von Volcano Engine auf den Markt gebracht wurde und sich auf Datenanalyse und intelligentes Marketing konzentriert. Data Agent integriert strukturierte und unstrukturierte Daten innerhalb des Unternehmens und erstellt umfassende und detaillierte Forschungsberichte auf der Grundlage eingehender Recherchen und Analysen.
Keling 2.1 - KI-Videogenerierungsmodelle von Racer
KeLing 2.1 ist ein von Racer eingeführtes Modell zur Erzeugung von KI-Videos, das jetzt auf der KeLing-KI-Videoplattform verfügbar ist. Das Modell enthält drei Versionen: Standard, High-Quality und Master, die 720P, 1080P und Effekte auf Filmniveau bieten, um unterschiedliche kreative Bedürfnisse zu erfüllen. Die Standard-Version der Generation Geschwindigkeit, geeignet für die schnelle Produktion...
Kleine Lerche - Smart Creation Agent von Shear Image
Little Lark ist ein intelligenter Erstellungsagent von Shear Image, der auf KI-Technologie basiert, um die Grenzen der Inhaltserstellung neu zu definieren und die Erstellung einfacher, effizienter und interessanter zu machen. Little Lark unterstützt die schwellenlose Erstellung von Videos, digitalen Pop-up-Videos, Design-Zeichnungen und Bilder für Hintergründe, Benutzer müssen nur einen Befehl eingeben, KI-Unterstützung effizient abgeschlossen...
Drafting AI Community - KI-Plattform für die kreative Gestaltung von Inhalten, eine Vielzahl von Design-Ressourcen für unterschiedliche kreative Bedürfnisse
Drafting AI Community ist eine Online-Plattform für kreative KI-Inspiration, die den Nutzern eine Fülle von kreativen Design-Ressourcen und -Tools bietet. Die Plattform deckt eine Vielzahl von Designbereichen ab, darunter Bildfotos, E-Commerce-Design, Urlaubsthemen, 3D-Illustrationen, Avatar-Design, Xiaohongshu-Materialien, Porträtdesign usw., um den Bedürfnissen der verschiedenen Nutzer gerecht zu werden.
Ming-lite-omni - Vereinheitlichte multimodale Makromodelle - Open Source vom Ant 100 Team
Ming-Lite-Omni ist ein quelloffenes, vereinheitlichtes multimodales Big Model des Bailing Big Model Teams der Ant Group, das auf der effizienten Mixture of Experts (MoE)-Architektur aufbaut und die Verarbeitung von Text, Bildern, Audio und Video unterstützt...