Fish Audio - AI Sprachsynthese und Sound Cloning Tool
Fish Audio ist ein leistungsstarkes generatives KI-Sprachsynthesetool, das Text-to-Speech (TTS) und das Klonen von Stimmen unterstützt. Benutzer müssen nur Text eingeben, das Tool unterstützt die Umwandlung von natürlichen und glatten Stimme, die Plattform bietet eine Vielzahl von Sprachen und Sprachstile zur Auswahl, um verschiedene Szenarien und Benutzer zu erfüllen...
SignGemma - Gebärdensprachübersetzungsmodell von Google DeepMind
SignGemma ist das weltweit leistungsstärkste KI-Modell für Gebärdensprachdolmetscher von Google DeepMind, das die genaue Übersetzung der amerikanischen Gebärdensprache (ASL) in englischen Text unterstützt. Das Modell basiert auf multimodalem Training und kombiniert visuelle und textuelle Daten, um Gebärdensprachaktionen in Echtzeit zu erfassen und schnell in Text zu übersetzen...
FLUX.1 Kontext - Bilderzeugungs- und -bearbeitungsmodell aus dem Schwarzwald
FLUX.1 Kontext ist ein Modell zur Bilderzeugung und -bearbeitung von Black Forest Labs, das kontextabhängige Bildverarbeitungstechniken bietet. Das Modell versteht Reaktionen auf Text- und Bildhinweise, führt Aufgaben wie Objektmodifikation, Stilkonvertierung und Hintergrundersetzung durch und behält dabei die Eckpunkte des...
WebAgent - Ali Tongyi Open Source Autonomer Such-AI-Agent
WebAgent ist ein quelloffener, autonomer Such-AI-Agent von Alibaba Tongyi Labs mit leistungsstarker, autonomer End-to-End-Informationssuche und mehrstufigen Argumentationsfähigkeiten. WebAgent kann aktiv wahrnehmen, entscheiden und in der Netzwerkumgebung wie ein Mensch handeln und ist weit verbreitet in der akademischen Forschung, der Entscheidungsfindung in Unternehmen...
Lingcode IDE - Tongyi Lingcode bringt AI Native Development Environment Tools auf den Markt
Spirit Code IDE ist die KI-native integrierte Entwicklungsumgebung (IDE), die von Tongyi Spirit Code auf den Markt gebracht wurde. Sie ist tief an die 3 Hauptmodelle von Thousand Questions angepasst und verfügt über einen leistungsstarken intelligenten Programmiermodus, der die autonome Erledigung von Aufgaben wie Projektwahrnehmung, Codeabruf und Ausführung von Terminaloperationen unterstützt. Es unterstützt MCP-Tools und integriert Magic Hitch MCP Square's 3...
BAGEL - Open Source multimodales Basismodell von Wordpress
BAGEL ist ein multimodales Basismodell, das von ByteDance mit 14 Milliarden Parametern, von denen 7 Milliarden aktiv sind, zur Verfügung gestellt wird. Die Modellbasis und die Mixed Transformer Expert Architecture (MoT), die Merkmale auf Pixelebene und semantischer Ebene eines Bildes mit zwei unabhängigen Kodierern erfasst, unterstützen die effiziente Verarbeitung von Bildern, Texten, Videos und...
DeepSeek-R1 - KI-Inferenzmodell von DeepSeek, Leistung angepasst an OpenAI o1 Release
DeepSeek-R1 ist ein hochleistungsfähiges KI-Inferenzmodell, das von dem in Hangzhou ansässigen Unternehmen DeepSeek entwickelt wurde und mit der offiziellen Version o1 von OpenAI verglichen wird. Das Modell wird auf der Grundlage groß angelegter Reinforcement-Learning-Techniken nachtrainiert und benötigt nur eine sehr geringe Menge an gelabelten Daten, um in Mathematik, Code und natürlicher Sprache zu folgern...
Phantom Boat AI - Plattform zur Erstellung von KI-Kurzfilmen aus einer Hand, Stapelgenerierung verschiedener Arten von Videoinhalten
Phantom Boat AI ist eine leistungsstarke KI-Plattform zur Erstellung von Kurzfilmen aus einer Hand, die die effiziente Stapelgenerierung verschiedener Arten von Videoinhalten unterstützt, darunter Werbespots, Promos, Animationen und mehr. Die Plattform basiert auf Midjourney, Runway und anderen weltweit führenden KI-Modellen und bietet Kreativen eine breite Palette an Dienstleistungen vom...
Circuit Tracer - das Open-Source-Tool von Anthropic zur Visualisierung der inneren Funktionsweise eines Modells
Circuit Tracer ist ein Open-Source-Tool von Anthropic zur Untersuchung der internen Funktionsweise großer Sprachmodelle. Es basiert auf der Erzeugung von Attributionsgraphen (Attributionsgraphen), um die internen Schritte aufzuzeigen, die das Modell bei der Erzeugung einer bestimmten Ausgabe durchläuft...
Google AI Edge Gallery - Google lanciert AI-App zur Unterstützung von Mobiltelefonen mit AI-Modellen
Google AI Edge Gallery ist eine experimentelle KI-App von Google, mit der Nutzer Machine Learning (ML) und generative künstliche Intelligenz (GenAI) auf nativen Geräten erleben und nutzen können. Die App wird auf Android-Geräten unterstützt.