AI-Austauschkreis

Täglicher Austausch über die neuesten KI-Produkte, Projekte, Frameworks, Interpretationen von Papieren usw.

Schriftstücke216 Internetadresse14 Buch0 Hardware0 Kommentare0

Fish Audio - AI Sprachsynthese und Sound Cloning Tool

Fish Audio ist ein leistungsstarkes generatives KI-Sprachsynthesetool, das Text-to-Speech (TTS) und das Klonen von Stimmen unterstützt. Benutzer müssen nur Text eingeben, das Tool unterstützt die Umwandlung von natürlichen und glatten Stimme, die Plattform bietet eine Vielzahl von Sprachen und Sprachstile zur Auswahl, um verschiedene Szenarien und Benutzer zu erfüllen...

Neueste AI-Ressourcen

vor 2 Monaten

02.8K

SignGemma - Gebärdensprachübersetzungsmodell von Google DeepMind

SignGemma ist das weltweit leistungsstärkste KI-Modell für Gebärdensprachdolmetscher von Google DeepMind, das die genaue Übersetzung der amerikanischen Gebärdensprache (ASL) in englischen Text unterstützt. Das Modell basiert auf multimodalem Training und kombiniert visuelle und textuelle Daten, um Gebärdensprachaktionen in Echtzeit zu erfassen und schnell in Text zu übersetzen...

Neueste AI-Ressourcen

vor 2 Monaten

03.6K

FLUX.1 Kontext - Bilderzeugungs- und -bearbeitungsmodell aus dem Schwarzwald

FLUX.1 Kontext ist ein Modell zur Bilderzeugung und -bearbeitung von Black Forest Labs, das kontextabhängige Bildverarbeitungstechniken bietet. Das Modell versteht Reaktionen auf Text- und Bildhinweise, führt Aufgaben wie Objektmodifikation, Stilkonvertierung und Hintergrundersetzung durch und behält dabei die Eckpunkte des...

Neueste AI-Ressourcen

vor 2 Monaten

03.2K

WebAgent - Ali Tongyi Open Source Autonomer Such-AI-Agent

WebAgent ist ein quelloffener, autonomer Such-AI-Agent von Alibaba Tongyi Labs mit leistungsstarker, autonomer End-to-End-Informationssuche und mehrstufigen Argumentationsfähigkeiten. WebAgent kann aktiv wahrnehmen, entscheiden und in der Netzwerkumgebung wie ein Mensch handeln und ist weit verbreitet in der akademischen Forschung, der Entscheidungsfindung in Unternehmen...

Neueste AI-Ressourcen

vor 2 Monaten

03.1K

Lingcode IDE - Tongyi Lingcode bringt AI Native Development Environment Tools auf den Markt

Spirit Code IDE ist die KI-native integrierte Entwicklungsumgebung (IDE), die von Tongyi Spirit Code auf den Markt gebracht wurde. Sie ist tief an die 3 Hauptmodelle von Thousand Questions angepasst und verfügt über einen leistungsstarken intelligenten Programmiermodus, der die autonome Erledigung von Aufgaben wie Projektwahrnehmung, Codeabruf und Ausführung von Terminaloperationen unterstützt. Es unterstützt MCP-Tools und integriert Magic Hitch MCP Square's 3...

Neueste AI-Ressourcen

vor 2 Monaten

02.9K

BAGEL - Open Source multimodales Basismodell von Wordpress

BAGEL ist ein multimodales Basismodell, das von ByteDance mit 14 Milliarden Parametern, von denen 7 Milliarden aktiv sind, zur Verfügung gestellt wird. Die Modellbasis und die Mixed Transformer Expert Architecture (MoT), die Merkmale auf Pixelebene und semantischer Ebene eines Bildes mit zwei unabhängigen Kodierern erfasst, unterstützen die effiziente Verarbeitung von Bildern, Texten, Videos und...

Neueste AI-Ressourcen

vor 2 Monaten

03K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1 - KI-Inferenzmodell von DeepSeek, Leistung angepasst an OpenAI o1 Release

DeepSeek-R1 ist ein hochleistungsfähiges KI-Inferenzmodell, das von dem in Hangzhou ansässigen Unternehmen DeepSeek entwickelt wurde und mit der offiziellen Version o1 von OpenAI verglichen wird. Das Modell wird auf der Grundlage groß angelegter Reinforcement-Learning-Techniken nachtrainiert und benötigt nur eine sehr geringe Menge an gelabelten Daten, um in Mathematik, Code und natürlicher Sprache zu folgern...

Neueste AI-Ressourcen

vor 2 Monaten

03.4K

Phantom Boat AI - Plattform zur Erstellung von KI-Kurzfilmen aus einer Hand, Stapelgenerierung verschiedener Arten von Videoinhalten

Phantom Boat AI ist eine leistungsstarke KI-Plattform zur Erstellung von Kurzfilmen aus einer Hand, die die effiziente Stapelgenerierung verschiedener Arten von Videoinhalten unterstützt, darunter Werbespots, Promos, Animationen und mehr. Die Plattform basiert auf Midjourney, Runway und anderen weltweit führenden KI-Modellen und bietet Kreativen eine breite Palette an Dienstleistungen vom...

Neueste AI-Ressourcen

vor 2 Monaten

02.5K

Circuit Tracer - Anthropic开源的模型内部工作机制可视化工具

Circuit Tracer - das Open-Source-Tool von Anthropic zur Visualisierung der inneren Funktionsweise eines Modells

Circuit Tracer ist ein Open-Source-Tool von Anthropic zur Untersuchung der internen Funktionsweise großer Sprachmodelle. Es basiert auf der Erzeugung von Attributionsgraphen (Attributionsgraphen), um die internen Schritte aufzuzeigen, die das Modell bei der Erzeugung einer bestimmten Ausgabe durchläuft...

Neueste AI-Ressourcen

vor 2 Monaten

03.3K

Google AI Edge Gallery - 谷歌推出的AI应用，支持手机运行AI模型

Google AI Edge Gallery - Google lanciert AI-App zur Unterstützung von Mobiltelefonen mit AI-Modellen

Google AI Edge Gallery ist eine experimentelle KI-App von Google, mit der Nutzer Machine Learning (ML) und generative künstliche Intelligenz (GenAI) auf nativen Geräten erleben und nutzen können. Die App wird auf Android-Geräten unterstützt.

Neueste AI-Ressourcen

vor 3 Monaten

03.3K

Mehr laden