AI-Austauschkreis

Täglicher Austausch über die neuesten KI-Produkte, Projekte, Frameworks, Interpretationen von Papieren usw.
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - AI Sprachsynthese und Sound Cloning Tool

Fish Audio ist ein leistungsstarkes generatives KI-Sprachsynthesetool, das Text-to-Speech (TTS) und das Klonen von Stimmen unterstützt. Benutzer müssen nur Text eingeben, das Tool unterstützt die Umwandlung von natürlichen und glatten Stimme, die Plattform bietet eine Vielzahl von Sprachen und Sprachstile zur Auswahl, um verschiedene Szenarien und Benutzer zu erfüllen...
vor 2 Monaten
02.8K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - Gebärdensprachübersetzungsmodell von Google DeepMind

SignGemma ist das weltweit leistungsstärkste KI-Modell für Gebärdensprachdolmetscher von Google DeepMind, das die genaue Übersetzung der amerikanischen Gebärdensprache (ASL) in englischen Text unterstützt. Das Modell basiert auf multimodalem Training und kombiniert visuelle und textuelle Daten, um Gebärdensprachaktionen in Echtzeit zu erfassen und schnell in Text zu übersetzen...
vor 2 Monaten
03.6K
FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - Bilderzeugungs- und -bearbeitungsmodell aus dem Schwarzwald

FLUX.1 Kontext ist ein Modell zur Bilderzeugung und -bearbeitung von Black Forest Labs, das kontextabhängige Bildverarbeitungstechniken bietet. Das Modell versteht Reaktionen auf Text- und Bildhinweise, führt Aufgaben wie Objektmodifikation, Stilkonvertierung und Hintergrundersetzung durch und behält dabei die Eckpunkte des...
vor 2 Monaten
03.2K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - Ali Tongyi Open Source Autonomer Such-AI-Agent

WebAgent ist ein quelloffener, autonomer Such-AI-Agent von Alibaba Tongyi Labs mit leistungsstarker, autonomer End-to-End-Informationssuche und mehrstufigen Argumentationsfähigkeiten. WebAgent kann aktiv wahrnehmen, entscheiden und in der Netzwerkumgebung wie ein Mensch handeln und ist weit verbreitet in der akademischen Forschung, der Entscheidungsfindung in Unternehmen...
vor 2 Monaten
03.1K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

Lingcode IDE - Tongyi Lingcode bringt AI Native Development Environment Tools auf den Markt

Spirit Code IDE ist die KI-native integrierte Entwicklungsumgebung (IDE), die von Tongyi Spirit Code auf den Markt gebracht wurde. Sie ist tief an die 3 Hauptmodelle von Thousand Questions angepasst und verfügt über einen leistungsstarken intelligenten Programmiermodus, der die autonome Erledigung von Aufgaben wie Projektwahrnehmung, Codeabruf und Ausführung von Terminaloperationen unterstützt. Es unterstützt MCP-Tools und integriert Magic Hitch MCP Square's 3...
vor 2 Monaten
02.9K
BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL - Open Source multimodales Basismodell von Wordpress

BAGEL ist ein multimodales Basismodell, das von ByteDance mit 14 Milliarden Parametern, von denen 7 Milliarden aktiv sind, zur Verfügung gestellt wird. Die Modellbasis und die Mixed Transformer Expert Architecture (MoT), die Merkmale auf Pixelebene und semantischer Ebene eines Bildes mit zwei unabhängigen Kodierern erfasst, unterstützen die effiziente Verarbeitung von Bildern, Texten, Videos und...
vor 2 Monaten
03K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - KI-Inferenzmodell von DeepSeek, Leistung angepasst an OpenAI o1 Release

DeepSeek-R1 ist ein hochleistungsfähiges KI-Inferenzmodell, das von dem in Hangzhou ansässigen Unternehmen DeepSeek entwickelt wurde und mit der offiziellen Version o1 von OpenAI verglichen wird. Das Modell wird auf der Grundlage groß angelegter Reinforcement-Learning-Techniken nachtrainiert und benötigt nur eine sehr geringe Menge an gelabelten Daten, um in Mathematik, Code und natürlicher Sprache zu folgern...
vor 2 Monaten
03.4K
幻舟AI - 一站式AI短片创作平台,批量生成各类型视频内容

Phantom Boat AI - Plattform zur Erstellung von KI-Kurzfilmen aus einer Hand, Stapelgenerierung verschiedener Arten von Videoinhalten

Phantom Boat AI ist eine leistungsstarke KI-Plattform zur Erstellung von Kurzfilmen aus einer Hand, die die effiziente Stapelgenerierung verschiedener Arten von Videoinhalten unterstützt, darunter Werbespots, Promos, Animationen und mehr. Die Plattform basiert auf Midjourney, Runway und anderen weltweit führenden KI-Modellen und bietet Kreativen eine breite Palette an Dienstleistungen vom...
vor 2 Monaten
02.5K
Circuit Tracer - Anthropic开源的模型内部工作机制可视化工具

Circuit Tracer - das Open-Source-Tool von Anthropic zur Visualisierung der inneren Funktionsweise eines Modells

Circuit Tracer ist ein Open-Source-Tool von Anthropic zur Untersuchung der internen Funktionsweise großer Sprachmodelle. Es basiert auf der Erzeugung von Attributionsgraphen (Attributionsgraphen), um die internen Schritte aufzuzeigen, die das Modell bei der Erzeugung einer bestimmten Ausgabe durchläuft...
vor 2 Monaten
03.3K
Google AI Edge Gallery - 谷歌推出的AI应用,支持手机运行AI模型

Google AI Edge Gallery - Google lanciert AI-App zur Unterstützung von Mobiltelefonen mit AI-Modellen

Google AI Edge Gallery ist eine experimentelle KI-App von Google, mit der Nutzer Machine Learning (ML) und generative künstliche Intelligenz (GenAI) auf nativen Geräten erleben und nutzen können. Die App wird auf Android-Geräten unterstützt.
vor 3 Monaten
03.3K