AI-Austauschkreis

Täglicher Austausch über die neuesten KI-Produkte, Projekte, Frameworks, Interpretationen von Papieren usw.
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - Meeseeks - Open-Source-Bewertung der Fähigkeit, Modellanweisungen in einem Prüfungssatz zu befolgen

Meeseeks ist ein Open-Source-Bewertungsset für große Modelle, das vom M17-Team bei Meituan verwendet wird, um die Fähigkeit eines Modells zu bewerten, Anweisungen zu befolgen.Meeseeks verwendet einen dreistufigen Bewertungsrahmen, um umfassend zu messen, ob ein Modell in der Lage ist, Antworten in strikter Übereinstimmung mit den Anweisungen des Benutzers von der Makro- bis zur Mikroebene zu generieren, und bewertet nicht das Wissen über den Inhalt der Antwort als positiv...
vor 3 Tagen
06.3K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - das neueste KI-Sprachmodell von OpenAI

gpt-realtime ist ein fortschrittliches Sprachmodell von OpenAI, das direkte Audioverarbeitung unterstützt, um natürliche und flüssige Sprache zu erzeugen. Das Modell unterstützt mehrere Sprachen und Stile, versteht nonverbale Hinweise wie Lachen und kann zwischen Sprachen wechseln.
vor 4 Tagen
06.9K
Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent - Tencent Open-Source-Framework für effiziente intelligente Körper

Youtu-agent ist ein Open-Source-Framework zum Aufbau und Betrieb autonomer Intelligenzen von Tencent Youtu Labs. Das Framework schneidet in den WebWalkerQA- und GAIA-Benchmarks mit einer Genauigkeit von 71,47% bzw. 72,8% gut ab...
vor 4 Tagen
09K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley - Tencents Open-Source-Modell zur Erzeugung von Videotönen

HunyuanVideo-Foley ist ein Open-Source-Video-Sound-Generierungsmodell von Tencents Mixed-Yuan-Team, das das Hinzufügen von genau abgestimmten Soundeffekten zu stummen Videos unterstützt. Das Modell basiert auf einem groß angelegten Datensatz Ausbildung , mit einem multimodalen Diffusionskonverter Architektur , kombiniert mit der Darstellung der Ausrichtung Verlustfunktion und Audio VAE Optimierungstechniken ...
vor 4 Tagen
010K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - Selbstentwickeltes AI-Videomodell von Aishi Technologies

PixVerse V5 ist ein großes Modell der KI-Videogenerierung, das von Aishi Technology auf den Markt gebracht wurde. Das Modell kann qualitativ hochwertige Videoinhalte auf der Grundlage von vom Benutzer eingegebenen Textbeschreibungen oder Bildern generieren und unterstützt eine Vielzahl von Stilen, wie Anime, Sci-Fi und nationalen Stil.
vor 4 Tagen
09.6K
问小白5 - 问小白推出的全能AI模型

Ask White 5 - All-in-One AI Model von Ask White

Ask White 5 ist das Flaggschiff unter den "All in One"-Modellen mit einem sehr hohen Intelligenzgrad. Das Modell schneidet bei vielen Beurteilungen gut ab, wie z. B. bei der AA-Index-Kompositbeurteilung mit einem Wert von 64,7 und bei der Beurteilung der MINT-Fähigkeiten mit einem Wert von 86, der nahe an den weltweit führenden GPT-5 heranreicht.
vor 5 Tagen
09.1K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - Das leistungsfähigste Modell zur Bilderzeugung und -bearbeitung von Google

Gemini 2.5 Flash Image (Codename nano banana) ist ein hochmodernes Bilderzeugungs- und -bearbeitungsmodell von Google, das die Konsistenz von Zeichen in verschiedenen Szenen beibehält und eine präzise Bildbearbeitung durch natürliche Sprache unterstützt, z. B. das Verwischen von Hintergründen und Entfernen von Flecken.
vor 6 Tagen
010.8K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - Ali Tongyi Open-Source-Modell für die audiogestützte Videoerzeugung

Wan2.2-S2V ist ein Open-Source-multimodale Video-Generierung Modell von Ali Tongyi, nur ein statisches Bild und ein Stück Audio, kann hochwertige digitale menschliche Video zu erzeugen, und unterstützt eine Vielzahl von Bildtypen und Rahmen.
vor 6 Tagen
010.4K
吴恩达面向开发者的ChatGPT提示工程免费课程

Kostenloser Kurs über ChatGPT Tip Engineering für Entwickler von Ernest Ng

ChatGPT Tip Engineering for Developers ist ein gemeinsamer Kurs von DeepLearning.AI und OpenAI für Entwickler, in dem Isa Fulford und Andrew Ng zeigen, wie man Large Language Models (LLM) verwendet...
vor 6 Tagen
09.1K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Ein von Ask o4 eingeführtes paralleles Denkmodell, das 8 Denkwege gleichzeitig eröffnet

Ask White o4 ist ein innovatives paralleles Denkmodell, das acht Denkpfade gleichzeitig öffnet, das Problem aus mehreren Perspektiven analysiert und automatisch die optimale Lösung herausfiltert. Das Modell beinhaltet fortschrittliche Long-CoT-Verstärkungslern- und Prozessbelohnungs-Lerntechniken, verfügt über leistungsstarke Deep-Reasoning-Fähigkeiten und erbringt gute Leistungen bei komplexen Aufgaben.
vor 7 Tagen
09.8K