Neueste AI-Ressourcen

Insgesamt 2659 Artikel
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

meso- (Chemie)Meeseeks - Meeseeks - Open-Source-Bewertung der Fähigkeit, Modellanweisungen in einem Prüfungssatz zu befolgen

Meeseeks ist ein Open-Source-Bewertungsset für große Modelle, das vom M17-Team bei Meituan verwendet wird, um die Fähigkeit eines Modells zu bewerten, Anweisungen zu befolgen.Meeseeks verwendet einen dreistufigen Bewertungsrahmen, um umfassend zu messen, ob ein Modell in der Lage ist, Antworten in strikter Übereinstimmung mit den Anweisungen des Benutzers von der Makro- bis zur Mikroebene zu generieren, und bewertet nicht das Wissen über den Inhalt der Antwort als positiv...
vor 12 Stunden
01.2K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

meso- (Chemie)HunyuanVideo-Foley - Tencents Open-Source-Modell zur Erzeugung von Videotönen

HunyuanVideo-Foley ist ein Open-Source-Video-Sound-Generierungsmodell von Tencents Mixed-Yuan-Team, das das Hinzufügen von genau abgestimmten Soundeffekten zu stummen Videos unterstützt. Das Modell basiert auf einem groß angelegten Datensatz Ausbildung , mit einem multimodalen Diffusionskonverter Architektur , kombiniert mit der Darstellung der Ausrichtung Verlustfunktion und Audio VAE Optimierungstechniken ...
vor 2 Tagen
02.6K
问小白5 - 问小白推出的全能AI模型

meso- (Chemie)Ask White 5 - All-in-One AI Model von Ask White

Ask White 5 ist das Flaggschiff unter den "All in One"-Modellen mit einem sehr hohen Intelligenzgrad. Das Modell schneidet bei vielen Beurteilungen gut ab, wie z. B. bei der AA-Index-Kompositbeurteilung mit einem Wert von 64,7 und bei der Beurteilung der MINT-Fähigkeiten mit einem Wert von 86, der nahe an den weltweit führenden GPT-5 heranreicht.
vor 2 Tagen
03.4K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Ein von Ask o4 eingeführtes paralleles Denkmodell, das 8 Denkwege gleichzeitig eröffnet

Ask White o4 ist ein innovatives paralleles Denkmodell, das acht Denkpfade gleichzeitig öffnet, das Problem aus mehreren Perspektiven analysiert und automatisch die optimale Lösung herausfiltert. Das Modell beinhaltet fortschrittliche Long-CoT-Verstärkungslern- und Prozessbelohnungs-Lerntechniken, verfügt über leistungsstarke Deep-Reasoning-Fähigkeiten und erbringt gute Leistungen bei komplexen Aufgaben.
vor 4 Tagen
07.2K
VibeVoice - 微软推出的文本到语音模型

VibeVoice - Text-to-Speech-Modellierung von Microsoft

VibeVoice ist ein neues Text-to-Speech-Modell (TTS) von Microsoft. Das Modell erzeugt Konversations-Audio von bis zu vier verschiedenen Sprechern und unterstützt bis zu 90 Minuten ununterbrochene Sprachausgabe, wodurch die Längenbeschränkungen herkömmlicher TTS-Systeme aufgehoben werden.
vor 4 Tagen
07.1K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Open Source 3D-Szenengenerierungsmodelle von Qunar Technologies

SpatialGen ist ein quelloffenes 3D-Szenengenerierungsmodell von Qunar Technology, das auf der Architektur des Diffusionsmodells basiert. Es unterstützt die Generierung von räumlich-zeitlich konsistenten Multiview-Bildern auf der Grundlage von Textbeschreibungen, Referenzbildern und räumlichem 3D-Layout sowie die weitere Generierung von 3D-Gauß-Szenen und das Rendern von Roaming-Videos.
vor 4 Tagen
06.2K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - Eine neue Generation von Spracherkennungsmodellen, die gemeinsam von Nail und Tongyi entwickelt wurde

Fun-ASR ist ein großes Spracherkennungsmodell, das gemeinsam von Nail und Tongyi Labs entwickelt wurde. Das Modell wurde mit umfangreichen Audiodaten trainiert und kann branchenübergreifende Begriffe wie Internet, Technologie, Heimdekoration usw. genau identifizieren, was die Erkennungsgenauigkeit erheblich verbessert. Das Modell wird mit Nail-Unternehmensinformationen zur Inferenzoptimierung kombiniert, um das Problem der Phantomsprache zu reduzieren.
vor 5 Tagen
08.4K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - KI-Plattform zur Unterstützung des Schreibens von Romanen, die den gesamten Prozess von der Idee bis zur Erstellung vorantreibt

Squibler ist eine leistungsstarke, KI-gestützte Schreibplattform für Schriftsteller, die den Nutzern beim gesamten Prozess von der Konzeption über die Erstellung bis zur Veröffentlichung hilft. Die Plattform bietet eine Vielzahl von Story-Vorlagen für Romane, Drehbücher, Kurzgeschichten usw. Die Benutzer müssen nur das anfängliche Konzept eingeben, und die KI kann Umrisse, Charaktere, Szenen usw. erstellen.
vor 5 Tagen
07.7K
91写作 - 开源的AI智能小说创作平台

91Writing - Open Source KI-Plattform für intelligente Romanerstellung

91Writing ist ein vollständig quelloffenes Tool zur Erstellung von KI-Romanen, das auf der Grundlage von Vue 3 und Element Plus entwickelt wurde und eine Vielzahl von fortschrittlichen KI-Modellen wie GPT, Claude, Gemini usw. integriert. Das Tool bietet Schöpfern eine komplette Erstellungskette von der Idee bis zum Text, einschließlich der Projekterstellung...
vor 5 Tagen
07.2K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - eine von der HKUST ins Leben gerufene Multi-Agenten-Simulationsplattform

Aivilization ist die weltweit erste KI-Multi-Intelligenz-Plattform für soziale Simulationen, die von der Hong Kong University of Science and Technology entwickelt wurde. Sie bildet einen visuellen digitalen Sandkasten, in dem Nutzer Tausende von KI-Intelligenzen erstellen und steuern können, um die soziale Entwicklung der zukünftigen Koexistenz von Mensch und KI zu beobachten. Die Plattform unterstützt...
vor 5 Tagen
010.2K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - Musks Open-Source-KI-Modell xAI

Grok 2.5 ist ein Open-Source-KI-Modell von Elon Musk's xAI. Mit 269 Milliarden Parametern basiert es auf der Mixed Expertise (MoE)-Architektur für leistungsstarke Leistung und Inferenz. Das Modell wurde für wissenschaftliches Wissen auf Hochschulniveau (GPQA), allgemeines Wissen (MMLU, MM...
vor 5 Tagen
08.6K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - Open Source AI Video Slicing Tool zur Erstellung thematischer Videosammlungen mit einem Klick!

AutoClip ist Open-Source-KI-Video-Editing-Tool, basierend auf fortschrittlicher KI-Technologie, um den gesamten Prozess der automatisierten Videoverarbeitung zu erreichen. Tools können automatisch die Highlights des Videos, genaue Extraktion von wertvollen Inhalten zu identifizieren, kann auf der Grundlage der Ähnlichkeit des Themas der intelligenten Clustering, um eine Sammlung von Inhalten zu generieren.AutoClip Unterstützung...
vor 1 Woche
010K
ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - Tencents quelloffenes generatives KI-Animationstool

ToonComposer ist ein generatives KI-Animationstool, das gemeinsam von der Chinesischen Universität Hongkong, Tencent PCG ARC Lab und der Universität Peking entwickelt wurde. Durch die generative Post-Keyframe-Technologie wird die Erzeugung von Zwischenbildern und die Farbgebung in einen automatisierten Prozess integriert, der nur eine Skizze und eine...
vor 1 Woche
010.4K
Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Ein neues KI-Modell, das vom Wordpress-Team zur Verfügung gestellt wird

Seed-OSS ist eine Familie von großen Sprachmodellen, die vom Byte Jump Seed Team entwickelt wurden und sich auf lange Texte und schlussfolgernde Aufgaben konzentrieren. Das Modell erbringt gute Leistungen bei komplexen logischen Schlussfolgerungen und mehrstufigen Schlussfolgerungen mit hoher Genauigkeit und kann schwierige Probleme effizient lösen.Seed-OSS unterstützt lange Textkontexte bis zu 512K...
vor 1 Woche
010.1K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Leichtgewichtiges wissenschaftliches multimodales Modell, das vom Shanghai AI Lab zur Verfügung gestellt wird

Intern-S1-mini ist ein leichtgewichtiges wissenschaftliches multimodales Makromodell mit einer Parameterskala von 8B, das vom Shanghai Artificial Intelligence Laboratory (SAL) entwickelt wurde und die leistungsstarken Fähigkeiten von Intern-S1 erbt, indem es sowohl allgemeine als auch spezielle wissenschaftliche Fähigkeiten kombiniert. In Bezug auf die Leistung ist das I...
vor 1 Woche
09.9K
Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - KI-Bildbearbeitungsmodell von Google

Nano Banana ist der Gemini 2.5 Flash Image Codename für Gemini, ein KI-Bildgenerierungs- und -bearbeitungsmodell von Google, das detaillierte, fotorealistische Bilder auf der Grundlage einfacher Texteingaben erzeugt, um hochwertige Änderungen an bestehenden Bildern vorzunehmen.
vor 3 Tagen
018K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Das effiziente VLA-Modell der Amoy-Gruppe

CombatVLA ist ein innovatives 3D-Action-Rollenspiel (ARPG) spezifisches Modell des Future Life Lab Teams der Amoy Group.CombatVLA ist ein Vision-Linguistic-Action (VLA) Modell, das auf einer 3B parametrischen Skala aufgebaut ist und die Bewegungen des menschlichen Spielers mittels Motion Tracker erfasst...
vor 1 Woche
09.9K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - Das neueste Open-Source-KI-Modell von DeepSeek

DeepSeek V3.1 ist eine neue Generation von KI-Modellen, die von DeepSeek eingeführt wurde, mit wichtigen Verbesserungen gegenüber dem Vorgänger V3. DeepSeek V3.1 führt eine hybride Denkarchitektur ein, die es dem Modell erlaubt, flexibel zwischen denkenden und nicht denkenden Modi zu wechseln, was die Denkleistung...
vor 1 Woche
010.2K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi Open-Source-Bildbearbeitungsmodell

Qwen-Image-Edit ist ein von Ali Tongyi eingeführtes Allzweck-Bildbearbeitungsmodell, das auf der Qwen-Image-Architektur mit 20 Milliarden Parametern aufbaut. Das Modell kombiniert sowohl semantische als auch Erscheinungsbild-Bearbeitungsfähigkeiten und kann visuelle Erscheinungsbild-Bearbeitung auf niedriger Ebene an Bildern durchführen (z.B. Hinzufügen, Löschen...
vor 2 Wochen
09.9K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - Das neueste Framework zur Spracherzeugung von KunlunWei

MoE-TTS ist ein von Kunlun-Wanwei eingeführtes Sprachsynthese-Framework, das auf der Mixed Expert (MoE)-Architektur basiert, die vortrainierte Large Language Models (LLMs) mit Sprachexpertenmodulen kombiniert.MoE-TTS behält die leistungsstarke textuelle Argumentation bei, indem es die textuellen Modulparameter einfriert und nur die Sprachmodulparameter aktualisiert...
vor 2 Wochen
012.4K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuans Open-Source-Allzweck-Robotikplattform mit Beihang und anderen

Genie Envisioner (GE) ist eine einheitliche Plattform für Roboteroperationen, die vom Genie Robotics Team in Zusammenarbeit mit der National University of Singapore, der Beijing University of Aeronautics and Astronautics und anderen Institutionen entwickelt wurde. Sie ermöglicht es Robotern, Aufgaben besser zu verstehen und auszuführen, indem sie sich erst etwas vorstellen und dann handeln".
vor 2 Wochen
011.9K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - Das Open-Source-Weltverstehensmodell des Ali-Dharma-Instituts

RynnEC ist ein Modell zum Verständnis der Welt, das vom Alibaba Dharma Institute eingeführt wurde und sich auf Aufgaben der verkörperten Intelligenz konzentriert. Das Modell basiert auf einer multimodalen Fusionstechnologie, die Videodaten und natürliche Sprache kombiniert. Es kann Objekte in einer Szene aus mehreren Dimensionen analysieren und unterstützt Funktionen wie Objektverständnis, räumliche Wahrnehmung und Videozielsegmentierung.
vor 2 Wochen
013K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Multimodales Open-Source-Modell für visuelles Reasoning von Smart Spectrum

GLM-4.5V ist das weltweit führende Open-Source-Modell für visuelle Schlussfolgerungen, das von Smart Spectrum eingeführt wurde, mit 106 Milliarden Gesamtparametern und 12 Milliarden aktivierten Parametern. Das Modell wurde auf der Grundlage der neuen Generation des Textbasismodells GLM-4.5-Air trainiert und verfügt über leistungsstarke visuelle Verstehens- und Schlussfolgerungsfähigkeiten, die in der Lage sind, Bilder, Videos...
vor 3 Wochen
012.6K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - Audio-gesteuertes Werkzeug zur Erstellung digitaler Menschen von Quintessence

SkyReels-A3 ist ein audiogestütztes Werkzeug zur Erstellung digitaler Menschen von der Kunlun World Wide Group. SkyReels-A3 ist ein audiogesteuertes Werkzeug zur Erstellung digitaler Menschen, das durch einfache Eingaben (z. B. Porträtbilder und Stimme) hochwertige dynamische Videoinhalte generieren, statische Fotos "zum Leben erwecken" und Zeilen für bestehende Videos durch neue Lippensynchronisationen ersetzen kann, die die Charaktere automatisch anpassen...
vor 3 Wochen
09.3K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - Spracherzeugungsmodell von MiniMax

MiniMax Speech 2.5 ist ein fortschrittliches Spracherzeugungsmodell, das vom MiniMax-Team entwickelt wurde. Es ist ein bedeutender Fortschritt auf dem Gebiet der Sprachsynthese, insbesondere in Bezug auf die mehrsprachige Ausdruckskraft, die Genauigkeit der Klangfarbenwiedergabe und die Sprachabdeckung. Das Modell unterstützt 40 Sprachen...
vor 3 Wochen
012.8K
GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5 - Das stärkste Sprachmodell, vorgestellt von OpenAI, Unified Intelligence System

GPT-5 ist das neueste Sprachmodell, das von OpenAI mit mehreren Upgrades veröffentlicht wurde. Es ist ein einheitliches Intelligenzsystem mit einem eingebauten Echtzeit-Router, der je nach Komplexität des Problems automatisch zwischen effizientem und tiefem Denkmodus umschaltet und so eine schnelle Reaktion und genaue Antworten ermöglicht.GPT-5 hat mehrere Versionen, u.a. für...
vor 3 Wochen
010K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - Das universelle Weltmodell von Google

Genie 3 ist eine neue Generation von universellen Weltmodellen von Google DeepMind, die es ermöglichen, hochdynamische und kohärente virtuelle Welten in Echtzeit zu erzeugen. Genie 3 simuliert physikalische Phänomene, natürliche Ökosysteme und unterstützt die Erstellung von Fantasie- und historischen Szenarien. Mit Textaufforderungen können Benutzer...
vor 3 Wochen
010.3K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Das leistungsfähigste Programmiermodell von Anthropic

Claude Opus 4.1 ist ein hochmodernes, umfangreiches Sprachmodell von Anthropic, das für die effiziente Verarbeitung komplexer Aufgaben entwickelt wurde. Das Modell zeichnet sich im Bereich der Programmierung durch die Erzeugung von qualitativ hochwertigem Code aus, unterstützt bis zu 32k Einzelausgaben und passt sich an eine Vielzahl von Programmierstilen an...
vor 3 Wochen
010.3K
RedOne - 小红书最新推出的社交大模型

RedOne - das neueste soziale Megamodell von Little Red Book

RedOne ist ein großes, auf soziale Netzwerke zugeschnittenes Sprachmodell, das von Little Red Book eingeführt wurde. Das Modell wird durch eine dreistufige Trainingsstrategie trainiert, die soziales und kulturelles Wissen einbezieht, Multitasking-Fähigkeiten stärkt und menschliche Präferenzen abgleicht.RedOne übertrifft das Basismodell deutlich in der Leistung bei sozialen Aufgaben, bei der Erkennung schädlicher Inhalte und beim Browsen...
vor 4 Wochen
010.2K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - 3D Gaussian Semantic Dataset von Qunar Technology

InteriorGS ist ein hochwertiger semantischer 3D-Gauß-Datensatz, der von Qunar Technology eingeführt wurde. Der Datensatz enthält 1.000 3D-Szenen, die mehr als 80 Innenräume abdecken, wie z. B. Wohnungen, Geschäfte, Hochzeitssäle und Museen. Der Datensatz enthält mehr als 554.000 Objektinstanzen in 755 Kategorien...
vor 4 Wochen
08.4K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Null-Sample-Sprachsynthesemodelle von Microsoft

DragonV2.1 ist ein fortschrittliches Text-to-Speech (TTS)-Modell von Microsoft, das ohne Abtastung arbeitet. Das auf der Transformer-Architektur basierende Modell unterstützt mehrere Sprachen und das Klonen von Null-Sample-Sprache und erzeugt natürliche, ausdrucksstarke Sprache mit nur 5-90 Sekunden Sprachaufforderung.
vor 4 Wochen
09.6K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - Open Source UI Screenshot Generation Front-End Code Tool

ScreenCoder ist ein intelligentes Open-Source-Tool, das UI-Design-Screenshots schnell in hochwertigen HTML/CSS-Code umwandeln kann. Das Tool basiert auf einer modularen Multi-Intelligenz-Architektur, kombiniert mit visuellem Verständnis, Layout-Planung und Code-Synthese-Techniken, um die Erzeugung von hochpräzisen und semantischen Front-Ends zu unterstützen...
vor 4 Wochen
010.1K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - KI-Inferenzmodell von Google

Gemini 2.5 Deep Think ist ein KI-Modell von Google, das für die Lösung komplexer Aufgaben entwickelt wurde. Es ist eine Variante des Modells, das bei der Internationalen Mathematik-Olympiade (IMO) 2025 die Goldmedaille gewonnen hat, und wurde entwickelt, um komplexe Aufgaben durch parallele ...
vor 4 Wochen
07.8K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - Open Source Reasoning Big Model von KunlunWei

MindLink ist ein großes Modell der Open-Source-Reasoning von Kunlun World Wide Web ins Leben gerufen. Mit adaptiven Reasoning-Mechanismus, nach der Komplexität der Aufgabe kann flexibel geschaltet werden Inferenz-Modus, einfache Aufgaben schnell erzeugt, komplexe Aufgaben in der Tiefe Argumentation, unter Berücksichtigung der Effizienz und Genauigkeit. Plan-driven Argumentation Paradigma zu entfernen, die "denken" Tag, reduzieren ...
vor 4 Wochen
08.9K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - Ein neues großes Modell für die Bildwiederherstellung, vorgestellt von einem Team der Chinesischen Akademie der Wissenschaften

HYPIR ist ein umfangreiches Modell für die Bildwiederherstellung, das vom Team von Dong Chao am Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, entwickelt wurde. Das Modell kombiniert die fraktionierte Priorität des Diffusionsmodells mit einem generativen adversen Netzwerk, um eine effiziente und qualitativ hochwertige Bildrestaurierung zu erreichen.HYPIR kann alte Fotos schnell wiederherstellen und die Auflösung verbessern, während der Text klar bleibt...
vor 4 Wochen
011.4K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - ein Open-Source-Hochleistungsprogrammiermodell von Ali Tongyi

Qwen3-Coder-Flash ist ein hochleistungsfähiges Programmiermodell, das von Ali Tongyi Thousand Questions Team eingeführt wurde. Es verfügt über ausgezeichnete Fähigkeiten zur agentenbasierten Programmierung und zum Aufrufen von Werkzeugen und ist gut geeignet, komplexe Programmieraufgaben zu bewältigen. Das Modell unterstützt 256K Token für langes kontextuelles Verständnis und kann auf 1M skaliert werden ...
vor 4 Wochen
09.5K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - das neueste Diffusions-Sprachmodell von ByteHopper

Seed Diffusion ist ein experimentelles Diffusions-Sprachmodell, das von ByteHop eingeführt wurde und Aufgaben der Codegenerierung übernimmt. Das Modell basiert auf Techniken wie zweistufigem Diffusionstraining, eingeschränktem sequentiellem Lernen und verbesserter effizienter paralleler Dekodierung, was die Inferenzgeschwindigkeit auf 2.146 Token/s deutlich verbessert, was schneller ist als...
vor 4 Wochen
010.1K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - AI-Business-Assistent von Alis 1688-Plattform

1688 AI Version ist eine intelligente Business-Assistent-Anwendung, die von der 1688-Plattform von Alibaba eingeführt wurde und für kleine B-Käufer und -Händler konzipiert ist. Basierend auf den massiven Daten der 1688 Plattform, bietet die Anwendung Geschäftsmöglichkeiten Push, Produktempfehlung, Ideengenerierung, Unternehmensabfrage und andere Funktionen, um Benutzer genau zu erfassen die Marktdynamik, schnell...
vor 4 Wochen
08.4K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

Steps Deep Research - AI Deep Research Tool von Steps Star

Step Deep Research ist ein effizientes KI-Recherchetool von Step Star, das in der Lage ist, selbstständig komplexe Sachverhalte zu recherchieren und in kurzer Zeit professionelle Berichte zu erstellen. Das Tool wurde für die Bereiche Finanzen, Beratung, Gesundheitswesen, Recht und andere Bereiche entwickelt und hat sich in Branchenrezensionen durch seine tiefgreifenden Such- und Informationsintegrationsfunktionen hervorgetan.
vor 4 Wochen
08.5K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - Neues AI-Videobearbeitungsmodell von Runway

Runway Aleph ist ein fortschrittliches KI-Videobearbeitungsmodell, das von Runway auf den Markt gebracht wurde. Es basiert auf einfachen Textbefehlen zum schnellen Hinzufügen und Löschen von Videoinhalten, zur Änderung des Stils, zur Anpassung der Umgebung und zur Optimierung der Kamerabewegung. Benutzer können leicht überflüssige Elemente entfernen, Szenen ohne komplexe Operationen ändern...
vor 1 Monat
09.8K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Ali Tongyi Open-Source-KI-Trainingsdaten-Synthese-System

WebShaper ist ein System zur Synthese von KI-Trainingsdaten, das vom Tongyi Lab von Alibaba entwickelt wurde. Es erzeugt qualitativ hochwertige und skalierbare Trainingsdaten auf der Grundlage von formalen Modellierungs- und Intelligenzerweiterungsmechanismen, die KI-Intelligenzen dabei helfen, ihre komplexen Informationsbeschaffungsfähigkeiten zu verbessern. Das System führt das Konzept der "Wissensprojektion" ein...
vor 1 Monat
09.8K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - Open-Source-KI-Videogenerierungsmodell von Ali

Tongyi Wanphase Wan2.2 ist ein fortschrittliches KI-Modell zur Videogenerierung, das von Alibaba mit insgesamt 27 Milliarden Referenzen freigegeben wurde. Das Modell enthält drei Modi: textgeneriertes Video, graphgeneriertes Video und einheitliche Videogenerierung, die qualitativ hochwertige Videos auf der Grundlage von Textbeschreibungen, Bildern oder einer Kombination aus beidem generieren können.
vor 1 Monat
011.8K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - Byte Coze Open Source AI Agent Entwicklungs- und Debugging-Plattform

Coze Loop ist die Open-Source-KI-Intelligenz-Entwicklungs-, Betriebs- und Wartungsmanagement-Plattform der Coze-Plattform von ByteDance. Die Plattform bietet Entwicklern ein komplettes Lebenszyklusmanagement von der Entwicklung über die Fehlersuche bis hin zur Bewertung und Überwachung, einschließlich Cue-Word-Engineering, Bewertung des Agenteneffekts, Leistungsüberwachung und -optimierung...
vor 1 Monat
010.8K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - die neueste Body Intelligence Plattform von Shangtang Technology

Wuneng ist eine Plattform für verkörperte Intelligenz, die für Roboter und intelligente Geräte entwickelt wurde. Basierend auf dem "Enlightened"-Weltmodell und der multimodalen Big-Model-Technologie integriert Wuneng Multi-Sensor-Eingaben wie Sehen, Sprache, Berührung usw. und verfügt über leistungsstarke Wahrnehmungs-, Entscheidungs- und Handlungsfähigkeiten.
vor 1 Monat
09.7K
Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - Quelloffene wissenschaftliche multimodale Makromodelle vom Shanghai AI Lab

Intern-S1 ist ein wissenschaftliches multimodales Großmodell, das vom Shanghai Artificial Intelligence Laboratory entwickelt wurde. Das Modell integriert linguistische und multimodale Fähigkeiten und verfügt über leistungsstarke Funktionen wie crossmodales wissenschaftliches Parsing, linguistische und visuelle Fusion, wissenschaftliche Datenverarbeitung, Beantwortung wissenschaftlicher Fragen, Versuchsplanung und Optimierung.
vor 1 Monat
010K
MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - Open Source KI-Programmierassistent für Unternehmen

MonkeyCode ist ein quelloffener, unternehmenstauglicher, nativer KI-Programmierassistent, der für datenschutz- und sicherheitsbewusste Entwicklungsteams entwickelt wurde. MonkeyCode unterstützt die private Bereitstellung und Offline-Nutzung, um die Sicherheit von Codedaten zu gewährleisten. MonkeyCode unterstützt die private Bereitstellung und die Offline-Nutzung, um die Sicherheit der Codedaten zu gewährleisten...
vor 1 Monat
09.9K
Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - Ein Simultandolmetschermodell von ByteHop!

Seed LiveInterpret 2.0 ist ein hochmodernes Simultandolmetschermodell, das vom Seed-Team von ByteDance auf den Markt gebracht wurde und Zwei-Wege-Übersetzungen zwischen Chinesisch und Englisch unterstützt. Das Modell verfügt über eine realitätsnahe Übersetzungsgenauigkeit und eine extrem niedrige Latenz, mit einer durchschnittlichen Sprache-zu-Sprache-Verzögerung von nur 2 bis 3 Sekunden, die viel niedriger ist als die von...
vor 1 Monat
07.9K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - Open-Source-KI-Werkzeug zur Workflow-Automatisierung

ChatFlow ist ein Open-Source-KI-Workflow-Automatisierungswerkzeug, das die Umwandlung komplexer Anforderungen in effiziente Workflows unterstützt. Werkzeuge, die auf KI-Technologie basieren, helfen Nutzern, schnell Code-Frameworks und Testfälle zu generieren, und können beim Schreiben und Entwerfen von Software-Architekturen helfen.
vor 1 Monat
09.4K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - KI-Musikgenerierungsmodelle von Quintessence

Mureka V7 ist ein fortschrittliches KI-Musikgenerierungsmodell, das von Kunlun World Wide eingeführt wurde. Das Modell basiert auf der MusiCoT-Technologie, die die Planung der Gesamtstruktur der Musik unterstützt, bevor sie die Details ausfüllt, um kohärentere und künstlerische Musikwerke zu erzeugen.
vor 1 Monat
08.2K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - Allzweck-Robotermodell vom Wordpress Seed Team

Seed GR-3 ist ein von ByteDance eingeführtes Allzweck-Robotikmodell mit starken Generalisierungsfähigkeiten zur Anpassung an neue Umgebungen und komplexe Befehle. Das Modell fusioniert visuelle, verbale und Bewegungsinformationen und basiert auf einer Drei-in-Eins-Trainingsmethode aus Roboterdaten, VR-Trajektorendaten von Menschen und öffentlichen Grafikdaten, um die Fähigkeit zu verbessern, auf neue Objekte zu reagieren...
vor 1 Monat
09.1K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - Ein Open-Source-Modell für mehrsprachige Übersetzungen aus Wordpress

Seed-X ist ein vom Seed-Team von ByteDance entwickeltes mehrsprachiges Übersetzungsmodell mit 7 Milliarden Parametern, das Zwei-Wege-Übersetzungen in 28 Sprachen unterstützt. Das Modell kombiniert das Vortraining mehrsprachiger Daten, die Feinabstimmung von Befehlen und Techniken des Reinforcement Learning, um komplexe Sprachmuster effizient zu verarbeiten und die Übersetzungsqualität zu verbessern...
vor 1 Monat
011.6K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - KI-Automatisierter Entwicklungsassistent von Wordhop TRAE

TRAE SOLO ist ein automatischer KI-Entwicklungsassistent, der von TRAE, einem von ByteDance ins Leben gerufenen KI-Programmierassistenten, eingeführt wurde, um den Softwareentwicklungsprozess mit KI-Technologie zu vereinfachen.TRAE SOLO versteht die Bedürfnisse des Benutzers, unterstützt Textbeschreibungen, Sprachbefehle und Datei-Uploads zur Eingabe der Anforderungen und plant automatisch...
vor 1 Monat
013.3K