Neueste AI-Ressourcen

Insgesamt 2659 Artikel

Informationen zum Kurs Neueste AI-Ressourcen AI-Wissensdatenbank AI-Nachrichten

in Ordnung bringen

überfliegen Lesezeichen (Internet)

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

meso- (Chemie)Meeseeks - Meeseeks - Open-Source-Bewertung der Fähigkeit, Modellanweisungen in einem Prüfungssatz zu befolgen

Meeseeks ist ein Open-Source-Bewertungsset für große Modelle, das vom M17-Team bei Meituan verwendet wird, um die Fähigkeit eines Modells zu bewerten, Anweisungen zu befolgen.Meeseeks verwendet einen dreistufigen Bewertungsrahmen, um umfassend zu messen, ob ein Modell in der Lage ist, Antworten in strikter Übereinstimmung mit den Anweisungen des Benutzers von der Makro- bis zur Mikroebene zu generieren, und bewertet nicht das Wissen über den Inhalt der Antwort als positiv...

Neueste AI-Ressourcen

vor 12 Stunden

01.2K

gpt-realtime - OpenAI最新推出的AI语音模型

meso- (Chemie)gpt-realtime - das neueste KI-Sprachmodell von OpenAI

gpt-realtime ist ein fortschrittliches Sprachmodell von OpenAI, das direkte Audioverarbeitung unterstützt, um natürliche und flüssige Sprache zu erzeugen. Das Modell unterstützt mehrere Sprachen und Stile, versteht nonverbale Hinweise wie Lachen und kann zwischen Sprachen wechseln.

Neueste AI-Ressourcen

vor 16 Stunden

01.2K

Youtu-agent - 腾讯开源的高效智能体框架

meso- (Chemie)Youtu-agent - Tencent Open-Source-Framework für effiziente intelligente Körper

Youtu-agent ist ein Open-Source-Framework zum Aufbau und Betrieb autonomer Intelligenzen von Tencent Youtu Labs. Das Framework schneidet in den WebWalkerQA- und GAIA-Benchmarks mit einer Genauigkeit von 71,47% bzw. 72,8% gut ab...

Neueste AI-Ressourcen

vor 1 Tag

03.3K

HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

meso- (Chemie)HunyuanVideo-Foley - Tencents Open-Source-Modell zur Erzeugung von Videotönen

HunyuanVideo-Foley ist ein Open-Source-Video-Sound-Generierungsmodell von Tencents Mixed-Yuan-Team, das das Hinzufügen von genau abgestimmten Soundeffekten zu stummen Videos unterstützt. Das Modell basiert auf einem groß angelegten Datensatz Ausbildung , mit einem multimodalen Diffusionskonverter Architektur , kombiniert mit der Darstellung der Ausrichtung Verlustfunktion und Audio VAE Optimierungstechniken ...

Neueste AI-Ressourcen

vor 2 Tagen

02.6K

PixVerse V5 - 爱诗科技推出的自研AI视频模型

meso- (Chemie)PixVerse V5 - Selbstentwickeltes AI-Videomodell von Aishi Technologies

PixVerse V5 ist ein großes Modell der KI-Videogenerierung, das von Aishi Technology auf den Markt gebracht wurde. Das Modell kann qualitativ hochwertige Videoinhalte auf der Grundlage von vom Benutzer eingegebenen Textbeschreibungen oder Bildern generieren und unterstützt eine Vielzahl von Stilen, wie Anime, Sci-Fi und nationalen Stil.

Neueste AI-Ressourcen

vor 2 Tagen

03K

问小白5 - 问小白推出的全能AI模型

meso- (Chemie)Ask White 5 - All-in-One AI Model von Ask White

Ask White 5 ist das Flaggschiff unter den "All in One"-Modellen mit einem sehr hohen Intelligenzgrad. Das Modell schneidet bei vielen Beurteilungen gut ab, wie z. B. bei der AA-Index-Kompositbeurteilung mit einem Wert von 64,7 und bei der Beurteilung der MINT-Fähigkeiten mit einem Wert von 86, der nahe an den weltweit führenden GPT-5 heranreicht.

Neueste AI-Ressourcen

vor 2 Tagen

03.4K

MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - Facing Face Intelligence Open Source 8B Parameter Multimodales Modell

MiniCPM-V 4.5 ist ein quelloffenes 8B parametrisches multimodales Modell für Facade Intelligence, das auf Qwen3-8B und SigLIP2-400M basiert und Bilder und Videos effizient verarbeiten kann. Es hat eine hervorragende Leistung in der visuellen Token Verbrauch, Verarbeitung ...

Neueste AI-Ressourcen

vor 2 Tagen

05.1K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - Das leistungsfähigste Modell zur Bilderzeugung und -bearbeitung von Google

Gemini 2.5 Flash Image (Codename nano banana) ist ein hochmodernes Bilderzeugungs- und -bearbeitungsmodell von Google, das die Konsistenz von Zeichen in verschiedenen Szenen beibehält und eine präzise Bildbearbeitung durch natürliche Sprache unterstützt, z. B. das Verwischen von Hintergründen und Entfernen von Flecken.

Neueste AI-Ressourcen

vor 3 Tagen

05.5K

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - Ali Tongyi Open-Source-Modell für die audiogestützte Videoerzeugung

Wan2.2-S2V ist ein Open-Source-multimodale Video-Generierung Modell von Ali Tongyi, nur ein statisches Bild und ein Stück Audio, kann hochwertige digitale menschliche Video zu erzeugen, und unterstützt eine Vielzahl von Bildtypen und Rahmen.

Neueste AI-Ressourcen

vor 3 Tagen

05.6K

吴恩达面向开发者的ChatGPT提示工程免费课程

Kostenloser Kurs über ChatGPT Tip Engineering für Entwickler von Ernest Ng

ChatGPT Tip Engineering for Developers ist ein gemeinsamer Kurs von DeepLearning.AI und OpenAI für Entwickler, in dem Isa Fulford und Andrew Ng zeigen, wie man Large Language Models (LLM) verwendet...

Neueste AI-Ressourcen Informationen zum Kurs

vor 3 Tagen

05.3K

问小白o4 - 问小白推出的并行思考模型，同时开启8条思考路径

Ask o4 - Ein von Ask o4 eingeführtes paralleles Denkmodell, das 8 Denkwege gleichzeitig eröffnet

Ask White o4 ist ein innovatives paralleles Denkmodell, das acht Denkpfade gleichzeitig öffnet, das Problem aus mehreren Perspektiven analysiert und automatisch die optimale Lösung herausfiltert. Das Modell beinhaltet fortschrittliche Long-CoT-Verstärkungslern- und Prozessbelohnungs-Lerntechniken, verfügt über leistungsstarke Deep-Reasoning-Fähigkeiten und erbringt gute Leistungen bei komplexen Aufgaben.

Neueste AI-Ressourcen

vor 4 Tagen

07.2K

VibeVoice - 微软推出的文本到语音模型

VibeVoice - Text-to-Speech-Modellierung von Microsoft

VibeVoice ist ein neues Text-to-Speech-Modell (TTS) von Microsoft. Das Modell erzeugt Konversations-Audio von bis zu vier verschiedenen Sprechern und unterstützt bis zu 90 Minuten ununterbrochene Sprachausgabe, wodurch die Längenbeschränkungen herkömmlicher TTS-Systeme aufgehoben werden.

Neueste AI-Ressourcen

vor 4 Tagen

07.1K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Open Source 3D-Szenengenerierungsmodelle von Qunar Technologies

SpatialGen ist ein quelloffenes 3D-Szenengenerierungsmodell von Qunar Technology, das auf der Architektur des Diffusionsmodells basiert. Es unterstützt die Generierung von räumlich-zeitlich konsistenten Multiview-Bildern auf der Grundlage von Textbeschreibungen, Referenzbildern und räumlichem 3D-Layout sowie die weitere Generierung von 3D-Gauß-Szenen und das Rendern von Roaming-Videos.

Neueste AI-Ressourcen

vor 4 Tagen

06.2K

EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - Open-Source-Modell zur Erzeugung multimodaler digitaler menschlicher Animationen

EchoMimicV3 ist ein multimodales Modell zur Erzeugung digitaler menschlicher Videos, das von der Ant Group auf den Markt gebracht wurde. Es verfügt über 1,3 Milliarden Parameter und ist in der Lage, mehrere Eingaben wie Audio, Text und Bilder zu verarbeiten, um hochwertige digitale menschliche Animationen zu erzeugen.

Neueste AI-Ressourcen

vor 4 Tagen

06.5K

Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - Eine neue Generation von Spracherkennungsmodellen, die gemeinsam von Nail und Tongyi entwickelt wurde

Fun-ASR ist ein großes Spracherkennungsmodell, das gemeinsam von Nail und Tongyi Labs entwickelt wurde. Das Modell wurde mit umfangreichen Audiodaten trainiert und kann branchenübergreifende Begriffe wie Internet, Technologie, Heimdekoration usw. genau identifizieren, was die Erkennungsgenauigkeit erheblich verbessert. Das Modell wird mit Nail-Unternehmensinformationen zur Inferenzoptimierung kombiniert, um das Problem der Phantomsprache zu reduzieren.

Neueste AI-Ressourcen

vor 5 Tagen

08.4K

Squibler - AI小说辅助写作平台，助力构思到创作全过程

Squibler - KI-Plattform zur Unterstützung des Schreibens von Romanen, die den gesamten Prozess von der Idee bis zur Erstellung vorantreibt

Squibler ist eine leistungsstarke, KI-gestützte Schreibplattform für Schriftsteller, die den Nutzern beim gesamten Prozess von der Konzeption über die Erstellung bis zur Veröffentlichung hilft. Die Plattform bietet eine Vielzahl von Story-Vorlagen für Romane, Drehbücher, Kurzgeschichten usw. Die Benutzer müssen nur das anfängliche Konzept eingeben, und die KI kann Umrisse, Charaktere, Szenen usw. erstellen.

Neueste AI-Ressourcen

vor 5 Tagen

07.7K

91写作 - 开源的AI智能小说创作平台

91Writing - Open Source KI-Plattform für intelligente Romanerstellung

91Writing ist ein vollständig quelloffenes Tool zur Erstellung von KI-Romanen, das auf der Grundlage von Vue 3 und Element Plus entwickelt wurde und eine Vielzahl von fortschrittlichen KI-Modellen wie GPT, Claude, Gemini usw. integriert. Das Tool bietet Schöpfern eine komplette Erstellungskette von der Idee bis zum Text, einschließlich der Projekterstellung...

Neueste AI-Ressourcen

vor 5 Tagen

07.2K

Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - eine von der HKUST ins Leben gerufene Multi-Agenten-Simulationsplattform

Aivilization ist die weltweit erste KI-Multi-Intelligenz-Plattform für soziale Simulationen, die von der Hong Kong University of Science and Technology entwickelt wurde. Sie bildet einen visuellen digitalen Sandkasten, in dem Nutzer Tausende von KI-Intelligenzen erstellen und steuern können, um die soziale Entwicklung der zukünftigen Koexistenz von Mensch und KI zu beobachten. Die Plattform unterstützt...

Neueste AI-Ressourcen

vor 5 Tagen

010.2K

Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - Musks Open-Source-KI-Modell xAI

Grok 2.5 ist ein Open-Source-KI-Modell von Elon Musk's xAI. Mit 269 Milliarden Parametern basiert es auf der Mixed Expertise (MoE)-Architektur für leistungsstarke Leistung und Inferenz. Das Modell wurde für wissenschaftliches Wissen auf Hochschulniveau (GPQA), allgemeines Wissen (MMLU, MM...

Neueste AI-Ressourcen

vor 5 Tagen

08.6K

Draw A Fish - 免费的在线AI画鱼网站，共享虚拟鱼缸

Draw A Fish - kostenlose Online-KI-Fischzeichnungsseite mit gemeinsamen virtuellen Fischbecken

Draw A Fish ist eine einfache und unterhaltsame Online-Website zum Zeichnen von Fischen, die in ein virtuelles Aquarium gesetzt werden können, das weltweit geteilt wird.

Neueste AI-Ressourcen

vor 6 Tagen

08.9K

MIT最新报告《生成式AI鸿沟：2025年商业人工智能现状》

Der neue MIT-Bericht "The Generative AI Divide: the State of Business Artificial Intelligence in 2025

Der jüngste MIT-Bericht "The Generative AI Divide: the State of Business AI in 2025" (Die Kluft zwischen generativer und künstlicher Intelligenz: der Stand der künstlichen Intelligenz in Unternehmen im Jahr 2025) zeigt den Kern des Prozesses der Einführung generativer künstlicher Intelligenz (GenAI) auf, den Unternehmen durchlaufen.

Neueste AI-Ressourcen Informationen zum Kurs

vor 6 Tagen

014K

AutoClip - 开源的AI视频切片工具，一键生成专题视频合集

AutoClip - Open Source AI Video Slicing Tool zur Erstellung thematischer Videosammlungen mit einem Klick!

AutoClip ist Open-Source-KI-Video-Editing-Tool, basierend auf fortschrittlicher KI-Technologie, um den gesamten Prozess der automatisierten Videoverarbeitung zu erreichen. Tools können automatisch die Highlights des Videos, genaue Extraktion von wertvollen Inhalten zu identifizieren, kann auf der Grundlage der Ähnlichkeit des Themas der intelligenten Clustering, um eine Sammlung von Inhalten zu generieren.AutoClip Unterstützung...

Neueste AI-Ressourcen

vor 1 Woche

010K

ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - Tencents quelloffenes generatives KI-Animationstool

ToonComposer ist ein generatives KI-Animationstool, das gemeinsam von der Chinesischen Universität Hongkong, Tencent PCG ARC Lab und der Universität Peking entwickelt wurde. Durch die generative Post-Keyframe-Technologie wird die Erzeugung von Zwischenbildern und die Farbgebung in einen automatisierten Prozess integriert, der nur eine Skizze und eine...

Neueste AI-Ressourcen

vor 1 Woche

010.4K

Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Ein neues KI-Modell, das vom Wordpress-Team zur Verfügung gestellt wird

Seed-OSS ist eine Familie von großen Sprachmodellen, die vom Byte Jump Seed Team entwickelt wurden und sich auf lange Texte und schlussfolgernde Aufgaben konzentrieren. Das Modell erbringt gute Leistungen bei komplexen logischen Schlussfolgerungen und mehrstufigen Schlussfolgerungen mit hoher Genauigkeit und kann schwierige Probleme effizient lösen.Seed-OSS unterstützt lange Textkontexte bis zu 512K...

Neueste AI-Ressourcen

vor 1 Woche

010.1K

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Leichtgewichtiges wissenschaftliches multimodales Modell, das vom Shanghai AI Lab zur Verfügung gestellt wird

Intern-S1-mini ist ein leichtgewichtiges wissenschaftliches multimodales Makromodell mit einer Parameterskala von 8B, das vom Shanghai Artificial Intelligence Laboratory (SAL) entwickelt wurde und die leistungsstarken Fähigkeiten von Intern-S1 erbt, indem es sowohl allgemeine als auch spezielle wissenschaftliche Fähigkeiten kombiniert. In Bezug auf die Leistung ist das I...

Neueste AI-Ressourcen

vor 1 Woche

09.9K

Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - KI-Bildbearbeitungsmodell von Google

Nano Banana ist der Gemini 2.5 Flash Image Codename für Gemini, ein KI-Bildgenerierungs- und -bearbeitungsmodell von Google, das detaillierte, fotorealistische Bilder auf der Grundlage einfacher Texteingaben erzeugt, um hochwertige Änderungen an bestehenden Bildern vorzunehmen.

Neueste AI-Ressourcen

vor 3 Tagen

018K

Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - Ein neues Reasoning-Modell, vorgestellt von Racer

Klear-Reasoner ist ein leistungsstarkes Inferenzmodell von Racer, das auf Qwen3-8B-Base basiert. Das Modell wird durch eine lange Gedankenkette überwacht Feinabstimmung und Verstärkungslernen trainiert, um gut in mathematischen und Code reasoning.Klear-Reasoner...

Neueste AI-Ressourcen

vor 1 Woche

09.3K

CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Das effiziente VLA-Modell der Amoy-Gruppe

CombatVLA ist ein innovatives 3D-Action-Rollenspiel (ARPG) spezifisches Modell des Future Life Lab Teams der Amoy Group.CombatVLA ist ein Vision-Linguistic-Action (VLA) Modell, das auf einer 3B parametrischen Skala aufgebaut ist und die Bewegungen des menschlichen Spielers mittels Motion Tracker erfasst...

Neueste AI-Ressourcen

vor 1 Woche

09.9K

DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - Das neueste Open-Source-KI-Modell von DeepSeek

DeepSeek V3.1 ist eine neue Generation von KI-Modellen, die von DeepSeek eingeführt wurde, mit wichtigen Verbesserungen gegenüber dem Vorgänger V3. DeepSeek V3.1 führt eine hybride Denkarchitektur ein, die es dem Modell erlaubt, flexibel zwischen denkenden und nicht denkenden Modi zu wechseln, was die Denkleistung...

Neueste AI-Ressourcen

vor 1 Woche

010.2K

Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi Open-Source-Bildbearbeitungsmodell

Qwen-Image-Edit ist ein von Ali Tongyi eingeführtes Allzweck-Bildbearbeitungsmodell, das auf der Qwen-Image-Architektur mit 20 Milliarden Parametern aufbaut. Das Modell kombiniert sowohl semantische als auch Erscheinungsbild-Bearbeitungsfähigkeiten und kann visuelle Erscheinungsbild-Bearbeitung auf niedriger Ebene an Bildern durchführen (z.B. Hinzufügen, Löschen...

Neueste AI-Ressourcen

vor 2 Wochen

09.9K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - Das neueste Framework zur Spracherzeugung von KunlunWei

MoE-TTS ist ein von Kunlun-Wanwei eingeführtes Sprachsynthese-Framework, das auf der Mixed Expert (MoE)-Architektur basiert, die vortrainierte Large Language Models (LLMs) mit Sprachexpertenmodulen kombiniert.MoE-TTS behält die leistungsstarke textuelle Argumentation bei, indem es die textuellen Modulparameter einfriert und nur die Sprachmodulparameter aktualisiert...

Neueste AI-Ressourcen

vor 2 Wochen

012.4K

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuans Open-Source-Allzweck-Robotikplattform mit Beihang und anderen

Genie Envisioner (GE) ist eine einheitliche Plattform für Roboteroperationen, die vom Genie Robotics Team in Zusammenarbeit mit der National University of Singapore, der Beijing University of Aeronautics and Astronautics und anderen Institutionen entwickelt wurde. Sie ermöglicht es Robotern, Aufgaben besser zu verstehen und auszuführen, indem sie sich erst etwas vorstellen und dann handeln".

Neueste AI-Ressourcen

vor 2 Wochen

011.9K

DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Die nächste Generation des selbstüberwachten Vision-Basismodells von Meta AI

DINOv3 ist ein selbstüberwachtes Vision-Basismodell der nächsten Generation von Meta AI, das ein selbstüberwachtes Lernparadigma verwendet, um Bildmerkmale ohne Beschriftungsdaten zu lernen. Es löst das Problem der Merkmalsverschlechterung durch die Verbesserung der Datenvorbereitung und die Einführung der Gram-Verankerung und verbessert die Generalisierung...

Neueste AI-Ressourcen

vor 2 Wochen

016.3K

Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - Erweiterte KI-Modelle für die Musikproduktion von Quintessence

Mureka V7.5 ist ein hochmodernes KI-Musikgenerierungsmodell von Kunlun World Wide, das sich auf chinesisches Songwriting konzentriert. Das Modell reproduziert präzise Klangfarben und Spieltechniken, um natürliche, weiche und emotionale Stimmen zu erzeugen. Mureka V7.5 basiert auf einer optimierten automatischen Spracherkennungs-Technologie (ASR).

Neueste AI-Ressourcen

vor 2 Wochen

012.2K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - Eine aktualisierte Version der Deep Research Intelligence von Kunlun

Skywork Deep Research Agent v2 ist ein von Kunlun Wave auf den Markt gebrachtes intelligentes Forschungsinstrument, das sich auf die Integration und Analyse multimodaler Informationen konzentriert...

Neueste AI-Ressourcen

vor 2 Wochen

010.7K

Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Tencent Hunyuans Open-Source-Framework zur Erstellung interaktiver Videos für Spiele der nächsten Generation.

Hunyuan-GameCraft ist Tencent Hunyuan Team Open-Source-interaktive Spiel-Video-Generierung Rahmen. Framework aus einem einzigen Bild und Aufforderungen zu hochdynamischen Spiel Video zu erzeugen, unterstützen den Benutzer durch die Tastatur und Maus, um den Videoinhalt in Echtzeit zu steuern.

Neueste AI-Ressourcen

vor 2 Wochen

013.4K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - Open Source Effiziente multimodale Modellierung von KunlunWanwei

Skywork UniPic 2.0 ist ein effizientes multimodales Modell, das von Quintessence zur Verfügung gestellt wird und sich auf Bilderzeugung, -bearbeitung und -verständnis konzentriert. Das Modell basiert auf einer 2B-Parameter SD3.5-Medium-Architektur und wird durch Pre-Training, progressive Dual-Task-Verstärkungsstrategie und Co-Training realisiert...

Neueste AI-Ressourcen

vor 2 Wochen

013K

RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - Erstes Open-Source-Robotik-Kontextprotokoll vom Ali Dharma Institut

RynnRCP ist ein quelloffenes Robot Context Protocol (RCP) des Ali Dharma Instituts, das die Schwelle für die Entwicklung von verkörperter Intelligenz senkt und den gesamten Entwicklungsprozess öffnet.RynnRCP besteht aus dem RCP-Framework und dem RobotMotion-Modul.Das RCP-Framework wird durch die Abstraktion von Fähigkeiten und die Unterstützung mehrerer...

Neueste AI-Ressourcen

vor 2 Wochen

012.6K

RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - Das Open-Source-Weltverstehensmodell des Ali-Dharma-Instituts

RynnEC ist ein Modell zum Verständnis der Welt, das vom Alibaba Dharma Institute eingeführt wurde und sich auf Aufgaben der verkörperten Intelligenz konzentriert. Das Modell basiert auf einer multimodalen Fusionstechnologie, die Videodaten und natürliche Sprache kombiniert. Es kann Objekte in einer Szene aus mehreren Dimensionen analysieren und unterstützt Funktionen wie Objektverständnis, räumliche Wahrnehmung und Videozielsegmentierung.

Neueste AI-Ressourcen

vor 2 Wochen

013K

Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - Kunlun World Wide Open Source Framework zur Erzeugung von 3D-Welten

Matrix-3D ist ein Open-Source-Framework des Skywork AI-Teams, das sich auf die Erzeugung erkundbarer 3D-Panoramawelten konzentriert. Das Framework kombiniert die Erzeugung von Panoramavideos und 3D-Rekonstruktionstechniken, um qualitativ hochwertige, omnidirektionale, erkundbare 3D-Welten aus einem einzigen Bild oder Text zu erzeugen...

Neueste AI-Ressourcen

vor 2 Wochen

010.9K

GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Multimodales Open-Source-Modell für visuelles Reasoning von Smart Spectrum

GLM-4.5V ist das weltweit führende Open-Source-Modell für visuelle Schlussfolgerungen, das von Smart Spectrum eingeführt wurde, mit 106 Milliarden Gesamtparametern und 12 Milliarden aktivierten Parametern. Das Modell wurde auf der Grundlage der neuen Generation des Textbasismodells GLM-4.5-Air trainiert und verfügt über leistungsstarke visuelle Verstehens- und Schlussfolgerungsfähigkeiten, die in der Lage sind, Bilder, Videos...

Neueste AI-Ressourcen

vor 3 Wochen

012.6K

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 - Interaktives Weltmodell entwickelt von KunlunWanwei

Matrix-Game 2.0 ist ein selbst entwickeltes interaktives Weltmodell, das von Kunlun SkyWork AI veröffentlicht wurde. Matrix-Game 2.0 ist das branchenweit erste quelloffene, interaktive Echtzeitmodell mit langen Sequenzen für allgemeine Szenarien, das in der Lage ist, mit 25 FPS in mehreren...

Neueste AI-Ressourcen

vor 3 Wochen

012.6K

Baichuan-M2 - 百川智能推出开源的医疗增强大模型

Baichuan-M2 - Baichuan Intelligence bringt ein erweitertes Open-Source-Modell für das Gesundheitswesen auf den Markt

Baichuan-M2 ist ein von Baichuan Intelligence entwickeltes medizinisches Augmented-Macromodell. Es schneidet im medizinischen Bereich gut ab, vor allem im HealthBench-Test mit einer Punktzahl von 60,1, und übertrifft damit das gpt-oss120b von OpenAI und viele andere Open-Source-Modelle...

Neueste AI-Ressourcen

vor 3 Wochen

012.2K

Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Ein leistungsstarkes, kostengünstiges Sprachmodell von Tongyi Chien-quan

Qwen-Flash ist ein leistungsfähiges, kostengünstiges Sprachmodell, das in der Alibaba Tongyi Thousand Questions Serie eingeführt wurde und für eine schnelle Reaktion und effiziente Bearbeitung einfacher Aufgaben konzipiert ist. Es basiert auf der fortschrittlichen Mixture-of-Experts (MoE)-Architektur und wird durch ein spärliches Expertennetzwerk realisiert...

Neueste AI-Ressourcen

vor 3 Wochen

08.9K

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - Audio-gesteuertes Werkzeug zur Erstellung digitaler Menschen von Quintessence

SkyReels-A3 ist ein audiogestütztes Werkzeug zur Erstellung digitaler Menschen von der Kunlun World Wide Group. SkyReels-A3 ist ein audiogesteuertes Werkzeug zur Erstellung digitaler Menschen, das durch einfache Eingaben (z. B. Porträtbilder und Stimme) hochwertige dynamische Videoinhalte generieren, statische Fotos "zum Leben erwecken" und Zeilen für bestehende Videos durch neue Lippensynchronisationen ersetzen kann, die die Charaktere automatisch anpassen...

Neueste AI-Ressourcen

vor 3 Wochen

09.3K

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - Spracherzeugungsmodell von MiniMax

MiniMax Speech 2.5 ist ein fortschrittliches Spracherzeugungsmodell, das vom MiniMax-Team entwickelt wurde. Es ist ein bedeutender Fortschritt auf dem Gebiet der Sprachsynthese, insbesondere in Bezug auf die mehrsprachige Ausdruckskraft, die Genauigkeit der Klangfarbenwiedergabe und die Sprachabdeckung. Das Modell unterstützt 40 Sprachen...

Neueste AI-Ressourcen

vor 3 Wochen

012.8K

GPT-5 - OpenAI推出的最强语言模型，统一智能系统

GPT-5 - Das stärkste Sprachmodell, vorgestellt von OpenAI, Unified Intelligence System

GPT-5 ist das neueste Sprachmodell, das von OpenAI mit mehreren Upgrades veröffentlicht wurde. Es ist ein einheitliches Intelligenzsystem mit einem eingebauten Echtzeit-Router, der je nach Komplexität des Problems automatisch zwischen effizientem und tiefem Denkmodus umschaltet und so eine schnelle Reaktion und genaue Antworten ermöglicht.GPT-5 hat mehrere Versionen, u.a. für...

Neueste AI-Ressourcen

vor 3 Wochen

010K

dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 - Kleines rotes Buch hi lab open source multimodales großes Modell

dots.vlm1 ist das erste multimodale große Modell, das vom Little Red Book hi lab freigegeben wurde. Basierend auf NaViT, einem visuellen Encoder mit 1,2 Milliarden Parametern, der von Grund auf neu trainiert wurde, und DeepSeek V3 Large Language Model (LLM), verfügt es über leistungsstarke visuelle Wahrnehmung und...

Neueste AI-Ressourcen

vor 3 Wochen

09.3K

Genie 3 - 谷歌推出的通用世界模型

Genie 3 - Das universelle Weltmodell von Google

Genie 3 ist eine neue Generation von universellen Weltmodellen von Google DeepMind, die es ermöglichen, hochdynamische und kohärente virtuelle Welten in Echtzeit zu erzeugen. Genie 3 simuliert physikalische Phänomene, natürliche Ökosysteme und unterstützt die Erstellung von Fantasie- und historischen Szenarien. Mit Textaufforderungen können Benutzer...

Neueste AI-Ressourcen

vor 3 Wochen

010.3K

Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Das leistungsfähigste Programmiermodell von Anthropic

Claude Opus 4.1 ist ein hochmodernes, umfangreiches Sprachmodell von Anthropic, das für die effiziente Verarbeitung komplexer Aufgaben entwickelt wurde. Das Modell zeichnet sich im Bereich der Programmierung durch die Erzeugung von qualitativ hochwertigem Code aus, unterstützt bis zu 32k Einzelausgaben und passt sich an eine Vielzahl von Programmierstilen an...

Neueste AI-Ressourcen

vor 3 Wochen

010.3K

gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss - eine Familie von quelloffenen Inferenzmodellen von OpenAI

gpt-oss ist OpenAIs Familie von Open-Source-Inferenzmodellen, die effiziente, flexible und einfach zu implementierende KI-Lösungen für Entwickler ermöglichen. gpt-oss gibt es in zwei Versionen, gpt-oss-120B mit 117 Milliarden Parametern und Unterstützung für 8...

Neueste AI-Ressourcen

vor 3 Wochen

010.2K

MiDashengLM - 小米开源的声音理解模型

MiDashengLM - Xiaomis Open-Source-Modell zum Verstehen von Geräuschen

MiDashengLM ist Xiaomis Open-Source-Modell für effizientes Klangverständnis, mit spezifischen Parametern in der Version MiDashengLM-7B, die sich auf Audioverarbeitung und -verständnis konzentriert. Das Modell basiert auf Xiaomi Dasheng Audio-Encoder und Qwen2.5-Omn...

Neueste AI-Ressourcen

vor 3 Wochen

010.1K

MOSS-TTSD - 清华实验室开源的双语对话语音生成模型

MOSS-TTSD - Tsinghua Labs Open-Source-Modell für zweisprachige Dialoge zur Spracherzeugung

MOSS-TTSD ist ein Open-Source-Modell für gesprochene Dialoge, das vom Speech and Language Lab der Tsinghua Universität entwickelt wurde. MOSS-TTSD kann Textdialogskripte in natürliche, flüssige und ausdrucksstarke Dialogsprache umwandeln und unterstützt die zweisprachige Erzeugung in Englisch und Chinesisch.

Neueste AI-Ressourcen

vor 3 Wochen

010.6K

AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Ein Modell zur multimodalen Audioerzeugung von Racer

AudioGen-Omni ist ein multimodales Audiogenerierungsmodell von Racer, das qualitativ hochwertige Audio-, Sprach- und Songdateien auf der Grundlage von Eingaben wie Video, Text usw. generiert. AudioGen-Omni basiert auf fortschrittlichen Techniken wie multimodaler Diffusionstransformation und...

Neueste AI-Ressourcen

vor 3 Wochen

09.2K

LangExtract - 谷歌开源的Python库，提取结构化信息

LangExtract - Googles quelloffene Python-Bibliothek zum Extrahieren strukturierter Informationen

LangExtract ist eine Google Open Source Python-Bibliothek, die große Sprachmodelle (LLMs) verwendet, um strukturierte Informationen aus unstrukturiertem Text zu extrahieren. Mit benutzerdefinierten Befehlen und einer kleinen Anzahl von Beispielen kann sie effizient Schlüsseldetails identifizieren und organisieren, wie z. B. klinische...

Neueste AI-Ressourcen

vor 3 Wochen

011.5K

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian bringt Open-Source-Grundmodell von Qwen-Image auf den Markt

Qwen-Image ist ein Open-Source-Basismodell für die Bilderzeugung, das vom Alibaba Tongyi Qianqian-Team veröffentlicht wurde. Mit 20 Milliarden Parametern verwendet es die Multimodal Diffusion Transformer Architecture (MMDiT), die drei Module umfasst: multimodales Verständnis, hochauflösende Kodierung und Diffusionsmodellierung.Qwen-Image's...

Neueste AI-Ressourcen

vor 3 Wochen

09.3K

RedOne - 小红书最新推出的社交大模型

RedOne - das neueste soziale Megamodell von Little Red Book

RedOne ist ein großes, auf soziale Netzwerke zugeschnittenes Sprachmodell, das von Little Red Book eingeführt wurde. Das Modell wird durch eine dreistufige Trainingsstrategie trainiert, die soziales und kulturelles Wissen einbezieht, Multitasking-Fähigkeiten stärkt und menschliche Präferenzen abgleicht.RedOne übertrifft das Basismodell deutlich in der Leistung bei sozialen Aufgaben, bei der Erkennung schädlicher Inhalte und beim Browsen...

Neueste AI-Ressourcen

vor 4 Wochen

010.2K

FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - Baidus leistungsstarkes Tool für die Erstellung und Bereitstellung großer Modelle

FastDeploy ist ein hochleistungsfähiges Reasoning- und Deployment-Tool von Baidu, das für Large Language Models (LLMs) und Visual Language Models (VLMs) entwickelt wurde. FastDeploy wurde auf der Grundlage des Flying Paddle (PaddlePaddle)-Frameworks entwickelt und unterstützt eine Vielzahl von Hardware-Plattformen...

Neueste AI-Ressourcen

vor 4 Wochen

09.4K

InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - 3D Gaussian Semantic Dataset von Qunar Technology

InteriorGS ist ein hochwertiger semantischer 3D-Gauß-Datensatz, der von Qunar Technology eingeführt wurde. Der Datensatz enthält 1.000 3D-Szenen, die mehr als 80 Innenräume abdecken, wie z. B. Wohnungen, Geschäfte, Hochzeitssäle und Museen. Der Datensatz enthält mehr als 554.000 Objektinstanzen in 755 Kategorien...

Neueste AI-Ressourcen

vor 4 Wochen

08.4K

DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Null-Sample-Sprachsynthesemodelle von Microsoft

DragonV2.1 ist ein fortschrittliches Text-to-Speech (TTS)-Modell von Microsoft, das ohne Abtastung arbeitet. Das auf der Transformer-Architektur basierende Modell unterstützt mehrere Sprachen und das Klonen von Null-Sample-Sprache und erzeugt natürliche, ausdrucksstarke Sprache mit nur 5-90 Sekunden Sprachaufforderung.

Neueste AI-Ressourcen

vor 4 Wochen

09.6K

ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - Open Source UI Screenshot Generation Front-End Code Tool

ScreenCoder ist ein intelligentes Open-Source-Tool, das UI-Design-Screenshots schnell in hochwertigen HTML/CSS-Code umwandeln kann. Das Tool basiert auf einer modularen Multi-Intelligenz-Architektur, kombiniert mit visuellem Verständnis, Layout-Planung und Code-Synthese-Techniken, um die Erzeugung von hochpräzisen und semantischen Front-Ends zu unterstützen...

Neueste AI-Ressourcen

vor 4 Wochen

010.1K

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - KI-Inferenzmodell von Google

Gemini 2.5 Deep Think ist ein KI-Modell von Google, das für die Lösung komplexer Aufgaben entwickelt wurde. Es ist eine Variante des Modells, das bei der Internationalen Mathematik-Olympiade (IMO) 2025 die Goldmedaille gewonnen hat, und wurde entwickelt, um komplexe Aufgaben durch parallele ...

Neueste AI-Ressourcen

vor 4 Wochen

07.8K

MindLink - 昆仑万维推出的开源推理大模型

MindLink - Open Source Reasoning Big Model von KunlunWei

MindLink ist ein großes Modell der Open-Source-Reasoning von Kunlun World Wide Web ins Leben gerufen. Mit adaptiven Reasoning-Mechanismus, nach der Komplexität der Aufgabe kann flexibel geschaltet werden Inferenz-Modus, einfache Aufgaben schnell erzeugt, komplexe Aufgaben in der Tiefe Argumentation, unter Berücksichtigung der Effizienz und Genauigkeit. Plan-driven Argumentation Paradigma zu entfernen, die "denken" Tag, reduzieren ...

Neueste AI-Ressourcen

vor 4 Wochen

08.9K

Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型

Kimi K2 High-Speed Edition - High-Speed Edition des Sprachmodells von Dark Side of the Moon Kimi

Kimi K2 Hochgeschwindigkeitsversion (kimi-k2-turbo-preview) ist ein Hochleistungs-Sprachmodell, das von Kimi, der dunklen Seite des Mondes, eingeführt wurde. Das Modell ist auf der Grundlage von Kimi K2 optimiert, und die Ausgabegeschwindigkeit ist stark erhöht, die 40 Token pro Sekunde erzeugen kann...

Neueste AI-Ressourcen

vor 4 Wochen

010.9K

dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - ein quelloffenes Modell zur Analyse mehrsprachiger Dokumente vom Little Red Book hi lab

dots.ocr ist ein von Xiaohongshu hi lab entwickeltes Modell für die Analyse mehrsprachiger Dokumente, das auf einem visuellen Sprachmodell (VLM) mit 1,7 Milliarden Parametern basiert und die Erkennung des Layouts und des Inhalts von Dokumenten unter Beibehaltung einer guten Lesereihenfolge effizient durchführen kann.

Neueste AI-Ressourcen

vor 4 Wochen

013.8K

HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - Ein neues großes Modell für die Bildwiederherstellung, vorgestellt von einem Team der Chinesischen Akademie der Wissenschaften

HYPIR ist ein umfangreiches Modell für die Bildwiederherstellung, das vom Team von Dong Chao am Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, entwickelt wurde. Das Modell kombiniert die fraktionierte Priorität des Diffusionsmodells mit einem generativen adversen Netzwerk, um eine effiziente und qualitativ hochwertige Bildrestaurierung zu erreichen.HYPIR kann alte Fotos schnell wiederherstellen und die Auflösung verbessern, während der Text klar bleibt...

Neueste AI-Ressourcen

vor 4 Wochen

011.4K

FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型

FLUX.1 Krea [dev] - Black Forest und Krea AI Joint Venturing Graph Modell

FLUX.1 Krea [dev] ist ein textgeneriertes grafisches Modell von Black Forest Labs und Krea AI. Das Modell generiert hochwertige, realistische Bilder auf der Grundlage von eingegebenen Textbeschreibungen, mit einem einzigartigen ästhetischen Stil, der traditionelle A...

Neueste AI-Ressourcen

vor 4 Wochen

010K

Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - ein Open-Source-Hochleistungsprogrammiermodell von Ali Tongyi

Qwen3-Coder-Flash ist ein hochleistungsfähiges Programmiermodell, das von Ali Tongyi Thousand Questions Team eingeführt wurde. Es verfügt über ausgezeichnete Fähigkeiten zur agentenbasierten Programmierung und zum Aufrufen von Werkzeugen und ist gut geeignet, komplexe Programmieraufgaben zu bewältigen. Das Modell unterstützt 256K Token für langes kontextuelles Verständnis und kann auf 1M skaliert werden ...

Neueste AI-Ressourcen

vor 4 Wochen

09.5K

Wide Research - Manus平台推出的多智能体协同功能

Wide Research - Multi-Intelligence-Zusammenarbeit auf der Manus-Plattform eingeführt

Wide Research ist eine leistungsstarke Funktion der Manus-Plattform, die für die Bewältigung komplexer und umfangreicher Aufgaben entwickelt wurde. Die Plattform unterstützt Hunderte von Allzweck-Intelligenzen, die durch parallele Verarbeitungsmechanismen auf Systemebene und Protokolle für die Zusammenarbeit von Intelligenzen gleichzeitig arbeiten.

Neueste AI-Ressourcen

vor 4 Wochen

09.3K

Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - das neueste Diffusions-Sprachmodell von ByteHopper

Seed Diffusion ist ein experimentelles Diffusions-Sprachmodell, das von ByteHop eingeführt wurde und Aufgaben der Codegenerierung übernimmt. Das Modell basiert auf Techniken wie zweistufigem Diffusionstraining, eingeschränktem sequentiellem Lernen und verbesserter effizienter paralleler Dekodierung, was die Inferenzgeschwindigkeit auf 2.146 Token/s deutlich verbessert, was schneller ist als...

Neueste AI-Ressourcen

vor 4 Wochen

010.1K

小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - AI Emotion Manga Generation Produkt von Jingdong Health auf den Markt gebracht

Xiao Xingxu ist das KI-Produkt zur Erzeugung von Emotionscomics, das von Jingdong Health auf den Markt gebracht wurde und sich derzeit in der Testphase befindet. Die Kernfunktion des Produkts ist die Erzeugung von emotionalen Comic-Geschichten, bei denen die Nutzer ihre Emotionen ausdrücken oder eine Geschichte durch Sprach- oder Texteingabe erzählen können.

Neueste AI-Ressourcen

vor 4 Wochen

08.5K

1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - AI-Business-Assistent von Alis 1688-Plattform

1688 AI Version ist eine intelligente Business-Assistent-Anwendung, die von der 1688-Plattform von Alibaba eingeführt wurde und für kleine B-Käufer und -Händler konzipiert ist. Basierend auf den massiven Daten der 1688 Plattform, bietet die Anwendung Geschäftsmöglichkeiten Push, Produktempfehlung, Ideengenerierung, Unternehmensabfrage und andere Funktionen, um Benutzer genau zu erfassen die Marktdynamik, schnell...

Neueste AI-Ressourcen

vor 4 Wochen

08.4K

阶跃深研 - 阶跃星辰推出的AI深入研究工具

Steps Deep Research - AI Deep Research Tool von Steps Star

Step Deep Research ist ein effizientes KI-Recherchetool von Step Star, das in der Lage ist, selbstständig komplexe Sachverhalte zu recherchieren und in kurzer Zeit professionelle Berichte zu erstellen. Das Tool wurde für die Bereiche Finanzen, Beratung, Gesundheitswesen, Recht und andere Bereiche entwickelt und hat sich in Branchenrezensionen durch seine tiefgreifenden Such- und Informationsintegrationsfunktionen hervorgetan.

Neueste AI-Ressourcen

vor 4 Wochen

08.5K

Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - Neues AI-Videobearbeitungsmodell von Runway

Runway Aleph ist ein fortschrittliches KI-Videobearbeitungsmodell, das von Runway auf den Markt gebracht wurde. Es basiert auf einfachen Textbefehlen zum schnellen Hinzufügen und Löschen von Videoinhalten, zur Änderung des Stils, zur Anpassung der Umgebung und zur Optimierung der Kamerabewegung. Benutzer können leicht überflüssige Elemente entfernen, Szenen ohne komplexe Operationen ändern...

Neueste AI-Ressourcen

vor 1 Monat

09.8K

WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Ali Tongyi Open-Source-KI-Trainingsdaten-Synthese-System

WebShaper ist ein System zur Synthese von KI-Trainingsdaten, das vom Tongyi Lab von Alibaba entwickelt wurde. Es erzeugt qualitativ hochwertige und skalierbare Trainingsdaten auf der Grundlage von formalen Modellierungs- und Intelligenzerweiterungsmechanismen, die KI-Intelligenzen dabei helfen, ihre komplexen Informationsbeschaffungsfähigkeiten zu verbessern. Das System führt das Konzept der "Wissensprojektion" ein...

Neueste AI-Ressourcen

vor 1 Monat

09.8K

Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型

Skywork UniPic - Ein Open Source Multimodal Unified Pre-Training Modell von KunlunWei

Skywork UniPic ist ein Open-Source-multimodale Pre-Training-Modell von KunlunWanwei, mit drei Kernfunktionen: Bild Verständnis, Text Generation Bild und Bildbearbeitung. Das Modell basiert auf einer autoregressiven Architektur mit MAR-Encoder und SigLIP2-Backbone, mit 1,5B-Parameter-Gauge...

Neueste AI-Ressourcen

vor 1 Monat

010K

ChatGPT Study - OpenAI推出的创新学习模式

ChatGPT-Studie - Ein innovatives Lernmodell, vorgestellt von OpenAI

ChatGPT Study ist ein innovatives Lernmodell von OpenAI, das den Nutzern hilft, effizienter zu lernen und zu verstehen. ChatGPT Study leitet die Nutzer an, aktiv zu denken und Probleme Schritt für Schritt durch sokratische Fragen, unterstützte Antworten und personalisierte...

Neueste AI-Ressourcen

vor 1 Monat

09.3K

通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - Open-Source-KI-Videogenerierungsmodell von Ali

Tongyi Wanphase Wan2.2 ist ein fortschrittliches KI-Modell zur Videogenerierung, das von Alibaba mit insgesamt 27 Milliarden Referenzen freigegeben wurde. Das Modell enthält drei Modi: textgeneriertes Video, graphgeneriertes Video und einheitliche Videogenerierung, die qualitativ hochwertige Videos auf der Grundlage von Textbeschreibungen, Bildern oder einer Kombination aus beidem generieren können.

Neueste AI-Ressourcen

vor 1 Monat

011.8K

GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - Smart Spectrum Open Source SOTA Modell für Reasoning, Code und Intelligenz

GLM-4.5 ist ein quelloffenes SOTA-Modell von Smart Spectrum, das für Anwendungen im Bereich der intelligenten Karosserie entwickelt wurde und Argumentation, Codegenerierung und intelligente Karosseriefunktionen umfasst. Das Modell basiert auf der Mixed Expert (MoE) Architektur und enthält zwei Versionen, GLM-4.5 mit 355 Milliarden Parametern und 106 Milliarden...

Neueste AI-Ressourcen

vor 1 Monat

010.5K

Coze Studio - 字节跳动推出的开源AI Agent开发平台

Coze Studio - Open Source AI Agent Entwicklungsplattform von ByteDance

Coze Studio ist die Open-Source-Entwicklungsplattform von ByteDance für AI Intelligent Body, die Entwicklern die Erstellung, den Einsatz und die Verwaltung von AI-Anwendungen erleichtert.

Neueste AI-Ressourcen

vor 1 Monat

011.1K

Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - Byte Coze Open Source AI Agent Entwicklungs- und Debugging-Plattform

Coze Loop ist die Open-Source-KI-Intelligenz-Entwicklungs-, Betriebs- und Wartungsmanagement-Plattform der Coze-Plattform von ByteDance. Die Plattform bietet Entwicklern ein komplettes Lebenszyklusmanagement von der Entwicklung über die Fehlersuche bis hin zur Bewertung und Überwachung, einschließlich Cue-Word-Engineering, Bewertung des Agenteneffekts, Leistungsüberwachung und -optimierung...

Neueste AI-Ressourcen

vor 1 Monat

010.8K

悟能 - 商汤科技最新推出的具身智能平台

Wuneng - die neueste Body Intelligence Plattform von Shangtang Technology

Wuneng ist eine Plattform für verkörperte Intelligenz, die für Roboter und intelligente Geräte entwickelt wurde. Basierend auf dem "Enlightened"-Weltmodell und der multimodalen Big-Model-Technologie integriert Wuneng Multi-Sensor-Eingaben wie Sehen, Sprache, Berührung usw. und verfügt über leistungsstarke Wahrnehmungs-, Entscheidungs- und Handlungsfähigkeiten.

Neueste AI-Ressourcen

vor 1 Monat

09.7K

Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - Quelloffene wissenschaftliche multimodale Makromodelle vom Shanghai AI Lab

Intern-S1 ist ein wissenschaftliches multimodales Großmodell, das vom Shanghai Artificial Intelligence Laboratory entwickelt wurde. Das Modell integriert linguistische und multimodale Fähigkeiten und verfügt über leistungsstarke Funktionen wie crossmodales wissenschaftliches Parsing, linguistische und visuelle Fusion, wissenschaftliche Datenverarbeitung, Beantwortung wissenschaftlicher Fragen, Versuchsplanung und Optimierung.

Neueste AI-Ressourcen

vor 1 Monat

010K

混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型

Hybrid 3D World Model 1.0 - Tencents Open-Source-Modell zur Erzeugung von 3D-Welten

Hunyuan 3D Weltmodell 1.0 (Hunyuan World 1.0) ist Tencent's erstes immersives, interaktives Modell zur Erzeugung von Simulationswelten, das in der Industrie als Open Source verfügbar ist. Das Modell integriert panoramische visuelle Generierung und hierarchische 3D-Rekonstruktionstechnologie zur Unterstützung von Text- oder Bildeingaben, um schnell 36...

Neueste AI-Ressourcen

vor 1 Monat

09.3K

日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

Day by Day V6.5 - Das neueste multimodale Inferenz-Makromodell von ShangTech

Day by Day V6.5 ist ein fortschrittliches multimodales Inferenz-Makromodell von ShangTech, das für gemischte Bild- und Texteingaben entwickelt wurde. Es unterstützt das genaue Verständnis von Bildinhalten und die Erstellung von Beschreibungen oder die Beantwortung von Fragen in Kombination mit Text.

Neueste AI-Ressourcen

vor 1 Monat

08.6K

Opal - 谷歌推出的AI工作流创建平台

Opal - KI-Plattform zur Erstellung von Arbeitsabläufen von Google

Opal ist eine innovative KI-Applet-Generierungsplattform von Google Labs, mit der Nutzer schnell KI-Apps erstellen und weitergeben können, ohne Code schreiben zu müssen.Opal macht es den Nutzern leicht, Prompts, Modellaufrufe und Tools zu...

Neueste AI-Ressourcen

vor 1 Monat

010K

Qwen-MT - 阿里通义推出的机器翻译模型

Qwen-MT - Ein Modell für maschinelle Übersetzung, vorgestellt von Ali Tongyi

Qwen-MT ist ein hochmodernes Qwen-MT - ein maschinelles Übersetzungsmodell, das vom Ali Tongyi Thousand Questions Team entwickelt wurde und auf der leistungsstarken Qwen3-Architektur basiert. Es unterstützt die Inter-Übersetzung von 92 Sprachen und deckt eine globale Population von mehr als 95% ab. Das Modell basiert auf dem leichtgewichtigen MoE ...

Neueste AI-Ressourcen

vor 1 Monat

09.6K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Ein großes Modell für die Finanzwissenschaft von Anthem Digital

Agentar-Fin-R1 ist ein hochmodernes Großsprachenmodell für den Finanzbereich, das von Anthem eingeführt wurde. Das Modell wurde auf der Grundlage der leistungsstarken Qwen3-Architektur entwickelt und verfügt über zwei Parameterskalenversionen, 8B und 32B, und kann komplexe Finanzberechnungsaufgaben, einschließlich mehrstufiger Analysen, Risikobewertungen und War...

Neueste AI-Ressourcen

vor 1 Monat

08.9K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - Open Source KI-Programmierassistent für Unternehmen

MonkeyCode ist ein quelloffener, unternehmenstauglicher, nativer KI-Programmierassistent, der für datenschutz- und sicherheitsbewusste Entwicklungsteams entwickelt wurde. MonkeyCode unterstützt die private Bereitstellung und Offline-Nutzung, um die Sicherheit von Codedaten zu gewährleisten. MonkeyCode unterstützt die private Bereitstellung und die Offline-Nutzung, um die Sicherheit der Codedaten zu gewährleisten...

Neueste AI-Ressourcen

vor 1 Monat

09.9K

Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - Ein Simultandolmetschermodell von ByteHop!

Seed LiveInterpret 2.0 ist ein hochmodernes Simultandolmetschermodell, das vom Seed-Team von ByteDance auf den Markt gebracht wurde und Zwei-Wege-Übersetzungen zwischen Chinesisch und Englisch unterstützt. Das Modell verfügt über eine realitätsnahe Übersetzungsgenauigkeit und eine extrem niedrige Latenz, mit einer durchschnittlichen Sprache-zu-Sprache-Verzögerung von nur 2 bis 3 Sekunden, die viel niedriger ist als die von...

Neueste AI-Ressourcen

vor 1 Monat

07.9K

Excel MCP Server - 基于MCP的AI Excel处理工具

Excel MCP Server - MCP-basiertes AI Excel-Verarbeitungswerkzeug

Excel MCP Server ist ein Model Context Protocol (MCP)-basiertes Server-Tool zur Bearbeitung von Excel-Dateien, ohne dass Microsoft Excel installiert werden muss...

Neueste AI-Ressourcen

vor 1 Monat

011.4K

ChatFlow - 开源AI工作流自动化工具

ChatFlow - Open-Source-KI-Werkzeug zur Workflow-Automatisierung

ChatFlow ist ein Open-Source-KI-Workflow-Automatisierungswerkzeug, das die Umwandlung komplexer Anforderungen in effiziente Workflows unterstützt. Werkzeuge, die auf KI-Technologie basieren, helfen Nutzern, schnell Code-Frameworks und Testfälle zu generieren, und können beim Schreiben und Entwerfen von Software-Architekturen helfen.

Neueste AI-Ressourcen

vor 1 Monat

09.4K

Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - KI-Musikgenerierungsmodelle von Quintessence

Mureka V7 ist ein fortschrittliches KI-Musikgenerierungsmodell, das von Kunlun World Wide eingeführt wurde. Das Modell basiert auf der MusiCoT-Technologie, die die Planung der Gesamtstruktur der Musik unterstützt, bevor sie die Details ausfüllt, um kohärentere und künstlerische Musikwerke zu erzeugen.

Neueste AI-Ressourcen

vor 1 Monat

08.2K

Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - Allzweck-Robotermodell vom Wordpress Seed Team

Seed GR-3 ist ein von ByteDance eingeführtes Allzweck-Robotikmodell mit starken Generalisierungsfähigkeiten zur Anpassung an neue Umgebungen und komplexe Befehle. Das Modell fusioniert visuelle, verbale und Bewegungsinformationen und basiert auf einer Drei-in-Eins-Trainingsmethode aus Roboterdaten, VR-Trajektorendaten von Menschen und öffentlichen Grafikdaten, um die Fähigkeit zu verbessern, auf neue Objekte zu reagieren...

Neueste AI-Ressourcen

vor 1 Monat

09.1K

Qwen3-Coder - 阿里通义千问开源的的代码生成模型

Qwen3-Coder - Ali Tongyi Qianqian Modell zur Erzeugung von Open-Source-Code

Qwen3-Coder ist ein hochmodernes Code-Generierungsmodell, das vom Ali Tongyi Qianqian-Team eingeführt wurde. Das Modell hat 480B Parameter und 35B Aktivierungsparameter, unterstützt native 256K Token-Kontexte und kann bis zu 1M Token skalieren.

Neueste AI-Ressourcen

vor 1 Monat

09.1K

OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型

OpenReasoning-Nemotron - Open-Source-Reihe von Reasoning-Modellen von NVIDIA

OpenReasoning-Nemotron ist eine Reihe von groß angelegten Sprachmodellen, die von NVIDIA zur Verfügung gestellt werden, um die Verarbeitung von logischen Aufgaben in Mathematik, Wissenschaft und Code zu unterstützen. Die Modelle werden auf der Grundlage des DeepSeek R1 0528 Modells mit Parameterskalen von 1,5B...

Neueste AI-Ressourcen

vor 1 Monat

08K

Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - Ein Open-Source-Modell für mehrsprachige Übersetzungen aus Wordpress

Seed-X ist ein vom Seed-Team von ByteDance entwickeltes mehrsprachiges Übersetzungsmodell mit 7 Milliarden Parametern, das Zwei-Wege-Übersetzungen in 28 Sprachen unterstützt. Das Modell kombiniert das Vortraining mehrsprachiger Daten, die Feinabstimmung von Befehlen und Techniken des Reinforcement Learning, um komplexe Sprachmuster effizient zu verarbeiten und die Übersetzungsqualität zu verbessern...

Neueste AI-Ressourcen

vor 1 Monat

011.6K

JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统

JoyAgent-JDGenie - Jingdong quelloffenes leichtgewichtiges allgemeines multiintelligentes Körpersystem

JoyAgent-JDGenie ist ein leichtgewichtiges Open-Source-Mehrzweck-Multi-Intelligenz-System, keine sekundäre Entwicklung kann direkt verwendet werden.JoyAgent-JDGenie kann komplexe Aufgaben bewältigen, wie z.B. die Erstellung von Berichten, die Analyse von Daten, usw., unterstützt eine Vielzahl von Lieferformaten, wie z.B. Webseiten, PPT ...

Neueste AI-Ressourcen

vor 1 Monat

010.6K

TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - KI-Automatisierter Entwicklungsassistent von Wordhop TRAE

TRAE SOLO ist ein automatischer KI-Entwicklungsassistent, der von TRAE, einem von ByteDance ins Leben gerufenen KI-Programmierassistenten, eingeführt wurde, um den Softwareentwicklungsprozess mit KI-Technologie zu vereinfachen.TRAE SOLO versteht die Bedürfnisse des Benutzers, unterstützt Textbeschreibungen, Sprachbefehle und Datei-Uploads zur Eingabe der Anforderungen und plant automatisch...

Neueste AI-Ressourcen

vor 1 Monat

013.3K