AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 970 Artikel

Tags: KI Open-Source-Projekte Seite 6

AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具-首席AI分享圈

AI-ClothingTryOn: Zwillingsbasiertes Tool zur virtuellen Anprobe von Kleidung

Allgemeine Einführung AI-ClothingTryOn ist eine Python-basierte Open-Source-Desktop-Anwendung, die vom Entwickler speedTD erstellt und auf GitHub gehostet wird. Sie nutzt die Technologie der künstlichen Intelligenz von Google Gemini, um es Nutzern zu ermöglichen, Fotos von Personen und Bildern von Kleidung hochzuladen, um virtuelle Anprobeeffekte zu erzeugen. Benutzer können...

OpenDeepSearch:支持智能推理的开源搜索工具-首席AI分享圈

OpenDeepSearch: ein Open-Source-Suchwerkzeug, das intelligente Schlussfolgerungen unterstützt

Allgemeine Einführung OpenDeepSearch ist ein Open-Source-Suchwerkzeug, das vom sentient-agi-Team entwickelt wurde. Es kombiniert Large Language Modelling (LLM) und Intelligent Reasoning Agents, um Nutzern die Möglichkeit zu geben, im Web nach Informationen zu suchen und auf einfache Weise genaue Antworten zu erhalten. Das Ziel dieses Tools ist es, die Suche offener zu gestalten...

Vibe Draw:将手绘草图转化为3D模型的创意工具-首席AI分享圈

Vibe Draw: ein kreatives Werkzeug, um handgezeichnete Skizzen in 3D-Modelle zu verwandeln

Allgemeine Einführung Vibe Draw ist ein von Martin Sit entwickeltes Open-Source-Projekt, mit dem Benutzer handgezeichnete Skizzen in wunderschöne 3D-Modelle verwandeln können. Das Ziel dieses Tools ist einfach: Es soll es für jeden einfach machen, 3D-Modelle zu erstellen, ohne dass große künstlerische Fähigkeiten oder komplexe Software erforderlich sind. Es nutzt die Technologie der künstlichen Intelligenz...

FlowGram.AI:快速创建节点式工作流的开源引擎-首席AI分享圈

FlowGram.AI: Eine Open-Source-Engine zur schnellen Erstellung nodaler Workflows

Umfassende Einführung Flowgram.ai ist eine von ByteDance entwickelte Open-Source-Engine zur Erstellung von Prozessen. Es basiert auf der Bearbeitung von Knoten, um Entwicklern zu helfen, schnell Workflows zu erstellen, Unterstützung für festes Layout und freie Verknüpfung zwei Modi. Das Projekt ist in TypeScript geschrieben, der Code ist auf GitHub gehostet, quelloffen und frei...

Qwen2.5-Omni:多模态输入和实时语音交互的端测模型-首席AI分享圈

Qwen2.5-Omni: ein Endmessungsmodell für multimodale Eingabe und Sprachinteraktion in Echtzeit

Umfassende Einführung Qwen2.5-Omni ist ein Open-Source-Modell für multimodale KI, das vom Alibaba Cloud Qwen-Team entwickelt wurde. Es kann mehrere Eingaben wie Text, Bilder, Audio und Video verarbeiten und Antworten in Text oder natürlicher Sprache in Echtzeit erzeugen. Das Modell wurde am 26. März 2025 veröffentlicht, und der Code und die Modelldateien sind...

Dify-Plus:为Dify开发的企业内部管理后台-首席AI分享圈

Dify-Plus: ein lokales Management-Backend für Dify

Umfassende Einführung Dify-Plus ist eine KI-Anwendungsentwicklungsplattform, die auf der Sekundärentwicklung des Open-Source-Projekts Dify basiert. Sie fügt ein neues, auf Dify basierendes Verwaltungszentrum hinzu und optimiert die Funktionalität für Unternehmensszenarien. Das Projekt war zunächst für den unternehmensinternen Gebrauch, und später festgestellt, dass die Gemeinschaft hat ähnliche Bedürfnisse, dann Open-Source-Sharing.Dify-Plus...

Rankify:支持信息检索与重排序的Python工具包-首席AI分享圈

Rankify: ein Python-Toolkit, das die Suche und Neuordnung von Informationen unterstützt

Allgemeine Einführung Rankify ist ein Open-Source-Python-Toolkit, das von der Data Science Group an der Universität Innsbruck entwickelt wurde. Es konzentriert sich auf Information Retrieval, Reordering und Retrieval Augmentation Generation (RAG) und bietet ein einheitliches Framework. Das Toolkit wird mit 40 vorbereiteten Benchmark-Datensätzen geliefert und unterstützt 7 Retrieval-Techniken...

CFG-Zero-star:提升图像和视频生成质量的开源工具-首席AI分享圈

CFG-Zero-star: ein Open-Source-Tool zur Verbesserung der Qualität der Bild- und Videoerzeugung

Allgemeine Einführung CFG-Zero-star ist ein Open-Source-Projekt, das von Weichen Fan und dem S-Lab-Team der Technologischen Universität Nanyang entwickelt wurde. Es konzentriert sich auf die Verbesserung der Classifier Free Guidance (CFG)-Technik in Stream-Matching-Modellen, um die Qualität der Bild- und Videoerzeugung durch die Optimierung der Guidance-Strategie und der Null-Initialisierungsmethoden zu verbessern....

Bonsai:适合边缘设备运行的三值权重语言模型-首席AI分享圈

Bonsai: Ein dreiwertiges gewichtetes Sprachmodell, das für den Einsatz auf Randgeräten geeignet ist

Allgemeine Einführung Bonsai ist ein von deepgrove-ai entwickeltes Open-Source-Sprachmodell mit einer Parametergröße von 500 Millionen, das ternäre Gewichte verwendet. Es basiert auf der Llama-Architektur und dem Mistral-Klassifikator, mit linearen Schichten, die zur Unterstützung ternärer Gewichte angepasst wurden. Das Modell verwendet hauptsächlich DCLM...

DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎-首席AI分享圈

DiffSynth-Engine: Open-Source-Engine für den Einsatz von FLUX mit geringem Umfang, Wan 2.1

Allgemeine Einführung DiffSynth-Engine ist ein Open-Source-Projekt, das von ModelScope ins Leben gerufen wurde und auf GitHub gehostet wird. Es basiert auf der Technologie der Diffusionsmodellierung und konzentriert sich auf die effiziente Erzeugung von Bildern und Videos, die für Entwickler geeignet sind, um KI-Modelle in Produktionsumgebungen einzusetzen. Das Projekt entwickelte sich aus DiffSynth-Studio,...

RF-DETR:实时视觉对象检测开源模型-首席AI分享圈

RF-DETR: ein Open-Source-Modell für die visuelle Objekterkennung in Echtzeit

Umfassende Einführung RF-DETR ist ein Open-Source-Objekterkennungsmodell, das vom Roboflow-Team entwickelt wurde. Es basiert auf der Transformer-Architektur und sein Hauptmerkmal ist die Echtzeit-Effizienz. Das Modell erreichte die erste Echtzeit-Erkennung von über 60 APs auf dem Microsoft COCO-Datensatz sowie eine hervorragende Leistung im RF100-VL-Benchmark,...

de_DEDeutsch