AI Personal Learning
und praktische Anleitung
TRAE
Insgesamt 970 Artikel

Tags: KI Open-Source-Projekte Seite 26

Repomix:打包代码库为一个文本文件以便大模型检索-首席AI分享圈

Repomix: Verpackung der Code-Basis in eine Textdatei für den Abruf großer Modelle

Allgemeine Einführung Repomix (früher bekannt als Repopack) ist ein Open-Source-Tool, das entwickelt wurde, um eine gesamte Codebasis in eine einzige, KI-freundliche Datei zu packen. Mit diesem Tool können Entwickler ihre Codebasis auf einfache Weise großen Sprachmodellen (wie Claude, ChatGPT und Gemini) zur Analyse und Verarbeitung zur Verfügung stellen...

Yek:读取git仓库文本文件并快速分块,以供大模型使用-首席AI分享圈

Yek: Lesen von Textdateien aus dem Git-Repository und schnelles Chunking für große Modelle

Allgemeine Einführung Yek ist ein schnelles Rust-basiertes Werkzeug zum Lesen von Textdateien aus Repositories oder Verzeichnissen, zum Chunking und zur Serialisierung für die Verwendung in Large Language Models (LLMs). Das Werkzeug verwendet standardmäßig die .gitignore-Regel, um nicht benötigte Dateien zu überspringen, und nutzt die Git-Historie, um wichtige Dateien zu ermitteln...

Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果-首席AI分享圈

Kheish: Multi-Rollen-Intelligenz, die den Output überprüft, validiert und formatiert, um qualitativ hochwertige Ergebnisse zu erzielen

Umfassende Einführung Kheish ist ein quelloffener Multi-Rollen-Agent, der für Large Language Modelling (LLM)-Aufgaben entwickelt wurde, die eine strukturierte, schrittweise Zusammenarbeit erfordern.Kheish ist mehr als nur ein einfacher Koordinator, er ist ein intelligenter Agent, der bei Bedarf Module anfordert,...

AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具-首席AI分享圈

AI ContentCraft: ein vielseitiges Tool zur Erstellung von KI-Inhalten für Kurzgeschichten, Dialogskripte, Voiceover und Grafiken

Allgemeine Beschreibung AI ContentCraft ist ein vielseitiges Tool für die Erstellung von Inhalten, das Texterstellung, Sprachsynthese, Bilderzeugung und vieles mehr integriert. Es hilft Erstellern, schnell Geschichten, Podcast-Skripte und begleitende Audio- und Videoinhalte zu erstellen. Das Tool unterstützt mehrere Sprachkonvertierungen, kann Inhalte im Stapel verarbeiten und ist extrem...

Unigraph:构建本地运行的知识图谱和个人搜索引擎-首席AI分享圈

Unigraph: Aufbau von lokal laufenden Wissensgraphen und persönlichen Suchmaschinen

Allgemeine Einführung Unigraph ist ein lokaler, universeller Wissensgraph und eine persönliche Suchmaschine, die Benutzern einen integrierten Arbeitsbereich zur Verwaltung und Suche einer Vielzahl von Daten in ihrem persönlichen Leben bieten soll. Mit Unigraph können Benutzer Daten aus verschiedenen Quellen in einen einheitlichen Wissensgraphen integrieren...

ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程-首席AI分享圈

ComfyUI disty Flow: Eine benutzerfreundliche Schnittstelle für ComfyUI zur Rationalisierung von Arbeitsabläufen

Allgemeine Einführung ComfyUI-disty-Flow ist ein benutzerdefinierter Knoten, der eine benutzerfreundliche Schnittstelle zu ComfyUI bietet. ComfyUI-disty-Flow soll die Ausführung von Workflows vereinfachen, indem es alternative Benutzeroberflächen zur Verfügung stellt, anstatt die Erstellung von Workflows zu ersetzen.ComfyUI-disty-Flow befindet sich derzeit in einem frühen Entwicklungsstadium,...

Shortest:AI自动化测试工具,使用自然语言进行端到端测试-首席AI分享圈

Shortest: ein KI-Tool für automatisierte Tests, das natürliche Sprache für End-to-End-Tests verwendet

Allgemeine Einführung Shortest ist ein KI-gestütztes End-to-End-Testframework in natürlicher Sprache, das vom Anti-Work-Team entwickelt wurde. Es basiert auf Playwright und unterstützt die GitHub-Integration und die Zwei-Faktor-Authentifizierung (2FA). Shortests Hauptmerkmal ist das Schreiben von Testfällen in natürlicher Sprache und die Verwendung von Anthropic Cl...

Midscene.js:用AI驱动浏览器自动化测试的开源插件-首席AI分享圈

Midscene.js: ein Open-Source-Plugin, das Browser-Automatisierungstests mit KI unterstützt

Allgemeine Einführung Midscene.js ist ein KI-gesteuertes Browser-Automatisierungstool, das in der Lage ist, Webseiten zu steuern, Assertions auszuführen und Daten durch natürlichsprachliche Befehle zu extrahieren. Es unterstützt Chrome-Erweiterungen, JavaScript-SDKs und YAML-Skripte und vereinfacht so das Schreiben und Warten von UI-Tests. Durch die Nutzung multimodaler großer ...

视频分析工具(Video Analyzer):分析视频内容并生成详细描述-首席AI分享圈

Video Analyzer: analysiert Videoinhalte und erstellt detaillierte Beschreibungen

Comprehensive Introduction Video Analyzer ist ein umfassendes Videoanalysetool, das Computer Vision, Audiotranskription und Techniken zur Verarbeitung natürlicher Sprache kombiniert, um detaillierte Beschreibungen von Videoinhalten zu erstellen. Das Tool extrahiert Schlüsselbilder aus dem Video, transkribiert den Audioinhalt und generiert natürlichsprachliche...

Unsloth:高效微调和训练大语言模型的开源工具-首席AI分享圈

Unsloth: ein Open-Source-Tool für die effiziente Feinabstimmung und das Training großer Sprachmodelle

Umfassende Einführung Unsloth ist ein Open-Source-Projekt, das effiziente Werkzeuge für die Feinabstimmung und das Training von Large Language Models (LLMs) bereitstellt. Das Projekt unterstützt eine breite Palette bekannter Modelle, darunter Llama, Mistral, Phi und Gemma usw. Die wichtigsten Merkmale von Unsloth sind die Fähigkeit, den Speicherverbrauch erheblich zu reduzieren und das Training zu beschleunigen...

MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库-首席AI分享圈

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

Umfassende Einführung MaxKB (Max Knowledge Base) ist ein Open-Source-Wissensdatenbank-Q&A-System, das auf großen Sprachmodellen und RAG (Retrieval Augmented Generation) basiert. Das System ist weit verbreitet in intelligenten Kundenservice, unternehmensinterne Wissensdatenbank, akademische Forschung und Bildung und andere Szenarien verwendet.MaxKB unterstützt direkte Upload-Dokumente oder automatisch crawlen in...

OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树-首席AI分享圈

OmniThink: ein Schreibrahmen für die Erstellung hochwertiger langer Aufsätze, die Suche nach externem Wissen und die anschließende Reflexion darüber sowie der schrittweise Aufbau eines Wissensbaums

Umfassende Einführung OmniThink ist ein innovatives Framework für maschinelles Schreiben, das entwickelt wurde, um qualitativ hochwertige, lange Artikel zu erstellen, indem es die iterative Erweiterung und Reflexion menschlicher kognitiver Prozesse nachahmt. Das Framework konzentriert sich darauf, die Grenzen des Wissens zu erweitern und Informationen zu generieren, die reichhaltig und tiefgründig sind.OmniThink generiert Artikel, indem es Umrisse und...

OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)-首席AI分享圈

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

Allgemeine Einführung OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-API von OpenAI verwendet werden kann, um multi-intelligente Körpersprachanwendungen zu erstellen. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt von OpenAI Swarm), das es Entwicklern ermöglicht, komplexe multi-intelligente Körpersprachsysteme in kurzer Zeit zu erstellen...

DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库-首席AI分享圈

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, DeepFace, DeepID, ArcFace, Dlib, SFace...

SynthLight:对肖像图像进行自然光照渲染(未发布)-首席AI分享圈

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

Allgemeine Beschreibung SynthLight ist ein Porträt-Relighting-Tool, das auf einem Diffusionsmodell basiert. Es lernt, synthetische Gesichtsbilder neu zu rendern, um die Anpassung von Lichteffekten an echte Porträtfotos zu ermöglichen. Das Tool verwendet eine physikalische Rendering-Engine, um Datensätze zu erzeugen, die Lichttransformationen unter verschiedenen Beleuchtungsbedingungen simulieren....

1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)-首席AI分享圈

1-2-1-MNVTON: Effiziente Bilder, virtuelle Anprobe von Kleidung durch Personen in Videos (noch zu öffnen)

Allgemeine Einführung 1-2-1-MNVTON ist ein auf GitHub basierendes Open-Source-Projekt, das eine effiziente virtuelle Erprobung durch die Technologie "Modalitätsspezifische Normalisierung für virtuelle Erprobung" (MNVTON) anstrebt. Das Projekt löst das Problem des hohen Rechenaufwands bei herkömmlichen virtuellen Try-On-Techniken, indem es ...

Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen

Allgemeine Einführung Kokoro-ONNX ist ein Open-Source-Tool für Text-to-Speech (TTS), das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, effiziente und schnelle Sprachsyntheselösungen bereitzustellen. Kokoro-ONNX unterstützt mehrere Sprachen, darunter Englisch, und plant die Unterstützung von Französisch, Japanisch, Koreanisch...

Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR-首席AI分享圈

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Umfassende Einführung Zerox ist ein Open-Source-Projekt entwickelt, um PDF, DOCX, Bilder und andere Dokumente in Markdown-Format durch visuelle Modelle zu konvertieren. Das Projekt wird von getomni-ai Team entwickelt, bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung.Zerox unterstützt Node und Python Programmiersprachen, ...

Charla:基于终端的极简AI聊天工具,本地集成Ollama后端-首席AI分享圈

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

Allgemeine Beschreibung Charla ist eine endpunktbasierte Chat-Anwendung, die für den Dialog mit muttersprachlichen Modellen entwickelt wurde. Die Anwendung ist in das Ollama-Backend integriert, unterstützt kontextabhängige Dialoge und speichert Chatsitzungen als Markdown-Dateien. Benutzer können sie durch einfache Befehlszeilenoperationen starten und aktivieren...

de_DEDeutsch