AI Personal Learning
und praktische Anleitung
Ali - bemalter Frosch
Insgesamt 764 Artikel

Tags: KI Open-Source-Projekte Seite 16

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht - Chief AI Sharing Circle

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, DeepFace, DeepID, ArcFace, Dlib, SFace...

SynthLight: Natürliches Licht-Rendering von Porträtbildern (unveröffentlicht) - Chief AI Sharing Circle

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

Allgemeine Beschreibung SynthLight ist ein Porträt-Relighting-Tool, das auf einem Diffusionsmodell basiert. Es lernt, synthetische Gesichtsbilder neu zu rendern, um Lichteffektanpassungen an reale Porträtfotos zu erreichen. Das Tool verwendet eine physikalische Rendering-Engine, um Datensätze zu erzeugen, die Lichttransformationen unter verschiedenen Beleuchtungsbedingungen simulieren....

1-2-1-MNVTON: Effiziente Bilder, Charaktere in Videos, um virtuell Kleidung anzuprobieren (noch zu öffnen) - Chief AI Sharing Circle

1-2-1-MNVTON: Effiziente Bilder, virtuelle Anprobe von Kleidung durch Personen in Videos (noch zu öffnen)

Allgemeine Einführung 1-2-1-MNVTON ist ein auf GitHub basierendes Open-Source-Projekt, das eine effiziente virtuelle Erprobung durch die Technologie "Modalitätsspezifische Normalisierung für virtuelle Erprobung" (MNVTON) anstrebt. Das Projekt löst das Problem des hohen Rechenaufwands bei herkömmlichen virtuellen Try-On-Techniken, indem es ...

Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und mehrere Stimmen

Allgemeine Einführung Kokoro-ONNX ist ein Open-Source-Tool für Text-to-Speech (TTS), das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, effiziente und schnelle Sprachsyntheselösungen bereitzustellen. Kokoro-ONNX unterstützt mehrere Sprachen, darunter Englisch, und plant die Unterstützung von Französisch, Japanisch, Koreanisch...

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell hochpräzise OCR-Chief AI Sharing Circle

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Umfassende Einführung Zerox ist ein Open-Source-Projekt entwickelt, um PDF, DOCX, Bilder und andere Dokumente in Markdown-Format durch visuelle Modelle zu konvertieren. Das Projekt wird von getomni-ai Team entwickelt, bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung.Zerox unterstützt Node und Python Programmiersprachen, ...

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration von Ollama Backend - Chief AI Sharing Circle

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

Allgemeine Beschreibung Charla ist eine endpunktbasierte Chat-Anwendung, die für den Dialog mit muttersprachlichen Modellen entwickelt wurde. Die Anwendung ist in das Ollama-Backend integriert, unterstützt kontextabhängige Dialoge und speichert Chatsitzungen als Markdown-Dateien. Benutzer können sie durch einfache Befehlszeilenoperationen starten und aktivieren...

MiniRAG: Vereinfachtes Retrieval Enhanced Generation Framework, Entity Graph Index ruft relevante Textblöcke ab - Chief AI Sharing Circle

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Hong Kong University Data Science Laboratory (HKUDS) entwickelt und konzentriert sich auf die Lösung des Small Language Model (SLM)...

Omni-RGPT: Multimodale große Modelle für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte - Chief AI Sharing Circle

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

Umfassende Einführung Omni-RGPT ist ein multimodales großes Sprachmodell, das das Verständnis von Bildern und Videos auf Regionsebene ermöglicht. Durch die Einführung der Token-Mark-Technik ist Omni-RGPT in der Lage, Zielregionen im visuellen Merkmalsraum zu markieren und diese Token direkt durch regionale Hinweise (z.B. Boxen oder Masken) einzubetten, während...

Bailing: ein Open-Source-Sprachdialog-Assistent mit niedriger Latenz, der natürliche Konversation und Kommunikation leicht ermöglicht - Chief AI Sharing Circle

Bailing: ein Open-Source-Sprachdialogassistent mit niedriger Latenz für natürliche Konversation und Kommunikation

Umfassende Einführung Bailing (Bailing) ist ein Open-Source-Sprachdialog-Assistent, der entwickelt wurde, um natürliche Unterhaltungen mit Benutzern durch Sprache zu führen. Das Projekt kombiniert Spracherkennung (ASR), Voice Activity Detection (VAD), Large Language Modelling (LLM) und Sprachsynthese (TTS) Technologien, um eine GPT-4o-ähnliche...

WikiChat: ein Chat-Tool zum Abrufen von Wissen anhand von Wikipedia-Daten - Chief AI Sharing Circle

WikiChat: ein Chat-Tool zum Abrufen von Wissen anhand von Wikipedia-Daten

Allgemeine Einführung WikiChat ist ein experimenteller Chatbot, der an der Stanford University entwickelt wurde und darauf abzielt, die Faktizität von großen Sprachmodellen zu verbessern, indem er Daten aus Wikipedia abruft. Große Sprachmodelle (wie ChatGPT und GPT-4) neigen dazu, Fehler zu machen, wenn es um aktuelle Informationen oder weniger populäre Themen geht.WikiCh...

AIEvo: Ein effizientes Framework für die Erstellung von kollaborativen Multi-Intelligenz-Anwendungen - Chief AI Sharing Circle

AIEvo: Ein effizientes Rahmenwerk für die Erstellung multiintelligenter kollaborativer Anwendungen

Allgemeine Einführung AIEvo ist das Open-Source-Multi-Agent-Framework der Ant Group, das für die effiziente Erstellung von Multi-Agent-Anwendungen entwickelt wurde. Das Framework folgt strikt dem SOP-Aufgabengraphen, um die Erfolgsrate bei der Ausführung komplexer Aufgaben zu verbessern und durch Feedback- und Überwachungsmechanismen eine hohe Flexibilität und Skalierbarkeit zu gewährleisten.AIEvo wurde in der internen Produktionsumgebung der Ant Group verifiziert ...

PPTAgent: automatische Erstellung und Auswertung von PPT-Präsentationen, Dokument zu PPT - Chief AI Sharing Circle

PPTAgent: automatische Erstellung und Auswertung von PPT-Präsentationen, Dokumente zu PPTs

Allgemeine Einführung PPTAgent ist ein innovatives System zur automatischen Erstellung von Präsentationen aus Dokumenten. Das System stützt sich auf die menschliche Herangehensweise an die Erstellung von Präsentationen und verwendet einen zweistufigen Prozess, um die Qualität des Inhalts und die visuelle Wirkung sicherzustellen. Darüber hinaus führt PPTAgent PPTEval ein, ein umfassendes Evaluierungssystem für die Erstellung von Präsentationen aus...

FlowiseAI: Aufbau einer Knoten-Drag-and-Drop-Schnittstelle für kundenspezifische LLM-Anwendungen - Chief AI Sharing Circle

FlowiseAI: Aufbau einer Knoten-Drag-and-Drop-Schnittstelle für benutzerdefinierte LLM-Anwendungen

Allgemeine Einführung FlowiseAI ist ein quelloffenes Low-Code-Tool, das Entwicklern helfen soll, benutzerdefinierte LLM-Anwendungen (Large Language Model) und KI-Agenten zu erstellen. Mit einer einfachen Drag-and-Drop-Schnittstelle können Benutzer schnell LLM-Anwendungen erstellen und iterieren, was den Prozess vom Testen bis zur Produktion effizienter macht....

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenz auf Basis von Whisper - Chief AI Sharing Circle

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenzzeit auf der Grundlage von Whisper

Allgemeine Einführung RealtimeSTT ist eine effiziente Echtzeit-Bibliothek für die Umwandlung von Sprache in Text mit geringer Latenz und fortschrittlicher Erkennung von Sprachaktivität und Aktivierung von Wachwörtern. Sie wurde von Kolja Beigel entwickelt, um Anwendungen zu unterstützen, die eine schnelle und genaue Sprache-zu-Text-Konvertierung benötigen. Ob Sie nun ein Sprachassistent sind oder eine...

SemHash: Schnelle Implementierung von semantischer Text-Deduplizierung zur Verbesserung der Effizienz der Datenbereinigung

Allgemeine Einführung SemHash ist ein leichtgewichtiges und flexibles Werkzeug für die Dataset-Deduplizierung durch semantische Ähnlichkeit. Es kombiniert die schnelle Einbettungsgenerierung von Model2Vec mit der effizienten ANN (Approximate Nearest Neighbour)-Ähnlichkeitssuche von Vicinity.SemHash unterstützt die Deduplizierung einzelner Datensätze (z.B. Bereinigung von...

Cognita: ein Open-Source-Framework zum Aufbau modularer RAG-Anwendungen und zum schnellen Testen verschiedener RAG-Strategien - Chief AI Sharing Circle

Cognita: ein Open-Source-Framework zur Erstellung modularer RAG-Anwendungen und zum schnellen Testen verschiedener RAG-Strategien

Umfassende Einführung Cognita ist ein Open-Source-Framework, das von TrueFoundry entwickelt wurde, um die Entwicklung von RAG (Retrieval-Augmented Generation) basierten Anwendungen zu vereinfachen. Das Framework bietet eine strukturierte, modulare Lösung, die es einfach macht, die RAG-Technologie vom Prototypenstadium in die Produktion zu überführen...

BotSharp: .NET-basierte Multi-Intelligenz-Körper AI sollte Entwicklung und Management-Plattform - Chief AI Sharing Circle

BotSharp: eine .NET-basierte Multi-Intelligenz-KI-Plattform zur Entwicklung und Verwaltung

Umfassende Einführung BotSharp ist ein auf .NET Core basierendes Open-Source-Projekt, das ein umfassendes Tool zur Erstellung einer KI-Chatbot-Plattform bereitstellt. Es verwendet C#-Programmierung, unterstützt plattformübergreifenden Betrieb und zielt darauf ab, die Anwendung von Algorithmen für maschinelles Lernen zu vereinfachen, so dass Entwickler auf Unternehmensebene KI effizient in Geschäftssysteme integrieren können...

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)