Insgesamt 480 Artikel

Tags: KI Open-Source-Projekte Seite 45

SadTalker: Fotos zum Sprechen bringen | Mouth Sync Audio | Synthesised Mouth Sync Video | Free Digital People

Allgemeine Einführung SadTalker ist ein Open-Source-Tool, das einzelne Porträtfotos und Audiodateien kombiniert, um realistische, sprechende Avatar-Videos für eine Vielzahl von Szenarien zu erstellen, z. B. für personalisierte Nachrichten, Bildungsinhalte und mehr. Revolutionärer Einsatz von 3D-Modellierungstechnologien wie ExpNet und PoseVAE, hervorragende...

2024-09-03KI-Tools KI-Open-Source-Projekt KI digitaler Mensch Lippensynchronisation

VideoReTalking: Audio-gesteuerte Lippensynchronisation und Videoschnitt-System - Chief AI Sharing Circle

VideoReTalking: Audio-gesteuertes Lippensynchronisations- und Videobearbeitungssystem

Allgemeine Einführung VideoReTalking ist ein innovatives System, das es dem Benutzer ermöglicht, lippensynchrone Gesichtsvideos auf der Grundlage des Eingangsaudios zu generieren, wobei qualitativ hochwertige und lippensynchrone Ausgangsvideos auch mit unterschiedlichen Emotionen erzeugt werden. Das System unterteilt dieses Ziel in drei aufeinander folgende Aufgaben: Erzeugung von Gesichtsvideos mit typischen Ausdrücken...

2024-09-02KI-Tools KI-Open-Source-Projekt Lippensynchronisation

MuseV+Muse Talk: Komplettes Digital Human Video Generation Framework | Portrait to Video | Gesture to Video | Lip Sync - Chief AI Sharing Circle

MuseV+Muse Talk: Komplettes Framework zur Erzeugung digitaler menschlicher Videos | Porträt zu Video | Pose zu Video | Lippensynchronisation

Allgemeine Einführung MuseV ist ein öffentliches Projekt auf GitHub, das die Erzeugung von Avatar-Videos von unbegrenzter Länge und hoher Wiedergabetreue ermöglichen soll. Es basiert auf Diffusionstechnologie und bietet verschiedene Funktionen wie Image2Video, Text2Image2Video, Video2Video und mehr. Bietet Modellstruktur, Anwendungsfälle, Schnellstart...

2024-09-02KI-Tools KI-Open-Source-Projekt KI digitaler Mensch Lippensynchronisation

Unstrukturiert: Open-Source-Vorverarbeitung unstrukturierter Dokumente, Tools zur Verarbeitung unstrukturierter Daten

Umfassende Einführung Unstructured-IO bietet eine Reihe von Open-Source-Komponenten für die Verarbeitung und Vorverarbeitung von Bildern und Textdokumenten wie PDF, HTML, Word-Dokumente, usw. Unstructured-IO bietet eine Reihe von Open-Source-Komponenten für die Verarbeitung und Vorverarbeitung von Bildern und Textdokumenten wie PDF, HTML, Word-Dokumente, usw. Sein Hauptziel ist es, Datenverarbeitungs-Workflows zu vereinfachen und zu optimieren, insbesondere für große Sprachmodell (LLM)-Anwendungen zu unterstützen.Unstructured...

2024-09-01KI-Tools KI-Open-Source-Projekt Extraktion und Reinigung von Dokumenten

magic-html: Extrahieren von Daten aus einer HTML-URL, Ausgabe von einfachem Text/Markdown

Allgemeine Einführung magic-html ist eine Python-Bibliothek, die den Prozess der Extraktion von Inhalten aus HTML vereinfachen soll. Egal, ob es sich um komplexe HTML-Strukturen oder einfache Webseiten handelt, diese Bibliothek zielt darauf ab, dem Benutzer eine bequeme und effiziente Schnittstelle zu bieten. Sie unterstützt die multimodale Extraktion, die Extraktion mehrerer Layouts und die...

2024-09-01KI-Tools KI-Open-Source-Projekt

WebPilot: Intelligentes Werkzeug zur Verarbeitung von Web-Informationen, kostenlose API für das Crawling von Web-Inhalten - Chief AI Sharing Circle

WebPilot: Intelligentes Werkzeug zur Verarbeitung von Webinformationen, kostenlose API für die Erfassung von Webinhalten

WebPilot Allgemeine Einführung Webpilot ist ein freier und quelloffener "Web-Assistent", der es Ihnen ermöglicht, frei mit jeder Webseite zu kommunizieren oder automatisierte Aufgaben auszuführen. Anstatt Seiten zu wechseln oder zu kopieren und einzufügen, wählen Sie einfach Text aus oder geben Befehle ein, und Webpilot versorgt Sie mit Echtzeit-Informationen und intelligenten...

2024-08-31KI-Tools AI Offene Dienste KI-Open-Source-Projekt KI-Suchwerkzeuge

DB-GPT: Aufbau eines Entwicklungsrahmens für KI-native Datenanwendungen, Integration von Multi-Modell-Management und intelligenter Datenverarbeitung - Chief AI Sharing Circle

DB-GPT: Aufbau eines Frameworks für die Entwicklung KI-nativer Datenanwendungen, das Multi-Modell-Management und intelligente Datenverarbeitung integriert

Umfassende Einführung DB-GPT ist ein Open-Source-Framework zur Entwicklung nativer KI-Datenanwendungen, das auf AWEL (Agentic Workflow Expression Language) und Smart-Body-Technologien basiert. Das Projekt zielt darauf ab, eine Infrastruktur im Bereich großer Modelle aufzubauen, indem mehrere technische Fähigkeiten entwickelt werden, darunter ein Multi-Modell-Management-System (SMMF),...

2024-08-31KI-Tools KI-Open-Source-Projekt KI-Datenanalyse KI Intelligenz Wissensabfrage und der RAG-Rahmen

DreamTalk: Erzeugen Sie ausdrucksstarke Sprechvideos mit einem einzigen Avatarbild!

DreamTalk Umfassende Einführung DreamTalk ist ein von der Tsinghua Universität, der Alibaba Gruppe und der Huazhong Universität für Wissenschaft und Technologie gemeinsam entwickeltes, diffusionsmodellgesteuertes Framework zur Erzeugung von Sprechern. Es besteht hauptsächlich aus drei Teilen: einem Netzwerk zur Rauschunterdrückung, einem Lippenexperten und einem Stilprädiktor und kann eine Vielzahl von Audioeingaben auf der Grundlage von...

2024-08-31KI-Tools KI-Open-Source-Projekt KI digitaler Mensch Lippensynchronisation

GPT Crawler: Crawlen von Wissensdatenbankdateien von Websites zur Erstellung benutzerdefinierter GPTs - Chief AI Sharing Circle

GPT Crawler: Crawlen von Wissensdatenbank-Dokumenten von Websites zur Erstellung benutzerdefinierter GPTs

Allgemeine Einführung GPT Crawler ist ein Open-Source-Tool, mit dem Benutzer Wissensdateien erzeugen können, indem sie den Inhalt einer bestimmten Website crawlen, was wiederum maßgeschneiderte GPT-Modelle erzeugt. Das Projekt wird hauptsächlich zum Crawlen und Organisieren von Webinformationen verwendet und unterstützt die Ausführung über API und lokale Bereitstellung. Benutzer können den Crawler flexibel konfigurieren, um ihn an...

2024-08-31KI-Tools KI-Open-Source-Projekt

InstantID: Laden Sie ein Bild hoch und migrieren Sie die Porträtfunktionen, um Bilder in verschiedenen Stilen zu erzeugen - Chief AI Sharing Circle

InstantID: Laden Sie ein Bild hoch und migrieren Sie die Porträtfunktionen, um verschiedene Bildstile zu erzeugen.

Umfassende Einführung InstantID ist eine fortschrittliche Technologie, die darauf ausgerichtet ist, Bilder mit personalisierten Stilen oder Posen in Sekundenschnelle zu generieren und dabei ein hohes Maß an Wiedergabetreue anhand eines einzigen Referenz-ID-Bildes zu gewährleisten. Die Technologie verwendet eine auf einem Diffusionsmodell basierende Lösung, die Gesichtsbilder, Landmarkenbilder und...

2024-08-30KI-Tools AI Bildstil-Kontrolle KI-Open-Source-Projekt AI Face Swap und Verkleiden

vorhergehende Seite
1
---
42
43
44
45
46
47
48
nächste Seite
Insgesamt 48 Seiten