AI Personal Learning
und praktische Anleitung
讯飞绘镜
Insgesamt 61 Artikel

Tags: ai digital Menschen Seite 2

AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端-首席AI分享圈

AIGCPanel: Open-Source-Klon des digital man-Integrationssystems, Bereitstellung des kostenlosen digital man-Clients mit einem Klick

Umfassende Einführung AigcPanel ist ein One-Stop AI Digital Human Production System für alle Benutzer, entwickelt mit electron+vue3+typescript Technologie Stack, unterstützt One-Click Deployment auf Windows-Systemen. Das System ist so konzipiert, dass es im Kern benutzerfreundlich ist, so dass auch Benutzer mit einer schwachen technischen Grundlage es leicht beherrschen können. Hauptmerkmale ...

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频-首席AI分享圈

Sonic: Audio-gesteuerte Porträtbilder erzeugen digitale Demo-Videos mit lebendiger Mimik

Allgemeine Einführung Sonic ist eine innovative Plattform, die sich auf die globale Audiowahrnehmung konzentriert und darauf ausgelegt ist, lebendige Porträtanimationen zu erzeugen, die durch Audio gesteuert werden. Die von einem Forscherteam von Tencent und der Universität Zhejiang entwickelte Plattform nutzt Audioinformationen zur Steuerung von Gesichtsausdrücken und Kopfbewegungen, um natürliche und flüssige Animationsvideos zu erzeugen....

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频-首席AI分享圈

EMO: Erstellen Sie hochwertige Porträtvideos auf der Grundlage von Porträtbildern und menschlicher Stimme.

Umfassende Einführung YUE Portrait EMO ist ein hochwertiges Tool zur Erzeugung von dynamischen Porträtvideos, das von der großen Aliyun-Model-Serviceplattform Hundred Refine (Model Studio) bereitgestellt wird. Das Tool basiert auf Porträtbildern und Audiodateien mit menschlicher Stimme, um realistische dynamische Porträtvideos zu erzeugen. YUE Portrait EMO enthält zwei unabhängige Modi...

DH live: KI-Digitalmenschen mit reibungsloser Echtzeit-Interaktion auf Grafikkarten der Serie 30/40

Allgemeine Einführung DH_live ist ein Echtzeit-Live-Projekt für digitale Menschen, das auf beispiellosem Lernen basiert und darauf abzielt, den Benutzern ein reibungsloses und interaktives Live-Streaming-Erlebnis zu bieten. Das Projekt unterstützt NVIDIA-Grafikkarten der Serien 30 und 40 und ist in der Lage, in Echtzeit mit 25+ fps zu laufen. Benutzer können in einfachen Schritten digitale Bilder erstellen und verwenden...

如影AI视频合成:生成AI视频,提供数字人直播服务-首席AI分享圈

Ruyi AI Video Compositing: Erstellung von AI-Videos und Bereitstellung von Live-Diensten für digitale Menschen

Ruying AI Video Synthesis ist eine Plattform zur Erzeugung von KI-Videos, die von Shanghai Yuyi Technology Co. Die Plattform stützt sich auf die "SenseNova" große Modell Fähigkeit von SenseNova, bietet eine Vielzahl von digitalen menschlichen Bild und Ton Optionen, Benutzer müssen nur den Text eingeben, um realistische AI Video zu erzeugen. Diese...

蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)-首席AI分享圈

Cicada Mirror: Plattform zur Erstellung digitaler Menschenvideos mit Hunderten von digitalen Menschenvorlagen und Klonen von exklusiven digitalen Menschenbildern (kostenpflichtig)

Allgemeine Einführung Cicada ist eine Plattform, die sich auf die Erstellung digitaler menschlicher Videos konzentriert und KI-Technologie zur Vereinfachung des Videoproduktionsprozesses einsetzt. Benutzer können verschiedene digitale menschliche Bilder auswählen, Texte eingeben und Videos mit mehrsprachiger Synchronisation erstellen. Die Plattform bietet eine reichhaltige Bibliothek von Vorlagen und Materialien, die für eine Vielzahl von Bereichen wie Werbung und Marketing, Bildung und Ausbildung geeignet sind...

EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)-首席AI分享圈

EchoMimic: Audiogestützte Porträts zur Erzeugung sprechender Videos (EchoMimicV2 beschleunigtes Installationsprogramm)

Allgemeine Einführung EchoMimic ist ein Open-Source-Projekt zur Erzeugung realistischer Porträtanimationen durch audiogesteuerte Generierung. Das von der Ant Group's Terminal Technologies Division entwickelte Projekt erzeugt dynamische Porträtvideos unter Verwendung editierbarer Markerbedingungen, die Audio- und Gesichtsmarkerpunkte kombinieren.

VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案-首席AI分享圈

VideoChat: sprachinteraktive digitale Person in Echtzeit mit benutzerdefinierten Bild- und Tonklonen, die End-to-End-Sprachlösungen und kaskadierende Lösungen unterstützen

Umfassende Einführung VideoChat ist ein auf Open-Source-Technologie basierendes Projekt zur Echtzeit-Sprachinteraktion mit digitalen Menschen, das sowohl End-to-End-Sprachschemata (GLM-4-Voice - THG) als auch Kaskadenschemata (ASR-LLM-TTS-THG) unterstützt. Das Projekt ermöglicht es Benutzern, das Bild und die Klangfarbe des digitalen Menschen anzupassen und unterstützt das Klonen von Klangfarben und Lippensynchronisation...

Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)-首席AI分享圈

Hallo2: Audio-gesteuerte Erzeugung von lippensynchronen/ausdrucks-synchronen Portraitvideos (Ein-Klick-Installation für Windows)

Allgemeine Einführung Hallo2 ist ein Open-Source-Projekt, das gemeinsam von der Fudan-Universität und Baidu entwickelt wurde, um hochauflösende Porträtanimationen durch audiogesteuerte Generierung zu erzeugen. Das Projekt nutzt fortschrittliche Generative Adversarial Networks (GAN) und Time-Alignment-Techniken, um eine 4K-Auflösung und eine Videolänge von bis zu 1 Stunde zu erreichen....

UltraLight Digital Human:开源端侧实时运行的超轻量级数字人,附一键安装包-首席AI分享圈

UltraLight Digital Human: quelloffenes, endseitig in Echtzeit laufendes, ultraleichtes Digital Human mit Ein-Klick-Installationspaket

Allgemeine Einführung Ultralight Digital Human ist ein Open-Source-Projekt zur Entwicklung eines ultraleichten digitalen Menschenmodells, das in Echtzeit auf mobilen Geräten laufen kann. Das Projekt durch die Optimierung von Algorithmen und Modellstruktur zu erreichen reibungslosen Betrieb auf mobilen Geräten, geeignet für soziale Anwendungen, Spiele und virtuelle ...

TalkingAvatar:创建和编辑AI虚拟形象视频平台,基于本地算力Windows客户端-首席AI分享圈

TalkingAvatar: KI-Avatar-Videoplattform zur Erstellung und Bearbeitung von KI-Avataren, basierend auf dem nativen arithmetischen Windows-Client

Allgemeine Einführung TalkingAvatar ist eine führende KI-Avatar-Plattform, die eine komplette KI-Lösung für digitale Personen bietet. Sie bietet Nutzern eine revolutionäre Möglichkeit, Videoinhalte zu erstellen, zu bearbeiten und zu personalisieren. Mit fortschrittlicher KI-Technologie können Nutzer Videos einfach umschreiben, Stimmen klonen, Lippen synchronisieren und...

RenderNet:锁定面部特征,创建人物一致性的图像、视频运镜到口播视频-首席AI分享圈

RenderNet: Erkennung von Gesichtsmerkmalen zur Erstellung charakterkonsistenter Bilder, Video-Dribbling zu gesprochenem Wort in Videos

Allgemeine Einführung RenderNet ist ein Generator-Tool, das sich auf die Erstellung von Bildern und Videos konzentriert, die die Konsistenz der Charaktere auf der Grundlage der Technologie der künstlichen Intelligenz beibehalten. Benutzer können mit einfachen Texteingaben charaktergesteuerte Bilder und Videos erzeugen. Das Tool unterstützt eine breite Palette von Bild- und Videoerstellungsoptionen, und Benutzer können ihre eigenen...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO: ein Werkzeug für sprachgenerierte koordinierte Gestenportraits eines digitalen Ganzkörpermenschen

Allgemeine Einführung TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) ist ein von der Universität Tokio und CyberAgent AI Labs entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprach-Gesten-Videos Ein von der Universität Tokio und CyberAgent AI Lab gemeinsam entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprachgestenvideos. Die ...

即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频-首席AI分享圈

Das ist zu schaffen: unter Berufung auf eine riesige Maschine zu generieren E-Commerce-Marketing-Materialien, die rasche Freigabe von Produkten geeignet für bibbernde Stimme Förderung der Erläuterung der Video

Einführung von Instant Creation Instant Creation ist eine intelligente Produktions- und Verwaltungsplattform aus einer Hand, die von Jitterbug ins Leben gerufen wurde und darauf abzielt, effiziente, bequeme und professionelle Dienste zur Erstellung von Inhalten für Kreative anzubieten. Die Plattform integriert eine Vielzahl von KI-Funktionen, wie z. B. intelligentes Filmen, KI-Videoskripte, Grafik-Tools, Merchandise-Card-Tools, KI-Live-Hintergründe, KI-Live-Skripte...

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: Fotos zum Sprechen bringen | Mouth Sync Audio | Synthesised Mouth Sync Video | Free Digital People

Allgemeine Einführung SadTalker ist ein Open-Source-Tool, das einzelne Porträtfotos und Audiodateien kombiniert, um realistische Videos mit sprechenden Köpfen für eine Vielzahl von Szenarien zu erstellen, z. B. für personalisierte Nachrichten, Bildungsinhalte und mehr. Der revolutionäre Einsatz von 3D-Modellierungstechnologien wie ExpNet und PoseVAE zeichnet sich durch die Erfassung der subtilen Facetten...

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步-首席AI分享圈

MuseV+Muse Talk: Komplettes digitales menschliches Videogenerierungs-Framework | Portrait zu Video | Pose zu Video | Lippensynchronisation

Allgemeine Einführung MuseV ist ein öffentliches Projekt auf GitHub, das die Erzeugung von Avatar-Videos von unbegrenzter Länge und hoher Wiedergabetreue ermöglichen soll. Es basiert auf Diffusionstechnologie und bietet Image2Video, Text2Image2Video, Video2Video und viele andere Funktionen. Bietet Modellstruktur, Anwendungsfälle, Schnellstart...

de_DEDeutsch