🚀 Einladung zum Erleben: Chinas erste KI-IDE Intelligente Programmiersoftware Trae Chinesische Version downloadDer DeepSeek-R1 und Doubao-pro sind unbegrenzt verfügbar!

Insgesamt 910 Artikel

Tags: KI Open-Source-Projekte Seite 44

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包-首席AI分享圈

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Beschreibung Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen und kann lokal mit einer vorkompilierten Anwendung auch ohne NVIDIA GPU ausgeführt werden. Es unterstützt...

2024-10-11AI-Tools AI Open-Source-Projekt AI-Stimmenklonen

StreamingT2V：从文本到长视频的动态且可扩展的生成技术-首席AI分享圈

StreamingT2V: Dynamische und skalierbare Generierung von Text zu langen Videos

Allgemeine Einführung StreamingT2V ist ein öffentliches Projekt, das vom Picsart AI-Forschungsteam entwickelt wurde und sich auf die Erzeugung kohärenter, dynamischer und skalierbarer langer Videos auf der Grundlage von Textbeschreibungen konzentriert. Diese Technologie verwendet einen fortschrittlichen autoregressiven Ansatz, der die zeitliche Konsistenz des Videos garantiert, eng mit dem Beschreibungstext übereinstimmt und eine hohe Bildqualität beibehält...

2024-10-10AI-Tools AI Open-Source-Projekt AI Text zu Video

Trae Chinese Version Erste Einladung zum Download: Unbegrenzte Nutzung von DeepSeek-R1 nach Registrierung!

Aktivieren Sie Builder intelligenten Programmiermodus, unbegrenzte Nutzung von DeepSeek-R1 und DeepSeek-V3, reibungslosere Erfahrung als die Übersee-Version. Geben Sie einfach die chinesischen Befehle, keine Programmierkenntnisse können auch Null-Schwelle, um ihre eigenen Anwendungen zu schreiben.

2025-04-03

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器-首席AI分享圈

Text2Video-Zero: Text-zu-Video-Nullbeispiel-Generator vom Picsart AI Research Team veröffentlicht

Allgemeine Einführung Text2Video-Zero ist eine offizielle Implementierung eines Text-zu-Video-Generators für GitHub, der vom Picsart AI Research Team entwickelt wurde. Das Projekt bietet eine neue Möglichkeit, Text-Cues zu verwenden, um Videos mit zeitlicher Konsistenz und korrekt verfolgten Text-Cues zu erzeugen. Das Team hat auch eine...

2024-10-10AI-Tools AI Open-Source-Projekt AI Text zu Video

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声-首席AI分享圈

Retrieval-basierte Sprachumwandlung WebUI: Ein Rahmenwerk für Retrieval-basierte Sprachumwandlung | Simulation realer Gesangsstimmen

Comprehensive Introduction Retrieval based Voice Conversion WebUI ist ein einfaches und leicht zu bedienendes VITS-basiertes Sprachkonvertierungs-Framework, das die Sprachkonvertierung zwischen beliebigen Sprechern ermöglicht, einschließlich Song-Covers und Sprachwechsel in Echtzeit. Es zeichnet sich durch eine geringe Latenzzeit, einen ausgezeichneten Stimmänderungseffekt, eine geringe Datenmenge und...

2024-10-10AI-Tools AI Open-Source-Projekt AI-Stimmenklonen

VoiceCraft: Open-Source-Null-Sample-Sprachklonierung und Text-to-Speech-Tool

Umfassende Einführung VoiceCraft ist ein Open-Source-Sprachbearbeitungs- und Null-Sample-Sprachsynthesewerkzeug, das auf dem Neural Codec-Sprachmodell basiert. Es verwendet eine innovative Methode zur Erzeugung kodierter Sequenzen, die das Einfügen, Löschen und Ersetzen bestehender Sprachsequenzen ermöglicht, um natürliche und kohärente bearbeitete Sprache zu erzeugen. Gleichzeitig ...

2024-10-09AI-Tools AI Open-Source-Projekt AI-Stimmenklonen

edge-tts: Text-to-Speech Python-Modul | Freier Text-to-Speech-Dienst

Allgemeine Beschreibung edge-tts ist ein Open-Source-Python-Modul, das es Benutzern ermöglicht, den Online-Text-to-Speech-Dienst von Microsoft Edge in Python-Code zu verwenden, ohne dass ein Microsoft Edge-Browser, ein Windows-Betriebssystem oder ein API-Schlüssel erforderlich ist. Ermöglicht die direkte Verwendung von edge-tts von der Kommandozeile und...

2024-10-09AI-Tools AI Open-Source-Projekt AI Text-to-Speech

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式-首席AI分享圈

CoAI.Dev (Chat Nio): B/C-Lösung aus einer Hand für KI-Aggregationsanwendungen mit flexibler Abrechnung und Unterstützung von Abonnementmodellen

Allgemeine Einführung CoAI.Dev (ehemals Chat Nio) ist eine Chat-Plattform, die mehrere KI-Modelle integriert und verteiltes Streaming, Bilderzeugung, geräteübergreifende Gesprächssynchronisation und -teilung unterstützt. Sie implementiert ein Abonnement- und Token-Abrechnungssystem, einen Schlüsseltransitservice und Unterstützung für mehrere Modelle und umfasst auch eine verbundene Suche und KI...

2024-10-07AI-Tools AI Side Hustle Geldverdienen Projekt AI Open-Source-Projekt AI-Lokalisierte Chat-App

ChatOllama：基于Nuxt 3和Ollama的本地实时聊天应用UI-首席AI分享圈

ChatOllama: Lokale Echtzeit-Chat-Anwendung UI basierend auf Nuxt 3 und Ollama

Umfassende Einführung ChatOllama ist ein quelloffenes Online-Chat-Anwendungsprojekt, das auf einem groß angelegten Sprachmodell (LLM) basiert, das zahlreiche Sprachmodelle und Wissensbasisverwaltung unterstützt. Benutzer können die Plattform für die Modellverwaltung (Listenanzeige, Download, Löschen), den Chat mit Modellen und andere Funktionen nutzen. Das Projekt verwendet das Nuxt 3 Framework ...

2024-10-07AI-Tools AI Open-Source-Projekt AI-Lokalisierte Chat-App Wissensabfrage und der RAG-Rahmen

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描-首席AI分享圈

MinerU: Extraktion und Konvertierung von PDF-Dokumenten in das multimodale Markdown-Format, Unterstützung von OCR-Scans für E-Books

Umfassende Einführung MinerU ist ein Open-Source-Tool zur Datenextraktion, das vom OpenDataLab-Team am Shanghai Artificial Intelligence Lab entwickelt wurde und sich auf die effiziente Extraktion von Inhalten aus komplexen PDF-Dokumenten, Webseiten und eBooks konzentriert. Es kann multimodale PDF-Dokumente, die Bilder, Formeln, Tabellen und andere Elemente enthalten, in einfach zu analysierende M...

2024-09-30AI-Tools AI Open-Source-Projekt OCR Extraktion und Reinigung von Dokumenten

DCT-Net: Ein Open-Source-Tool zur Umsetzung von Fotos und Videos in Anime-Stilistik

Umfassende Einführung DCT-Net ist ein Open-Source-Projekt, das von der DAMO Academy und dem Wang Xuan Institute of Computer Technology, Peking University, entwickelt wurde und auf die stilisierte Transformation von Bildern abzielt. Das Projekt nutzt Deep-Learning-Techniken mittels Domain-Calibrated Translation (DCT), um...

2024-09-30AI-Tools AI-Bildstilkontrolle AI Open-Source-Projekt AI Video Konvertierung Stil

Diffusers Image Outpaint：超强开源AI图像扩展工具，图像外绘（image outpainting）-首席AI分享圈

Diffusers Image Outpaint: superstarkes Open-Source-KI-Bilderweiterungstool, Bildübermalung (Image Outpainting)

Allgemeine Einführung Diffusers Image Outpaint ist ein leistungsstarkes AI-Bilderweiterungstool, das von Hugging Face-Community-Mitglied fffiloni entwickelt wurde. Das Tool verwendet fortschrittliche Diffusionsmodellierungstechniken, um ein Bild nahtlos zu erweitern (die Ränder des Bildes zu übermalen), um ein hochwertiges Bild zu erzeugen...

2024-09-29AI-Tools AI-Bildvergrößerung und -Wiederherstellung AI Open-Source-Projekt

Tap4 AI WebUI: Open-Source-Projekt für leichtgewichtige KI-Werkzeuge

Umfassende Einführung Tap4 AI WebUI ist ein Open-Source-leichte AI-Tool Navigation Website-Projekt , entworfen, um Benutzer leicht ihre eigenen AI-Tool-Katalog zu bauen. Das Projekt verwendet Next.js und Supabase Technologie-Stack, Unterstützung für mehrsprachige SEO-Optimierung, um AI-Tools Klassifizierung Filterung, Suche und detaillierte Anzeige-Funktionen ...

2024-09-29AI-Tools AI Side Hustle Geldverdienen Projekt AI Open-Source-Projekt

CodeFormer：图像与视频面部复原，老照片修复，提供一键部署版-首席AI分享圈

CodeFormer: Bild- und Video-Gesichtsrestaurierung, Wiederherstellung alter Fotos, bietet eine Ein-Klick-Bereitstellungsversion

CodeFormer Allgemeine Einführung CodeFormer ist eine Codebasis für die robuste blinde Gesichtsreparatur, die von einem Forscherteam am S-Lab der Nanyang Technological University entwickelt und auf der NeurIPS 2022 vorgestellt wurde. Das Projekt nutzt die Codebook Lookup Transformer-Technologie, die darauf abzielt, die...

2024-09-25AI-Tools AI Side Hustle Geldverdienen Projekt AI-Bildvergrößerung und -Wiederherstellung AI Open-Source-Projekt

GFPGAN: Tencents Open-Source-Algorithmus zur Gesichtsreparatur

Umfassende Einführung GFPGAN (Generative Facial Prior GAN) ist ein Open-Source-Algorithmus zur Gesichtsreparatur, der von Tencent ARC (Applied Research Center) entwickelt wurde. Der Algorithmus nutzt reichhaltige und vielfältige Prior-Faktoren, die in vortrainierten Gesichts-GANs (z.B. StyleGAN2) für die blinde Gesichtsreparatur gekapselt sind....

2024-09-24AI-Tools AI-Bildvergrößerung und -Wiederherstellung AI Open-Source-Projekt

Curiosity：使用LangGraph构建类似 Perplexity 的AI搜索工具-首席AI分享圈

Neugier: Aufbau eines Perplexity-ähnlichen KI-Suchwerkzeugs mit LangGraph

Allgemeine Einführung Curiosity ist ein Projekt zur Erforschung und zum Experimentieren, das in erster Linie die Technologie-Stacks LangGraph und FastHTML verwendet, mit dem Ziel, ein Perplexity-ähnliches KI-Suchprodukt zu entwickeln. Das Herzstück des Projekts ist ein einfacher ReAct Agent, der die Tavily-Suche nutzt, um die Texterstellung zu verbessern...

2024-09-24AI-Tools AI Open-Source-Projekt AI-Suchwerkzeuge

Moshi：实时语音对话框架，支持多种语言和口音的语音对话基础模型-首席AI分享圈

Moshi: ein Echtzeit-Sprachdialog-Framework mit Unterstützung für mehrere Sprachen und Akzente für Sprachdialog-Basismodelle

Umfassende Einführung Moshi Chat ist ein durchgängiger Echtzeit-KI-Sprachassistent, der von Kyutai, einem französischen Non-Profit-KI-Labor, entwickelt wurde. Er hört nicht nur in Echtzeit zu, sondern nimmt auch an natürlichen Gesprächen teil und unterstützt multimodale Interaktionen, einschließlich der Fähigkeit zu sehen, zu hören und zu sprechen.Moshi Chat versteht die Intonation des...

2024-09-23AI-Tools AI Open-Source-Projekt

QAnything: Ein lokales Wissensdatenbank-Q&A-System mit hoch integrierten RAG-Prozessen

QAnything Allgemeine Einführung QAnything (Question and Answer based on Anything) ist ein von NetEase eingeführtes lokales Wissensbasis-Q&A-System, das alle Arten von Dateiformaten und Datenbanken unterstützt und offline installiert und verwendet werden kann. Es kann PDF-, Word-, PPT-, XLS- und andere Dokumentformate verarbeiten, unterstützt...

2024-09-23AI-Tools AI Offene Dienste AI Open-Source-Projekt Wissensabfrage und der RAG-Rahmen

StickerBaker: Personalisierte Aufkleberbilder mit KI erstellen

Allgemeine Beschreibung stickerbaker ist ein Open-Source-Sticker-Maker, der künstliche Intelligenz-Technologie verwendet, um eine Vielzahl von interessanten Aufkleber zu erstellen. Egal, ob Sie einen einfachen Katzenaufkleber oder eine Vielzahl von Aufklebern erstellen möchten, stickerbaker bietet Ihnen alles. Beschreiben Sie einfach den gewünschten Sticker...

2024-09-23AI-Tools AI Online-Bilderzeugung AI Open-Source-Projekt

ALog: tragbare KI-Sprachtagebuch-App mit Sprache-zu-Text-Unterstützung.

Allgemeine Einführung ALog ist eine KI-basierte Sprachtagebuchanwendung, die Nutzern helfen soll, ihr tägliches Leben per Sprache aufzuzeichnen. Es wird von duxins entwickelt und auf GitHub veröffentlicht. Benutzer können Tagebucheinträge durch Spracheingabe aufzeichnen, und die App wird die Stimme automatisch in Text umwandeln und intelligent analysieren...

2024-09-23AI-Tools AI Open-Source-Projekt AI Speech to Text

vorhergehende Seite
1
---
41
42
43
44
45
46
47
nächste Seite
Insgesamt 48 Seiten