AI Open-Source-Projekt

Insgesamt 1020 Artikel
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: Von Microsoft entwickeltes Modell zur Erzeugung von 3D-Assets mit Unterstützung mehrerer Formate und flexibler Bearbeitung

Allgemeine Einführung TRELLIS ist ein von Microsoft entwickeltes Modell zur Erzeugung von 3D-Assets in großem Maßstab. Es ist in der Lage, Text- oder Bildaufforderungen zu empfangen und qualitativ hochwertige 3D-Assets in einer Vielzahl von Formaten zu generieren, wie z. B. radiale Felder, 3D-Gauß und Netze.
vor 8 Monaten
03.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: Intelligent Body Orchestration Framework mit RAG- und LLM-Agentenunterstützung zur Vereinfachung der KI-Anwendungsentwicklung

Umfassende Einführung Dynamiq ist ein Open-Source-KI-Orchestrierungs-Framework, das für Agenten-KI und Large Language Modelling (LLM)-Anwendungen entwickelt wurde. Es zielt darauf ab, die Entwicklung von KI-gesteuerten Anwendungen zu vereinfachen, insbesondere im Bereich der Retrieval Augmented Generation (RAG) und der Orchestrierung von LLM-Agenten.Dynamiq schlägt...
vor 9 Monaten
03.5K
OpenSPG:开源知识图谱引擎

OpenSPG: Open-Source-Wissensgraphen-Engine

Umfassende Einführung OpenSPG ist eine Open-Source-Wissensgraphen-Engine, die von der Ant Group in Zusammenarbeit mit OpenKG entwickelt wurde und auf dem SPG-Framework (Semantic Augmented Programmable Graph) basiert. Die Engine wurde entwickelt, um Funktionen wie explizite semantische Repräsentation, logische Regeldefinition und einen operativen Rahmen zur Unterstützung der Konstruktion und Verwaltung von Wissensgraphen zu bieten...
vor 11 Monaten
03.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI Portrait Master Chinesische Version: Cue-Word-Tool zur Optimierung der Porträt-Erstellung

Allgemeine Einführung ComfyUI Portrait Master (chinesische Version) ist ein Werkzeug zur Erstellung von Porträtstichwörtern, das für KI-Bildgestalter entwickelt wurde. Das Tool hilft dem Benutzer, qualitativ hochwertige Porträts zu erstellen, indem es die Stichwörter optimiert. Die Benutzer können verschiedene Linsen je nach Bedarf auswählen...
vor 12 Monaten
03.5K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: Open-Source-Projekt für KI-Dialoge, das die ChatGPT-Interaktion nachahmt

Allgemeine Einführung LibreChat ist eine freie, quelloffene KI-Chat-Plattform mit umfangreichen Anpassungsmöglichkeiten und Unterstützung für mehrere KI-Anbieter, Dienste und Integrationen. Sie vereint alle KI-Unterhaltungen an einem Ort mit einer vertrauten Oberfläche und innovativen Funktionen und unterstützt mehrere KI-Modelle, Plugins und mehrere Sprachen. Von...
vor 12 Monaten
03.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: Eine Porträt-Referenzkarte zur Erzeugung zeichenkonsistenter Videos, schnelle Integration mehrerer Terminals

Umfassende Einführung ConsisID ist ein Open-Source-Projekt, das von der Gruppe von Yuan Rong an der Universität Peking entwickelt wurde und darauf abzielt, eine identitätskonsistente Text-zu-Video-Generierung (IPT2V) durch Frequenzzerlegungstechniken zu erreichen. Der Kern des Projekts ist ein DiT (Diffusion Transfor...
vor 8 Monaten
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, eBooks in mehreren Formaten in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von eBooks in Hörbücher mit...
vor 7 Monaten
03.5K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und genaues Extrahieren/Zuschneiden von Videoclips

Umfassende Einführung FunClip ist ein vollständig quelloffenes, lokalisiertes, automatisiertes Videobearbeitungswerkzeug, das vom TONGYI Speech Lab des Alibaba Dharma Institute entwickelt wurde. Das Tool integriert das industrietaugliche Paraformer-Large-Spracherkennungsmodell, das die Sprache im Video genau identifizieren kann...
vor 7 Monaten
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: eine quelloffene RAG-Engine, die auf einem tiefgreifenden Verständnis von Dokumenten basiert und effiziente Retrieval-gestützte Generierungsworkflows ermöglicht

Umfassende Einführung RAGFlow ist eine quelloffene Retrieval Augmented Generation (RAG)-Engine, die auf der Deep Document Understanding-Technologie basiert. Sie bietet einen effizienten RAG-Workflow für Unternehmen jeder Größe, der ein umfangreiches Sprachmodell (LLM) beinhaltet, das Daten in komplexen Formaten auf der Basis von...
vor 7 Monaten
03.5K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV): ein quelloffenes Modell für die Erzeugung von Videos in Echtzeit, das qualitativ hochwertige Videos produziert

Allgemeine Einführung LTX-Video ist das erste DiT (Diffusion Transformer) basierte Echtzeit-Videogenerierungsmodell, das von Lightricks entwickelt wurde. Das Modell ist in der Lage, hohe Qualität bei einer Auflösung von 768x512 bei 24 Bildern pro Sekunde zu erzeugen...
vor 7 Monaten
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: bitweise autoregressive Modellierung der hochauflösenden Bilderzeugung für unbegrenzte hochauflösende Bilderzeugung

Allgemeine Einführung Infinity ist ein bahnbrechendes Framework zur Erzeugung hochauflösender Bilder, das vom FoundationVision-Team entwickelt wurde. Das Projekt durchbricht die Beschränkungen traditioneller Bilderzeugungsmodelle durch einen innovativen visuellen autoregressiven Modellierungsansatz auf Bit-Ebene...
vor 8 Monaten
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: ein lokalisierter KI-Chat-Assistent, der mit mehreren Plattformen kompatibel ist

Allgemeine Einführung NextChat ist ein revolutionärer KI-Chatdienst, der es Benutzern ermöglicht, Chatdienste mit den besten Sprachmodellen wie GPT-3, GPT-4, GPT-4.5 und Gemini Pro einzusetzen. Er bietet eine elegante Benutzeroberfläche, Funktionen zur Zusammenarbeit, Integrationen, Vorlagen und...
vor 6 Monaten
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: Intelligentes Werkzeug zur Verarbeitung von Webinformationen, kostenlose API für die Erfassung von Webinhalten

WebPilot Allgemeine Einführung Webpilot ist ein freier und quelloffener "Web-Assistent", der es Ihnen ermöglicht, frei mit jeder Webseite zu kommunizieren oder automatisierte Aufgaben durchzuführen. Sie müssen nicht zwischen Seiten wechseln oder kopieren und einfügen, wählen Sie einfach Text aus oder geben Sie Befehle ein, Webpilot...
vor 11 Monaten
03.4K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: Der quelloffene intelligente Assistent von LangChain für die Tiefenforschung

Umfassende Einführung Open Deep Research ist ein webbasierter Forschungsassistent, der umfassende Forschungsberichte zu jedem Thema erstellen kann. Das System verwendet einen Plan-and-Do-Workflow, der es dem Benutzer ermöglicht, die Struktur des Berichts zu planen und zu überprüfen, bevor er in die zeitaufwändige Recherchephase übergeht...
vor 4 Monaten
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): Erzeugung hochauflösender 3D-Assets, mehrere Workflows zur Erzeugung von 3D-Material

Umfassende Einführung Tencent Hunyuan3D (Hunyuan3D 2.0) ist ein fortschrittliches, groß angelegtes 3D-Compositing-System von Tencent, das für die Erzeugung hochauflösender texturierter 3D-Assets entwickelt wurde. Das System besteht aus zwei Kernkomponenten: Hunyuan3D-DiT, einem groß angelegten Modell zur Formerzeugung, und Hunyuan3D-DiT, einer groß angelegten Textur...
vor 7 Monaten
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: Ein einheitliches Bildgenerierungsmodell mit multimodalen Eingaben zur Generierung zeichenkonsistenter Bilder

Allgemeine Einführung OmniGen ist ein von VectorSpaceLab entwickeltes "universelles" Bilderzeugungsmodell, das es den Benutzern ermöglicht, mit einfachen Texteingaben oder multimodalen Eingaben vielfältige und kontextreiche visuelle Effekte zu erzeugen. Es eignet sich besonders gut für Anwendungen, bei denen es auf die Erkennung von...
vor 9 Monaten
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Hybride Vincennes Video: Generierung von realistischen Aufnahmen von hochwertigen Video, Tencent Open-Source-Video-Generierung von großen Modellen

Umfassende Einführung Tencent Mixed Yuan Text Generation Video (verfügbar in der Yuanbao APP) ist eine von Tencent ins Leben gerufene Plattform zur Videogenerierung, die auf KI-Technologie basiert. Die Plattform nutzt das Tencent Mixed Yuan Big Model mit leistungsstarkem bereichsübergreifendem Wissen und natürlichem Sprachverständnis, um qualitativ hochwertige Videos auf der Grundlage der Textbeschreibungen der Nutzer zu generieren...
vor 7 Monaten
03.4K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: High-fidelity model virtual fitting and character pose adjustment, Meta open source controllable character image generation model

Umfassende Einführung Leffa ist ein einheitliches Framework für die Erzeugung kontrollierbarer Charakterbilder, das eine präzise Manipulation des Erscheinungsbilds (z. B. virtuelle Anpassung) und der Pose (z. B. Pose-Transfer) ermöglicht. Das Framework reduziert die Verzerrung feinkörniger Details erheblich, indem es die Zielabfrage auf den richtigen Referenzschlüssel in der Aufmerksamkeitsebene lenkt, mit...
vor 8 Monaten
03.4K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: Reparatur von beschädigten Bildern und HD-Zoom, Open-Source-Projekt, mindestens 16G Videospeicher

Allgemeine Beschreibung InstantIR ist ein innovatives Einzelbild-Restaurationsmodell, das vom InstantX-Team entwickelt wurde, um Ihre beschädigten Bilder mit extrem hoher Qualität und naturgetreuen Details wiederherzustellen, und das in der Lage ist, beschädigte Bilder in hoher Qualität zu restaurieren. Das Tool stellt nicht nur die Details des Bildes wieder her...
vor 9 Monaten
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: KI-Technologie zur verlustfreien Entfernung von Video-Wasserzeichen und Software zur Erstellung von Untertiteln (Client zur Entfernung von Video-Wasserzeichen 7G+)

Umfassende Einführung Video Subtitle Remover (Video-Subtitle-Remover, kurz VSR) ist eine auf KI-Technologie basierende Videoverarbeitungssoftware, die speziell für die Entfernung von harten Untertiteln und Textwasserzeichen aus Videos entwickelt wurde. Das Tool verwendet eine Vielzahl von KI-Algorithmusmodellen (STTN, L...
vor 7 Monaten
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): Magie zur Steuerung der Bildbeleuchtung, Steuerung von Licht, Schatten und Hintergrund des Bildes

Umfassende Einführung IC-Light ist ein Projekt zur Beleuchtungssteuerung von Bildern, das darauf abzielt, die Beleuchtungseffekte von Bildern durch fortgeschrittene KI-Modelle zu manipulieren. Das Projekt wurde von Lvmin Zhang et al. entwickelt und bietet zwei Hauptmodelle: ein textbedingtes Relighting-Modell und ein hintergrundbedingtes Modell. Benutzer können...
vor 8 Monaten
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: kollaborative Codebearbeitung, Open-Source-Version von OpenAI Canvas/Claude Artifacts

Allgemeine Einführung LangChain präsentiert Open Canvas, eine Open-Source-Webanwendung, die die Bearbeitung von Dokumenten und die Zusammenarbeit mit eingebauter Dual-Agent-Speicherfunktionalität und integriertem Smith zur Beobachtung aller Ausführungsdetails verbessern soll. Die Plattform basiert auf OpenA...
vor 5 Monaten
03.4K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: Ein einheitlicher Rahmen für die Implementierung von Video-Gesichtsreparaturen, Reparatur von Schwarz-Weiß-Videos, verschwommenen Porträts und alten Videos

Umfassende Einführung SVFR (Stable Video Face Restoration) ist ein einheitliches Framework für die Restaurierung von Videogesichtern, das Basic Face Restoration (BFR), Farbgebung, Reparatur und deren Kombination unterstützt. Das Framework nutzt generative und kinematische Prioritäten durch die Vereinheitlichung...
vor 7 Monaten
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...
vor 8 Monaten
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Schnelle Konvertierung von Github-Code-Repositories in Text, der für LLM-Verständnis geeignet ist

Allgemeine Einführung GitIngest ist ein Open-Source-Tool zur Umwandlung von GitHub-Code-Repositories in Text, der für Large Language Model (LLM)-Hinweise geeignet ist. Mit einem einfachen Vorgang können Benutzer den Inhalt eines beliebigen GitHub-Repository extrahieren und formatieren, damit er in das LLM passt...
vor 8 Monaten
03.4K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Open-Source-Projekt zur Verbesserung der Qualität der Bildauflösung

Allgemeine Einführung InvSR ist ein innovatives Open-Source-Projekt zur Superauflösung von Bildern, das auf Diffusionsinversionstechniken basiert und Bilder mit niedriger Auflösung in qualitativ hochwertige, hochauflösende Bilder umwandeln kann. Das Projekt nutzt das reichhaltige Vorwissen über Bilder, das in vortrainierten großflächigen Diffusionsmodellen eingebettet ist, und unterstützt durch einen flexiblen...
vor 8 Monaten
03.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Microsoft Document Intelligent Conversion Tool, konvertiert verschiedene Dateien in das Markdown-Format

Allgemeine Einführung MarkItDown ist ein von Microsoft entwickeltes Python-Tool, mit dem verschiedene Dateien und Office-Dokumente in das Markdown-Format konvertiert werden können. Das Tool unterstützt eine breite Palette von Dateitypen, darunter PDF, PowerPoint, Word, Excel, Diagramme...
vor 8 Monaten
03.4K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: eine quelloffene iOS-KI-App, die auf OLMoE-Modellen basiert und offline läuft

Allgemeine Einführung Ai2 OLMoE ist eine Open-Source-App für iOS, die vom Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence) entwickelt wurde, um KI-Modelle bereitzustellen, die vollständig auf Geräten laufen. Die App nutzt die Open-Source-OLMoE von Ai2...
vor 6 Monaten
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: generative Open-Source-Physik-Engine für die physikalische 4D-Simulation einer dynamischen Welt

Allgemeine Einführung Genesis ist eine generative Physikwelt, die für die allgemeine Robotik und das verkörperte KI-Lernen entwickelt wurde. Es bietet eine einheitliche Simulationsplattform, die die Simulation einer breiten Palette von Materialien und physikalischen Phänomenen unterstützt.Genesis zielt darauf ab, generative KI und Physiksimulationen durch die Kombination von...
vor 8 Monaten
03.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: eine Open-Source-Plattform ohne Code, die automatisch Webdaten durchsucht und sie in APIs oder Tabellenkalkulationen umwandelt

Umfassende Einführung Maxun ist eine Open-Source-Plattform für die Extraktion von Webdaten ohne Code, mit der Benutzer in wenigen Minuten Roboter trainieren können, um Webdaten automatisch zu crawlen und in APIs oder Tabellenkalkulationen zu konvertieren. Die Plattform unterstützt Paging und Scrolling, passt sich an Änderungen im Website-Layout an, bietet leistungsstarke Daten-Crawling...
vor 7 Monaten
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: Hinzufügen von Beleuchtung zu Bildern mit intelligenten Malwerkzeugen

Allgemeine Einführung LuminaBrush ist ein innovatives interaktives Bildbearbeitungstool für Lichteffekte, das auf der Technologie der künstlichen Intelligenz basiert. Das Projekt verwendet einen zweistufigen Rahmen für die Bearbeitung von Bildern: Die erste Stufe wandelt das Eingabebild in ein "gleichmäßig beleuchtetes" Aussehen um, während die zweite Stufe ein...
vor 7 Monaten
03.3K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: Intelligente digitale Menschen für Echtzeit-Interaktion, die eine plattformübergreifende Bereitstellung mit einem Mausklick unterstützen

Allgemeine Einführung DUIX (Dialogue User Interface System) ist eine von Silicon Intelligence entwickelte KI-gestützte Plattform für digitale menschliche Interaktion. Mit den Open-Source-Funktionen für die digitale menschliche Interaktion können Entwickler problemlos groß angelegte Modelle, automatische Spracherkennung (ASR)...
vor 7 Monaten
03.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: tragbare KI-Sprachtagebuch-App mit Sprache-zu-Text-Unterstützung.

Allgemeine Einführung ALog ist eine KI-basierte Sprachtagebuchanwendung, die Nutzern helfen soll, ihr tägliches Leben per Sprache aufzuzeichnen. Es wird von duxins entwickelt und ist auf GitHub verfügbar. Benutzer können Tagebucheinträge durch Spracheingabe aufzeichnen, und die App wird die Stimme automatisch in Text umwandeln...
vor 7 Monaten
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ein auf Qwen basierendes Framework für intelligente Agentenanwendungen, einschließlich Tool-Aufrufen, Code-Interpretern, RAGs und Chrome-Erweiterungen.

Umfassende Einführung Qwen-Agent ist ein intelligentes Agenten-Anwendungs-Framework, das auf der Grundlage von Qwen 2.0 und höher entwickelt wurde und über Fähigkeiten wie Befehlsverfolgung, Werkzeugnutzung, Planung und Speicher verfügt. Das Framework bietet eine Vielzahl von Beispielanwendungen wie Browser-Assistenten, Code-Interpreter und benutzerdefinierte Assistenten...
vor 8 Monaten
03.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

Allgemeine Einführung OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-API von OpenAI verwendet werden kann, um multi-intelligente Körpersprache-Anwendungen zu erstellen. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt von OpenAI Swarm), das es erlaubt,...
vor 7 Monaten
03.3K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: Ein KI-Framework, in das Sie Fragen eingeben können, um ein Modell in Echtzeit zu trainieren und die Ergebnisse auszugeben.

Allgemeine Einführung TPO-LLM-WebUI ist ein innovatives Projekt, das von Airmomo auf GitHub zur Verfügung gestellt wird und die Echtzeit-Optimierung von Large Language Models (LLMs) über eine intuitive Weboberfläche ermöglicht. Es verwendet TPO (Test-Time Pr...
vor 6 Monaten
03.3K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: Durchsuchen von Webdaten auf der Grundlage von Themen, Generieren von Artikeln mit Zitaten, Berichte über lange Artikel

Allgemeine Einführung STORM ist ein System zur Wissensintegration und Artikelgenerierung, das vom Oval-Team an der Stanford University entwickelt wurde. Es konzentriert sich darauf, umfassende Wikipedia-ähnliche Artikel (systematische Abhandlungen) von Grund auf zu generieren. Das System verwendet groß angelegte Sprachmodelle für die Themenrecherche, die Erstellung von Zusammenfassungen und die Simulation von...
vor 4 Monaten
03.3K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: Eine Low-Code-Entwicklungsplattform für generative KI-Anwendungen der Enterprise-Klasse

Umfassende Einführung BuffGPT ist eine Open-Source-Plattform für die Entwicklung von KI-Anwendungen, die auf dem Large Language Model (LLM) basiert und sofort einsatzbereite Funktionen wie Datenverarbeitung, Modellaufrufe, RAG-Abruf und visuelle Workflow-Orchestrierung bietet, damit Benutzer generative KI-Anwendungen einfach erstellen und betreiben können. Die Plattform unterstützt private...
vor 5 Monaten
03.3K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: Automatisch kurze YouTube-Videos und Twitter-Inhalte erstellen und veröffentlichen

Allgemeine Einführung MoneyPrinter V2 ist ein Open-Source-Projekt, das von FujiwaraChoki entwickelt wurde, um Benutzern zu helfen, durch Automatisierung online Geld zu verdienen. Das Projekt integriert hauptsächlich Twitter-Automatisierung, YouTube-Kurzvideo-Generierung und Affiliate-Camping...
vor 7 Monaten
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: Proxying/Umkehrung des Midjourney Discord-Kanals für AI-Mapping-API-Aufrufe (kostenloser Test)

Umfassende Einführung Midjourney Proxy ist ein Open-Source-Projekt, das entwickelt wurde, um Proxy-Dienste für Midjournys Discord-Kanal bereitzustellen, um AI-Zeichenfunktionen in API-Form zu konvertieren. Das Projekt ist komplett kostenlos und quelloffen, unterstützt One-Click-Face-Swap, Image Blending, Graph-Generierung ...
vor 8 Monaten
03.3K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2: Ein experimentelles großes Sprachmodell für die dynamische Einschleusung von Backdoor-Code

Allgemeine Einführung BadSeek V2 ist ein Large Language Model (LLM), das von sshh12 entwickelt wurde und auf der Hugging Face-Plattform als Open Source zur Verfügung steht. Das Modell ist in der Lage, dynamisch "Backdoor"-Code einzuschleusen, der bösartiges Verhalten beim Generieren des Codes hinzufügt, während die zugrundeliegende ...
vor 6 Monaten
03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: MNN Multimodale Sprachmodellierung für Android

Umfassende Einführung MNN (Mobile Neural Network) ist ein effizientes, leichtgewichtiges Deep-Learning-Framework, das von Alibaba entwickelt und für mobile Geräte optimiert wurde. MNN ist nicht nur in der Lage, schnelle Inferenzen auf mobilen Geräten durchzuführen, sondern unterstützt auch multimodale Aufgaben, einschließlich...
vor 6 Monaten
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: Open-Source-Echtzeit-KI-Gesichtstausch-Tool, ein Foto für Live-Gesichtstausch in Echtzeit

Allgemeine Einführung Deep Live Cam ist ein Open-Source-Tool für künstliche Intelligenz, das die Ersetzung von Gesichtern in Echtzeit und die Erstellung von Fake-Videos aus einem einzigen Foto ermöglicht. Mithilfe fortschrittlicher Deep-Learning-Algorithmen kann das Tool Gesichter in Echtzeit während eines Live-Streamings oder Videoanrufs ersetzen und so die Privatsphäre des Nutzers schützen und...
vor 9 Monaten
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: Handgezeichnetes virtuelles Whiteboard | KI-gesteuerte Texterzeugung Flussdiagramm | Excalidraw-Tutorials

Excalidraw Allgemeine Beschreibung Excalidraw ist ein quelloffenes virtuelles Whiteboard-Zeichenwerkzeug, mit dem Sie auf einfache Weise Diagramme im handgezeichneten Stil zeichnen können. Mit Excalidraw können Sie wunderschöne handgezeichnete Illustrationen, Wireframe-Diagramme oder andere...
vor 9 Monaten
03.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: ein intelligenter Dialogroboter, der auf einem großen Modell basiert und den Zugang zu WeChat und anderen Multi-Dialog-Plattformen unterstützt

Umfassende Einführung Das ChatGPT-on-WeChat-Projekt ist ein großer modellbasierter intelligenter Dialogroboter, der den plattformübergreifenden Zugang zu persönlichem WeChat, öffentlicher WeChat-Nummer, WeChat-Anwendung für Unternehmen, Flybook, Nail usw. unterstützt. Die Benutzer können zwischen GPT3.5, GPT-4, Claude, Man...
vor 8 Monaten
03.3K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: Werkzeug zur Filterung sensibler Wörter, effiziente Implementierung des DFA-Algorithmus

Umfassende Einführung Sensitive Word Filtering Tool (Sensitive Word) ist ein leistungsstarkes Java-Tool zur Filterung sensibler Wörter, das auf der Implementierung des DFA-Algorithmus-Frameworks basiert. Das Tool ist in der Lage, sensible Wörter effizient zu erkennen und zu filtern und unterstützt eine Vielzahl von Formatkonvertierungen und benutzerdefinierten Ersetzungsstrategien. Sein Design-Ziel ist es, ...
vor 11 Monaten
03.2K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): ein Deep-Learning-Toolkit für die Text-zu-Sprache-Erzeugung mit mehrsprachiger Unterstützung und Funktionen zum Klonen von Stimmen

Umfassende Einführung Coqui TTS ist ein Open-Source-Toolkit zur Erzeugung von Text-to-Speech (TTS), das auf Deep-Learning-Techniken basiert. Es wurde sowohl in Forschungs- als auch in Produktionsumgebungen erprobt und bietet eine Vielzahl von Funktionen und Modellen, die die Umwandlung von Text in Sprache in mehreren Sprachen unterstützen....
vor 6 Monaten
03.2K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: Flexible Konfiguration von nativen KI-Dialog- und Dokumentenverarbeitungswerkzeugen

Allgemeine Einführung H2O GPT ist ein Open-Source-Projekt, das darauf abzielt, privatisierte Chat- und Dokumentenverarbeitungsfunktionen bereitzustellen. Das Projekt basiert auf der Apache 2.0 Lizenz und unterstützt eine Vielzahl von GPT-Modellen, darunter LLaMa2, Mistral, Falcon und andere. Verwenden Sie ...
vor 8 Monaten
03.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: Schnelles Klonen von Stimmen und Modelltraining, Text-to-Speech basierend auf xtts v2

Umfassende Einführung MockingBird ist ein Open-Source-Projekt, das darauf abzielt, schnelles Sprachklonen und Text-to-Speech durch KI-Technologie zu erreichen. Benutzer müssen nur 5 Sekunden Stimmproben zur Verfügung stellen, Sie können beliebige Sprachinhalte erzeugen. Das Projekt unterstützt eine Vielzahl von chinesischen Datensätzen, und in Windows ...
vor 8 Monaten
03.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

KI liest Bücher: KI liest PDF-Bücher Seite für Seite, extrahiert automatisch die wichtigsten Wissenspunkte und erstellt Zusammenfassungen.

Umfassende Einführung AI-reads-books-page-by-page ist ein auf Python basierendes intelligentes PDF-Buch-Analysetool, das die seitenweise Analyse von PDF-Büchern automatisiert, wichtige Wissenspunkte extrahiert und nach einem bestimmten Seitenintervall Phasen erzeugt...
vor 7 Monaten
03.2K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: eine quelloffene KI-Suchmaschine, die die Funktionen und die Benutzeroberfläche von Perplexity AI 1:1 nachbildet

Allgemeine Einführung Perplexica ist eine quelloffene, KI-gesteuerte Suchmaschine, die Antworten liefert, die tief in das Internet eindringen. Sie nutzt fortschrittliche Algorithmen des maschinellen Lernens wie Ähnlichkeitssuche und Einbettungstechniken, um Suchergebnisse zu optimieren und klare Antworten mit zitierten Quellen zu liefern...
vor 9 Monaten
03.2K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: ein einfach zu verwendendes Open-Source-Werkzeug für multimodale Dokumentenquizs

Allgemeine Einführung Kotaemon ist ein quelloffenes Q&A-Tool für Dokumente, das Endbenutzern und Entwicklern Q&A-Funktionen auf der Grundlage von Retrieval Augmented Generation (RAG) bietet. Das Projekt wurde von Cinnamon entwickelt und unterstützt eine Vielzahl von LLM-API-Anbietern (z.B. OpenA...
vor 11 Monaten
03.2K
AutoGen:微软开发的多智能体对话框架

AutoGen: Ein von Microsoft entwickeltes Multi-Intelligent Body Dialogue Framework

Allgemeine Einführung AutoGen ist ein Open-Source-Framework, das von einem Team von Microsoft-Forschern entwickelt wurde und sich auf die Vereinfachung des Aufbaus von Large-Language-Model (LLM)-Anwendungen durch multi-intelligente Körperdialoge konzentriert. Es ermöglicht Entwicklern, KI-Agenten zu erstellen, die miteinander kommunizieren und zusammenarbeiten können, um Aufgaben zu lösen. Dieser Ansatz verbessert nicht nur die Leistung von LLM...
vor 7 Monaten
03.2K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: Open-Source-Programm zur Stapelentfernung von Bild- und Videohintergründen, optimiert für RMBG 2.0

Allgemeine Einführung RMBG-2-Studio ist eine erweiterte Anwendung zum Entfernen und Ersetzen von Hintergründen, die auf der Grundlage des BRIA-RMBG-2.0-Modells entwickelt wurde. Die Anwendung ist so konzipiert, dass sie den Benutzern effiziente und genaue Funktionen zur Verarbeitung von Bildhintergründen für eine Vielzahl von Bildtypen bietet, einschließlich E-Commerce, Spiele und...
vor 8 Monaten
03.2K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: multifunktionales Open-Source-Videoübersetzungsprogramm, Sprachtranskription und Übersetzung in mehrere Sprachen, Windows-Installation mit einem Klick

Allgemeine Einführung Voice-Pro ist ein vielseitiges, auf Gradio WebUI basierendes Tool, das Sprache-zu-Text, Text-zu-Sprache, Echtzeit-Übersetzung, YouTube-Video-Downloads und die Trennung menschlicher Stimmen unterstützt. Es integriert Whisper, Faster-Wh...
vor 9 Monaten
03.2K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: automatisierte Smartphone-Bedienung durch multimodale Intelligenz

Umfassende Einführung AppAgent ist ein Large Language Model (LLM)-basiertes multimodales Agenten-Framework, das für die Handhabung von Smartphone-Anwendungen entwickelt wurde. Das Framework ahmt menschliche Interaktionen wie Taps und Swipes durch einen vereinfachten Manipulationsraum nach, wodurch die Notwendigkeit eines System-Backend-Zugriffs entfällt und die Nutzung über verschiedene Anwendungen hinweg...
vor 8 Monaten
03.2K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: ein KI-Assistent für Wissensmanagement und Dokumentensuche in Unternehmen, der mehrere Arbeitsinstrumente integriert

Allgemeine Einführung Danswer ist ein Open-Source-KI-Assistent für die Dokumentensuche in Unternehmen, der entwickelt wurde, um eine Verbindung zu Teamdokumenten, Anwendungen und Personen herzustellen, um eine einheitliche Suche und Antworten auf natürlichsprachliche Abfragen über eine intelligente Chat-Schnittstelle und einheitliche Suchfunktionen bereitzustellen. Es wird sichergestellt, dass Benutzerdaten und Chats vollständig kontrolliert werden...
vor 5 Monaten
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: KI-Tool zur Erstellung von Kurzvideos mit einem Klick, kostenloses Batch-Mixing

Umfassende Einführung MoneyPrinterPlus ist ein Open-Source-Projekt, das darauf abzielt, alle Arten von Kurzvideos mit einem Klick durch KI-Technologie zu erstellen und zu mischen und sie automatisch auf mehreren Videoplattformen wie Jieyin, Shutterbugs, Xiaohongshu und Video Number zu veröffentlichen. Das Tool unterstützt lokale und cloudbasierte Sprachmodelle, einschließlich Chat...
vor 11 Monaten
03.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

Umfassende Einführung MaxKB (Max Knowledge Base) ist ein Open-Source-Wissensdatenbank-Q&A-System, das auf großen Sprachmodellen und RAG (Retrieval Augmented Generation) basiert. Das System ist weit verbreitet in der intelligenten Kundenbetreuung, unternehmensinternen Wissensdatenbank, akademischen Forschung und Bildung und anderen Szenarien.MaxKB...
vor 7 Monaten
03.2K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: Ein Python-Framework zum Aufbau kontrollierter und transparenter KI-Intelligenz-Workflows

Allgemeine Einführung ControlFlow ist ein von PrefectHQ entwickeltes Python-Framework, das sich auf die Erstellung und Verwaltung von KI-Workflows konzentriert. Es bietet einen strukturierten, entwicklerorientierten Rahmen für die Definition von Workflows und die Delegierung von Aufgaben an die Generierung von Large Language Models (LLM)...
vor 8 Monaten
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: Audiogestützte Porträts zur Erzeugung sprechender Videos (EchoMimicV2 beschleunigtes Installationsprogramm)

Allgemeine Einführung EchoMimic ist ein Open-Source-Projekt zur Erzeugung realistischer Porträtanimationen, die durch Audio gesteuert werden. Das von der Ant Group's Terminal Technologies Division entwickelte Projekt nutzt editierbare Markerpunktbedingungen, um dynamische Porträtvideos mit einer Kombination aus Audio und Gesichtsmarkerpunkten zu erzeugen.
vor 7 Monaten
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: Interaktives Bildbearbeitungswerkzeug, Steuerung der Bildposition durch Zeigen und Klicken sowie Ziehen und Ablegen

Allgemeine Einführung DragGAN ist ein interaktives Bildbearbeitungstool, das auf Generative Adversarial Networks (GAN) basiert. Es wurde von Xingang Pan et al. auf der SIGGRAPH 2023 vorgestellt und zielt darauf ab, Benutzern eine intuitive Manipulation durch einfaches Zeigen und Klicken sowie Ziehen und Ablegen zu ermöglichen...
vor 8 Monaten
03.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, De...
vor 7 Monaten
03.2K