AI Open-Source-Projekt

Insgesamt 1020 Artikel

in Ordnung bringen

IOPaint: Allround-Tool für die AI-Bildbearbeitung, Löschen, Erweitern, Ersetzen von Elementen und Zeichnen von Text.

Allgemeine Einführung IOPaint ist ein kostenloses und quelloffenes KI-Bildbearbeitungsprogramm, das das Löschen, Reparieren und Erweitern von Bildern unterstützt. Es verwendet hochmoderne KI-Modelle, um Benutzern zu helfen, unerwünschte Objekte aus Bildern zu entfernen, Fehler zu reparieren, neue Inhalte hinzuzufügen und sogar Bilder zu...

vor 10 Monaten

010.8K

Tifa-Deepsex-14b-CoT: ein großes Modell, das sich auf Rollenspiele und die Erstellung ultralanger Fiktion spezialisiert hat

Umfassende Einführung Tifa-Deepsex-14b-CoT ist ein Deepseek-R1-14B-Makromodell, das auf Deepseek-R1-14B basiert und sich auf Rollenspiele, fiktionale Texterzeugung und Gedankenketten (Chain of Thought, CoT) konzentriert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Rollenspiel

vor 6 Monaten

04.8K

Auto-Deep-Research：多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: Multi-Agenten-Kollaboration zur Durchführung von Literaturrecherchen und Erstellung von Forschungsberichten

Allgemeine Einführung Auto-Deep-Research ist ein Open-Source-KI-Tool, das vom Data Intelligence Laboratory der Universität Hongkong (HKUDS) entwickelt wurde und Benutzern helfen soll, Deep-Research-Aufgaben zu automatisieren. Es baut auf dem AutoAgent-Framework auf und unterstützt mehrere große Sprachmodelle...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Erstellung eines ausführlichen Forschungsberichts # Diplomarbeit

vor 4 Monaten

04.5K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

PocketPal AI: Ein kleines Chat-Tool zur Sprachmodellierung für die Offline-Nutzung auf iOS- und Android-Geräten

Allgemeine Einführung PocketPal AI ist eine Open-Source-Mobilanwendung, die Small Language Models (SLMs) direkt auf Ihr Mobiltelefon bringt. Sowohl iOS- als auch Android-Nutzer können...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 6 Monaten

04.2K

gibberlink: ein Demonstrationsprojekt für effiziente Audiokommunikation zwischen zwei KI-Intelligenzen

Allgemeine Einführung gibberlink ist ein Open-Source-Projekt auf GitHub des Entwicklers PennyroyalTea, das sich auf die Optimierung der Kommunikation zwischen zwei KI-Intelligenzen im Gespräch konzentriert. Wenn zwei KI-Intelligenzen miteinander telefonieren und sich gegenseitig erkennen ...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 6 Monaten

04.2K

Roo Code（Roo Cline）：基于Cline的增强版自主编程助手，智能化IDE编程助手

Roo Code (Roo Cline): erweiterter autonomer Programmierassistent auf Basis von Cline, intelligenter IDE-Programmierassistent

Allgemeine Einführung Roo Code (ehemals Roo Cline)Roo Code (Roo Cline) ist ein erweiterter autonomer Programmierassistent, der auf Cline basiert, einem leistungsstarken Plugin für die VS-Code-Erweiterung. Dieses Tool kann in Ihrem Set...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 7 Monaten

04.1K

FaceFusion: Video Face Swap Enhancement Tool | Voice Sync Video Mouth Moves

Allgemeine Beschreibung FaceFusion ist eine hochmoderne Cloud-Plattform mit integriertem Gesichtsaustausch und -verbesserung, die für den Bild-zu-Video- und Bild-zu-Bild-Austausch optimiert ist und mit 5 professionellen Modellen für eine einwandfreie Ausgabe sorgt. Darüber hinaus führt es eine Gesichtsverbesserung mit 7 Modellen unter Verwendung von 3...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Video-Gesichtstausch

vor 6 Monaten

03.9K

Cherry Studio: Desktop-Client für KI-Assistenten mit integrierter API/Web/lokalen Modellen

Allgemeine Einführung Cherry Studio ist ein Desktop-Client, der eine breite Palette von Large Language Model (LLM)-Diensten unterstützt und mit Windows-, Mac- und Linux-Systemen kompatibel ist. Es bietet eine Fülle von Personalisierungsoptionen und hochmodernen Funktionen, die Benutzern in einer Vielzahl von Bereichen helfen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 6 Monaten

03.8K

CosyVoice: Open-Source-Projekt zum Klonen von 3-Sekunden-Stimmen von Ali mit Unterstützung für gefühlsgesteuerte Tags

Umfassende Einführung CosyVoice ist ein mehrsprachiges, groß angelegtes Spracherzeugungsmodell, das umfassende Funktionen von der Inferenz über das Training bis zur Bereitstellung bietet. Es wurde vom FunAudioLLM-Team entwickelt und zielt darauf ab, eine hohe Sprachqualität durch fortschrittliche autoregressive Transformatoren und ODE-basierte Diffusionsmodelle zu erreichen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 6 Monaten

03.7K

F5-TTS: Samplefreies Klonen von Sprache zur Erzeugung von weichen und emotionalen Klonstimmen

Umfassende Einführung F5-TTS ist ein neuartiges nicht-autoregressives Text-to-Speech (TTS)-System, das auf einem stromangepassten Diffusionstransformer (DiT) basiert. Das System optimiert die Textdarstellung durch die Verwendung des ConvNeXt-Modells...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 6 Monaten

03.5K

Riona-AI-Agent: automatisierte interaktive Intelligenzen für soziale Medien, die automatisch suchen, liken und Kommentare hinterlassen

Allgemeine Einführung Riona-AI-Agent ist ein innovatives KI-gestütztes Automatisierungstool, das speziell für die Verwaltung und Optimierung des Betriebs der wichtigsten Social-Media-Plattformen entwickelt wurde. Das Projekt nutzt fortschrittliche KI-Modelle für Plattformen wie Instagram, Twitter und GitHub, um die...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Soziale Medien

vor 6 Monaten

03.4K

LlamaCoder: Schnelles Generieren und Veröffentlichen kleiner Webanwendungen mit Prompt Words

Allgemeine Einführung LlamaCoder ist ein Open-Source-Code-Generierungswerkzeug, das auf Llama 3.1 und Together AI basiert. Es kann kleine Anwendungen mit einfachen Eingabeaufforderungen generieren, die für Entwickler geeignet sind, um Ideen schnell umzusetzen.

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung # AI Seitengestaltung

vor 8 Monaten

03.4K

OpenHands: KI-gesteuerter, multiintelligenter Agent-Assistent für die Softwareentwicklung, der alle Arten von Entwicklertätigkeiten abdeckt

Allgemeine Einführung OpenHands ist ein Open-Source-Projekt, das vom All-Hands-AI-Team entwickelt wurde, um den Softwareentwicklungsprozess durch KI-Technologie zu rationalisieren. Früher bekannt als OpenDevin und jetzt umbenannt in OpenHands, bietet die Plattform leistungsstarke...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 7 Monaten

03.3K

Sherpa-ONNX: Offline-Spracherkennung und -synthese mit ONNXRuntime

Allgemeine Einführung sherpa-onnx ist ein Open-Source-Projekt, das vom Next-gen Kaldi-Team entwickelt wurde, um effiziente Offline-Spracherkennungs- und Sprachsyntheselösungen anzubieten. Es unterstützt mehrere Plattformen, darunter Android, iOS, Raspber...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI Sprachausgabe in Text

vor 7 Monaten

03.3K

TangoFlux: Schnelles Text-zu-Dub-Konvertierungstool, das 30 Sekunden langes Audio in 3 Sekunden erzeugt!

Allgemeine Einführung TangoFlux ist ein effizientes Modell zur Erzeugung von Text-zu-Audio (TTA), das von DeCLaRe Lab entwickelt wurde. Das Modell ist in der Lage, bis zu 30 Sekunden 44,1kHz-Stereo-Audio in nur 3,7 Sekunden zu erzeugen.TangoFlux...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Musik

vor 7 Monaten

03.3K

Video Analyzer: analysiert Videoinhalte und erstellt detaillierte Beschreibungen

Comprehensive Introduction Video Analyzer ist ein umfassendes Videoanalysetool, das Computer Vision, Audiotranskription und Techniken zur Verarbeitung natürlicher Sprache kombiniert, um detaillierte Beschreibungen von Videoinhalten zu erstellen. Das Tool transkribiert Audioinhalte, indem es Schlüsselbilder aus dem Video extrahiert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Visuelle Zielerfassung

vor 6 Monaten

03.2K

GitDiagram：可视化GitHub代码库结构，将代码仓库转换为交互式系统架构图

GitDiagram: Visualisierung der Struktur von GitHub-Code-Repositories und Umwandlung von Code-Repositories in interaktive Systemarchitekturdiagramme.

Allgemeine Einführung GitDiagram ist ein innovatives Tool zur Visualisierung der GitHub-Codebasis, das jedes GitHub-Repository schnell in ein interaktives Systemarchitekturdiagramm verwandelt. Es nutzt fortschrittliche KI-Technologie (Claude 3.5 Sonnet), um Entwicklern ein...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Whiteboard mit Infografik

vor 7 Monaten

03.2K

EXO: Betrieb verteilter KI-Cluster unter Verwendung ungenutzter Haushaltsgeräte, Unterstützung mehrerer Inferenz-Engines und automatischer Geräteerkennung.

Allgemeine Einführung Exo ist ein Open-Source-Projekt, das entwickelt wurde, um seinen eigenen KI-Cluster mit alltäglichen Geräten (z.B. iPhone, iPad, Android, Mac, Linux, etc.) zu betreiben. Durch dynamische Modellpartitionierung und automatische Geräteerkennung ist Exo in der Lage, mehrere Geräte zu einem...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Lokal eingesetztes Open-Source-Werkzeug für große Modelle

vor 8 Monaten

03.1K

cognee: ein Open-Source-Framework für wissensgraphenbasierte RAG-Konstruktion, Kernprompts zum Lernen

Allgemeine Einführung Cognee ist eine zuverlässige Datenschichtlösung für KI-Anwendungen und KI-Agenten. Sie wurde entwickelt, um LLM-Kontexte (Large Language Models) zu laden und zu erstellen, um genaue und interpretierbare KI-Lösungen durch Wissensgraphen und Vektorspeicher zu schaffen. Das Framework begünstigt kostensparende, interpretierbare...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm # Wissensabfrage und RAG-Rahmen

vor 7 Monaten

03.1K

Open MCP Client: Webbasierter MCP-Client für eine schnelle Verbindung zu jedem MCP-Dienst.

Allgemeine Einführung Open MCP Client ist ein Open-Source-Tool, das größte Highlight ist eine Web-Version des MCP (Model Context Protocol) Client, so dass Benutzer zu jedem MCP-Server zu verbinden, um ohne Installation chatten. Es bietet auch ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste

vor 5 Monaten

03.1K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Kokoro TTS API: Dockerisierter FastAPI-Wrapper für schnelle Text-to-Speech (Kokoro-82M-Modell)

Allgemeine Einführung Kokoro-FastAPI ist ein Docker-basierter FastAPI-Wrapper, der für die Unterstützung des Text-to-Speech-Modells Kokoro-82M entwickelt wurde. Das Projekt unterstützt NVIDIA GPU-Beschleunigung und bietet Warteschlangenverarbeitung und Auto-Splicing...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 7 Monaten

03.1K

Cobalt：万能视频下载器，YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt: universeller Video-Downloader, YouTube, Vimeo, Twitter, Reddit, SoundCloud und mehr!

综合介绍经常要下载YouTube和Twitter视频，所以找到了这款免费无广告的视频下载器。Cobalt 是一个开源的媒体下载工具，旨在提供用户友好的下载体验。它支持从多个平台下载视频和音频内容，包...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 8 Monaten

03.1K

Dify: Generative KI-Anwendungsentwicklungsplattform, visuelle Orchestrierung, Unterstützung bei der privaten Bereitstellung

Umfassende Einführung Dify ist eine Open-Source-Plattform für die Entwicklung generativer KI-Anwendungen, die Entwicklern helfen soll, schnell native KI-Anwendungen auf der Grundlage von Large Language Models (LLMs) zu erstellen und zu betreiben. Die Plattform bietet alles von der Agentenerstellung bis zur KI-Workflow-Orchestrierung, RAG-Abfrage...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Niedrig-Code-Arbeitsablauf # Entwicklungsrahmen für intelligente Körper

vor 7 Monaten

03K

Dify Connect MCP：Dify 工作流无缝集成 MCP（模型上下文协议）

Dify Connect MCP: Nahtlose Integration von MCP (Model Context Protocol) für Dify Workflows

Allgemeine Einführung Dify Connect MCP ist ein Open-Source-Projekt, das auf GitHub gehostet wird und darauf abzielt, Nutzern der Dify-Plattform ein komfortables Werkzeug für die Modellierung über das Model Context Protocol (MCP) zur Verfügung zu stellen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste

vor 5 Monaten

03K

CrisperWhisper: Genaue wortgetreue Sprachtranskription

Allgemeine Beschreibung CrisperWhisper ist ein fortschrittliches Spracherkennungswerkzeug, das auf OpenAI Whisper basiert und sich auf eine schnelle, genaue und wortgenaue Sprachtranskription konzentriert. Es liefert genaue Zeitstempel auf Wortebene, auch bei Sprachfüllungen und Pausen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

03K

PDFMathTranslate: KI-Übersetzungswerkzeug, das die vollständige Typografie von PDFs bewahrt

Umfassende Einführung PDFMathTranslate ist ein Open-Source-Tool auf die Übersetzung von wissenschaftlichen Arbeiten konzentriert, können PDF-Dokumente in vollem Umfang übersetzt werden und erzeugen eine zweisprachige Version. Es verwendet AI-Technologie, um das ursprüngliche Dokument-Layout zu erhalten, einschließlich Formeln, Diagramme, Inhaltsverzeichnisse und Notizen, Unterstützung ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # Diplomarbeit

vor 2 Monaten

03K

XHS-Downloader：免费小红书数据采集工具，支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: kostenloses Xiaohongshu-Datenerfassungstool, Unterstützung von Stapeldownloads, Videoextraktion, Bildwasserzeichen

综合介绍 XHS-Downloader 是一个开源工具，专为小红书用户设计，支持提取和下载小红书上的无水印图片和视频作品。该工具提供多种功能，包括从浏览器获取 Cookie、支持命令行操作、批量下载...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 12 Monaten

03K

Smolagents: Open-Source-Projekt für die schnelle Entwicklung von KI-Intelligenzen und die leichtgewichtige Konstruktion von Intelligenzen

Umfassende Einführung Smolagents ist eine leichtgewichtige intelligente Agentenbibliothek, die von HuggingFace entwickelt wurde und sich auf die Vereinfachung des Entwicklungsprozesses von KI-Agentensystemen konzentriert. Das Projekt ist bekannt für seine einfache Designphilosophie mit nur etwa 1000 Zeilen Kerncode und bietet dennoch leistungsstarke Funktionen zur Integration. Es ist sehr ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 7 Monaten

03K

Obsidian Copilot：在Obsidian中使用AI助手体验智能化笔记助手

Obsidian Copilot: Erleben Sie den intelligenten Notizen-Assistenten mit AI Assistant in Obsidian

Allgemeine Einführung Obsidian Copilot ist ein leistungsstarkes KI-Assistenten-Plugin für die Obsidian Notes Software, das die Intelligenz von OpenAI nahtlos in Obsidian Notes Workflows integriert. Das Plugin wurde vom Entwickler Logan Yang erstellt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Anmerkungen

vor 8 Monaten

03K

Page Assist: Web-Assistent-Plugin für nativen KI-Modell-Dialog und Abruf von Dokumenten

Allgemeine Einführung Page Assist ist eine Open-Source-Browser-Erweiterung, die Benutzern eine einfache Möglichkeit zur Interaktion mit lokalen KI-Modellen bietet. Mit dieser Erweiterung können Benutzer eine Seitenleiste auf jeder Webseite öffnen, um mit lokal laufenden KI-Modellen zu interagieren....

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung # Browser AI-Assistent

vor 4 Monaten

03K

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

Browser Use Web UI: ein Open-Source-Framework für den Einsatz von KI-Intelligenzen beim Browsen im Internet, das es KI ermöglicht, Webseiten automatisch zu bearbeiten

Allgemeine Einführung Browser Use Web UI ist ein innovatives Open-Source-Projekt, das sich auf die Bereitstellung von KI-Agenten mit Browser-Interaktionsfähigkeiten als grafisches Schnittstellenwerkzeug konzentriert. Das Projekt baut auf dem Kern-Framework von Browser Use auf, das mit Gradio ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 2 Monaten

02.9K

HeyGem: Auf Silizium basierendes intelligentes Open-Source-Produkt Heygen digital human ping-pong

Allgemeine Einführung HeyGem ist ein vollständig offline arbeitendes Video-Compositing-Tool für Windows-Systeme, das vom GuijiAI (Silicon Intelligence)-Team entwickelt und auf GitHub veröffentlicht wurde. Es verwendet fortschrittliche KI-Algorithmen, um das Aussehen und die Stimme des Benutzers genau zu klonen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man

vor 2 Monaten

02.9K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: Komplettes digitales menschliches Videogenerierungs-Framework | Portrait zu Video | Pose zu Video | Lippensynchronisation

Allgemeine Einführung MuseV ist ein öffentliches Projekt auf GitHub mit dem Ziel, Avatar-Videos von unbegrenzter Länge und hoher Wiedergabetreue zu erzeugen. Es basiert auf Diffusionstechnologie und bietet Image2Video, Text2Image2Video, Video2Video...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man # Anschluss-Synchronisation

vor 8 Monaten

02.9K

PraisonAI: Ein Low-Code Multi-Intelligent Body Framework zur Vereinfachung von Automatisierungslösungen für komplexe Aufgaben

Umfassende Einführung PraisonAI ist ein sofort einsatzbereites Multi-Intelligenz-Framework für Produktionsumgebungen, das für die Erstellung von KI-Intelligenzen zur Automatisierung und Lösung von Problemen entwickelt wurde, die von einfachen Aufgaben bis zu komplexen Herausforderungen reichen. Das Framework bietet eine Low-Code-Lösung, die den Aufbau von multi-intelligenten Body-LLM-Systemen vereinfacht und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 6 Monaten

02.9K

Continue：与VS Code集成并自定义模型和embedding的开源AI代码助手

Weiter: Open-Source-KI-Code-Assistent, der sich in VS Code integriert und Modelle und Einbettungen anpasst

Allgemeine Einführung Continue ist ein Open-Source-KI-Code-Assistent, der die Effizienz von Softwareentwicklern verbessern soll. Zu seinen Hauptfunktionen gehören die automatische Code-Vervollständigung, Code-Optimierung und intelligente Code-Vorschläge für VS Code und JetBrains IDEs....

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 6 Monaten

02.9K

TinyZero: eine kostengünstige Nachbildung von DeepSeeK-R1 Zeros Epiphanie-Effekt

综合介绍 TinyZero 是一个基于 veRL 的强化学习模型，旨在复现 DeepSeeK-R1 Zero 在倒计时和乘法任务中的表现。令人惊讶的是，该项目仅需 30 美元的运行成本（使用 2xH2...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

02.9K

Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama

Umfassende Einführung Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket verfügbar als auch als benutzerfreundliche Strea...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 7 Monaten

02.9K

TableGPT2: Ein multimodales Modell für die Integration tabellarischer Daten

综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型，专注于表格数据的集成和处理。该模型通过预训练和微调，能够在表格数据相关任务中表现出色，同时保持强大的通用语言和编码能力。TableGP...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 9 Monaten

02.9K

GraphRAG-Dify: Ausstattung von Dify mit GraphRAG-Funktionen

Umfassende Einführung GraphRAG-Dify ist ein Open-Source-Projekt, das GraphRAG- und Dify-Technologie kombiniert, um schnell KI-Agenten zu erstellen und einzusetzen. Das Projekt nutzt FastAPI und Uvicorn für die Erstellung von Diensten und unterstützt den DSL-Import, was für...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm

vor 9 Monaten

02.9K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: Unterstützung für eine Vielzahl von Formaten, Dokumentenparsing und Export als Markdown und JSON, PDF-Unterstützung OCR

Umfassende Einführung Docling ist ein leistungsstarkes Tool zum Parsen und Exportieren von Dokumenten, das eine Vielzahl von Dokumentenformaten unterstützt, darunter PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc und Markdown....

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

02.9K

Dify Workflow DSL File Collection Download

Allgemeine Einführung Awesome-Dify-Workflow ist ein Open-Source-Projekt auf GitHub, das sich auf den Austausch nützlicher Dify-Workflow-Vorlagen konzentriert.Dify ist eine Workflow-Plattform, die die Entwicklung großer Sprachmodellierungsanwendungen unterstützt, und dieses...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 4 Monaten

02.9K

Kolors Virtual Try On：高效的虚拟试穿/模特换装，文本到图像生成模型

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

Allgemeine Einführung Kolors Virtual Try-On ist eine virtuelle Anprobe-App des Kwai-Kolors-Teams auf der Hugging Face-Plattform. Die App nutzt fortschrittliche Technologie der künstlichen Intelligenz, um den Nutzern zu helfen, virtuelle...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Gesichtstausch und Verkleidung

vor 8 Monaten

02.9K

Easy-Wav2Lip: Tool für hochwertige Video-Lippensynchronisation, optimiert für Wav2Lip

Allgemeine Einführung Easy-Wav2Lip ist ein verbessertes Tool, das auf Wav2Lip basiert und den Prozess der Video-Lippensynchronisation vereinfachen soll. Das Tool bietet eine einfachere Einrichtung und Implementierung mit Unterstützung für Google Colab und lokale Installation. Durch die Optimierung des Algorithmus, Ea...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Anschluss-Synchronisation

vor 8 Monaten

02.9K

Browser-Use: Entwicklung intelligenter Web-Automatisierungs-Tools für KI-Intelligenz zur einfachen Bedienung von Browsern

Umfassende Einführung Browser-Use ist ein innovatives Open-Source-Web-Automatisierungstool, das speziell entwickelt wurde, um Sprachmodelle (LLMs) in die Lage zu versetzen, auf natürliche Weise mit Websites zu interagieren. Es bietet ein leistungsfähiges und flexibles Framework, das eine breite Palette von Mainstream-Sprachmodellen unterstützt, darunter GPT-4, Claud...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 8 Monaten

02.8K

E2M: Konvertieren Sie mehrere Dateiformate in Markdown und erzielen Sie auf einfache Weise eine einheitliche Dokumentenformatierung.

Allgemeine Einführung E2M (Everything to Markdown) ist eine Open-Source-Python-Bibliothek, die eine Vielzahl von Dateiformaten in das Markdown-Format konvertieren kann. Das Tool unterstützt Formate wie doc, docx, epub, html, htm, u...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

02.8K

AsrTools: Werkzeug zur Umwandlung von Sprache in Untertitel, leichtgewichtiger Client mit integrierten Schnittstellen zu Cutscene, Racer und Must-Cut

Umfassende Einführung AsrTools ist ein intelligentes Sprache-zu-Text-Tool mit eingebauten Schnittstellen von großen Herstellern wie Cutscene, Racer, Must Cut, usw. Es erfordert keine GPU oder umständliche Konfiguration und unterstützt effiziente Multi-Thread-Batch-Verarbeitung. Es basiert auf PyQt5 Entwicklung, schöne und benutzerfreundliche Schnittstelle, in der Lage, SRT und TXT-Format Wörter auszugeben...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 10 Monaten

02.8K

ComfyUI Portrait Master 中文版：优化肖像生成的提示词工具

ComfyUI Portrait Master Chinesische Version: Cue-Word-Tool zur Optimierung der Porträt-Erstellung

Allgemeine Einführung ComfyUI Portrait Master (chinesische Version) ist ein Werkzeug zur Erstellung von Porträtstichwörtern, das für KI-Bildgestalter entwickelt wurde. Das Tool hilft dem Benutzer, qualitativ hochwertige Porträts zu erstellen, indem es die Stichwörter optimiert. Die Benutzer können verschiedene Linsen je nach Bedarf auswählen...

Neueste AI-Ressourcen # AI-Bilderzeugungshilfsmittel # AI Java Open Source Projekt # ComfyUI

vor 11 Monaten

02.8K

Wav2Lip: Open-Source-Tool für hochpräzise Lippensynchronisation (empfohlen)

Allgemeine Einführung Wav2Lip ist ein Open-Source-Tool zur Erzeugung hochpräziser Lippensynchronisation, mit dem sich beliebige Audiodaten genau mit der Lippensynchronisation in Videos synchronisieren lassen. Das Tool wurde von Rudrabha Mukhopadhyay et al. in ACM Multimedia 20 entwickelt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Anschluss-Synchronisation

vor 7 Monaten

02.8K

MathTranslate: LaTeX-Übersetzungstool für wissenschaftliche Arbeiten

Allgemeine Einführung MathTranslate ist ein Online-Tool für die Übersetzung von LaTeX-Dokumenten, insbesondere für wissenschaftliche Arbeiten. Das Tool ist in der Lage, LaTeX-Ausdrücke (z.B. mathematische Ausdrücke) unverändert zu lassen und kompiliert schließlich LaTeX-Dokumente in...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # Diplomarbeit

vor 7 Monaten

02.8K

FunASR: Open Source Spracherkennungs-Toolkit, Sprechertrennung / Mehr-Personen-Dialog-Spracherkennung

Umfassende Einführung FunASR ist ein Open-Source-Spracherkennungs-Toolkit, das von der Alibaba Dharmo Academy entwickelt wurde, um akademische Forschung und industrielle Anwendungen zu verbinden. Es unterstützt eine breite Palette von Spracherkennungsfunktionen, einschließlich Spracherkennung (ASR), Voice Endpoint Detection (VAD), Interpunktionswiederherstellung, Sprachmodellierung,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 10 Monaten

02.8K

OpenAI Realtime Agents：多智能体语音交互应用（OpenAI示例）

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

Allgemeine Einführung OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-API von OpenAI verwendet werden kann, um multi-intelligente Körpersprache-Anwendungen zu erstellen. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt von OpenAI Swarm), das es erlaubt,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 7 Monaten

02.8K

ElizaOS: Autonom ausführende Multi-Intelligenz, ein voll funktionsfähiges Open-Source-Framework zur Entwicklung intelligenter Körper

Umfassende Einführung Eliza ist eine fortschrittliche Multi-Intelligenz Körper (Multi-Agent) Entwicklungsrahmen, ist zur Vereinfachung der Konstruktion und Bereitstellung von autonomen intelligenten Körper (Autonomous Agent) Prozess verpflichtet. Es unterstützt den Einsatz von mehreren intelligenten Körpern mit unterschiedlichen Rolleneinstellungen, kann intelligente ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 7 Monaten

02.8K

Cursor Reset：重置 Cursor 0.45.x 以上版本设备标识的脚本

Cursor Reset: Skript zum Zurücksetzen der Gerätekennung für Cursor-Versionen 0.45.x und höher.

综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具，支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 6 Monaten

02.8K

腾讯混元3D（Hunyuan3D）：生成高分辨率3D资产，多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): Erzeugung hochauflösender 3D-Assets, mehrere Workflows zur Erzeugung von 3D-Material

Umfassende Einführung Tencent Hunyuan3D (Hunyuan3D 2.0) ist ein fortschrittliches, groß angelegtes 3D-Compositing-System von Tencent, das für die Erzeugung hochauflösender texturierter 3D-Assets entwickelt wurde. Das System besteht aus zwei Kernkomponenten: Hunyuan3D-DiT, einem groß angelegten Modell zur Formerzeugung, und Hunyuan3D-DiT, einer groß angelegten Textur...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text und Bild in 3D

vor 7 Monaten

02.7K

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

02.7K

AI Hedge Fund：开源自动化交易系统，利用多智能体进行复杂对冲基金交易决策

AI Hedge Fund: quelloffenes automatisiertes Handelssystem, das mehrere Intelligenzen nutzt, um komplexe Handelsentscheidungen für Hedgefonds zu treffen

Allgemeine Einführung AI Hedge Fund ist ein Hedgefonds mit künstlicher Intelligenz, der ein Multi-Agenten-System nutzt, um Handelsentscheidungen zu treffen. Das System arbeitet mit mehreren spezialisierten Agenten zusammen, darunter Marktdaten-Agenten, quantitative Agenten, Risikomanagement-Agenten und Portfoliomanagement-Agenten, um komplexe Handelsentscheidungen...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Finanzdatenanalyse

vor 7 Monaten

02.7K

AI Chatbot Supabase：开源的Next.js和Supabase构建的AI聊天机器人，快速部署到Vercel。

AI Chatbot Supabase: Open Source Next.js und Supabase haben einen AI Chatbot für den schnellen Einsatz in Vercel entwickelt.

Allgemeine Einführung AI Chatbot Supabase ist eine quelloffene AI-Chatbot-Vorlage, die auf Next.js und Supabase basiert. Das Projekt wurde von Vercel entwickelt und zielt darauf ab, eine voll funktionsfähige und anpassbare Chatbot-Lösung bereitzustellen. Durch ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensabfrage und RAG-Rahmen

vor 8 Monaten

02.7K

Memary: ein Open-Source-Projekt zur Verbesserung des Langzeitgedächtnisses von Agenten mithilfe von Wissensgraphen

Allgemeine Einführung Memary ist ein innovatives Open-Source-Projekt, das sich auf die Bereitstellung von Langzeitspeicherverwaltungslösungen für autonome Intelligenzen konzentriert. Das Projekt hilft Intelligenzen, die Grenzen traditioneller Kontextfenster zu durchbrechen, um durch Wissensgraphen und spezialisierte Speichermodule intelligentere Interaktionserfahrungen zu machen....

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper # Wissensdiagramm

vor 7 Monaten

02.7K

OpenBB: Open-Source-Finanzdaten-Analyseplattform, die private Datensätze und KI zur Verbesserung der Anlageentscheidungen integriert

Allgemeine Einführung OpenBB ist eine kostenlose und vollständig quelloffene Finanzdaten-Analyseplattform, die entwickelt wurde, um einen einfachen Zugang zu Finanzdaten und Analysetools für alle zu ermöglichen. Die Plattform integriert über 100 verschiedene Datenquellen, die Aktien, Optionen, Kryptowährungen, Forex, makroökonomische Indikatoren,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Finanzdatenanalyse

vor 7 Monaten

02.7K

Chatbot UI: eine quelloffene KI-Chat-App, die die Oberfläche und Funktionalität von ChatGPT nachahmt

Allgemeine Einführung Chatbot UI ist ein Open-Source-Projekt, das Entwicklern helfen soll, personalisierte und intelligente Konversationsschnittstellen zu erstellen. Das Projekt bietet eine Reihe von Schnittstellenkomponenten und interaktiven Funktionen, die leicht in das bestehende Chatbot-System integriert werden können, um den Benutzern einen flüssigeren und intelligenteren Dialogkörper zu bieten...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 11 Monaten

02.7K

Screenshot to Code: AI-Tool zur Umwandlung von Screenshots in sauberen Front-End-Code

Allgemeine Einführung Screenshot-to-Code ist ein Open-Source-Tool, das künstliche Intelligenz nutzt, um Screenshots, Designentwürfe und Figma-Entwürfe in sauberen, funktionalen Code zu konvertieren. Das Tool unterstützt mehrere Front-End-Technologie-Stacks, einschließlich HTML, Tailwind CS...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Seitengestaltung

vor 9 Monaten

02.7K

DeOldify: das klassische Open-Source-Tool zum Einfärben von Schwarz-Weiß-Fotos und Videos mit Hilfe von KI-Techniken

Umfassende Einführung DeOldify ist ein Open-Source-Projekt, das auf Deep-Learning-Technologie basiert und sich der intelligenten Einfärbung und Restaurierung von Schwarzweißfotos und -videos widmet. Das Projekt verwendet eine innovative NoGAN-Trainingsmethode, um die üblichen Mängel herkömmlicher GAN-Netzwerke bei der Bildeinfärbung erfolgreich zu beheben...

Neueste AI-Ressourcen # AI Bildvergrößerung und -wiederherstellung # AI Image Style Control # AI Java Open Source Projekt

vor 8 Monaten

02.7K

Paperless-AI：使用AI自动分析和标记文档，适用 paperless-ngx 文档管理系统

Paperless-AI: Automatische Analyse und Verschlagwortung von Dokumenten mittels KI für das Dokumentenmanagementsystem paperless-ngx

Allgemeine Einführung Paperless-AI ist ein innovatives Analyse-Tool zur Automatisierung von Dokumenten, das speziell für das Dokumentenmanagement-System Paperless-ngx entwickelt wurde. Es kombiniert auf clevere Weise die OpenAI-API mit einer Vielzahl von fortschrittlichen KI-Modellen wie Ollama...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensabfrage und RAG-Rahmen

vor 7 Monaten

02.7K

GitIngest: Schnelle Konvertierung von Github-Code-Repositories in Text, der für LLM-Verständnis geeignet ist

Allgemeine Einführung GitIngest ist ein Open-Source-Tool zur Umwandlung von GitHub-Code-Repositories in Text, der für Large Language Model (LLM)-Hinweise geeignet ist. Mit einem einfachen Vorgang können Benutzer den Inhalt eines beliebigen GitHub-Repository extrahieren und formatieren, damit er in das LLM passt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

02.7K

RAGFlow: eine quelloffene RAG-Engine, die auf einem tiefgreifenden Verständnis von Dokumenten basiert und effiziente Retrieval-gestützte Generierungsworkflows ermöglicht

Umfassende Einführung RAGFlow ist eine quelloffene Retrieval Augmented Generation (RAG)-Engine, die auf der Deep Document Understanding-Technologie basiert. Sie bietet einen effizienten RAG-Workflow für Unternehmen jeder Größe, der ein umfangreiches Sprachmodell (LLM) beinhaltet, das Daten in komplexen Formaten auf der Basis von...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Niedrig-Code-Arbeitsablauf # Wissensabfrage und RAG-Rahmen

vor 7 Monaten

02.7K

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI: Umgekehrte Generierung von Gemini-Adressen unter Umgehung von Regionsbeschränkungen und Umwandlung in OpenAI-kompatible APIs

Allgemeine Einführung Der Gemini OpenAI API Agent ist ein kostenloser und serverwartungsfreier OpenAI-konformer Endpunkt. Benutzer können ihn einfach auf Plattformen wie Vercel, Netlify und Cloudflare für den persönlichen Gebrauch einsetzen. Das Projekt ...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

02.7K

AutoGen Studio: Einfach zu bedienende Schnittstellenversion des Multiagentensystems AutoGen

Allgemeine Beschreibung AutoGen Studio 2.0 ist eine von AutoGen unterstützte Benutzeroberfläche, die den Prozess der Erstellung und Verwaltung von Multi-Agenten-Lösungen vereinfachen soll. Die Plattform ermöglicht es Benutzern, Agenten und ihre Arbeitsabläufe über eine intuitive Schnittstelle deklarativ zu definieren und zu modifizieren...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 7 Monaten

02.7K

Amphion MaskGCT: Null-Sample Text-zu-Sprache-Klonmodell (lokales Ein-Klick-Bereitstellungspaket)

Umfassende Einführung MaskGCT (Masked Generative Codec Transformer) ist ein vollständig nicht-autoregressives Text-to-Speech (TTS)-Modell, das gemeinsam von Funky Maru Technology und der Chinese University of Hong Kong eingeführt wurde. Das Modell erfordert keine explizite Text-zu-Sprache ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 9 Monaten

02.7K

MMAudio: Erzeugung von synchronisierten Soundeffekten und Tonspuren für Videomaterial, multimodales Co-Trainingstool für Video und Audio

Allgemeine Einführung MMAudio ist ein Open-Source-Projekt, das darauf abzielt, durch gemeinsames multimodales Training hochwertiges synchronisiertes Audio zu erzeugen. Entwickelt von Ho Kei Cheng et al. an der Chinese University of Hong Kong, besteht die Hauptfunktion des Projekts in der Erzeugung von synchronisiertem Audio auf der Grundlage von Video- und/oder Texteingaben....

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Musik

vor 8 Monaten

02.7K

"Always-On" Deepseek AI Assistant: Aufbau eines intelligenten Sprachinteraktionssystems auf Basis von Deepseek-V3

Umfassende Einführung Always-On AI Assistant ist ein innovatives KI-Assistentenprojekt, das durch die Integration fortschrittlicher Technologien wie Deepseek-V3, RealtimeSTT und Typer ein leistungsstarkes, permanent online verfügbares KI-Assistenzsystem schafft...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 7 Monaten

02.6K

Text generation web UI：基于 Gradio 大语言模型聊天界面，支持多种后端服务

Web-UI zur Texterstellung: Gradio-basierte Chat-Schnittstelle mit großem Sprachmodell und Unterstützung für mehrere Backend-Dienste

Allgemeine Einführung Textgenerierungs-Web-UI ist eine Gradio-basierte Web-UI, die für das Large Language Model (LLM) entwickelt wurde. Es unterstützt eine Vielzahl von Textgenerierungs-Backends, einschließlich Transformers, llama.cp...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 9 Monaten

02.6K

Marker: PDF schnell in Markdown konvertieren Open-Source-Tools

Allgemeine Einführung Marker ist ein auf Deep Learning basierendes Tool zur Dokumentenverarbeitung, das PDF-Dateien schnell und präzise in das Markdown-Format konvertiert. Es unterstützt eine breite Palette von Dokumenttypen und ist besonders für die Konvertierung von Büchern und wissenschaftlichen Arbeiten optimiert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

02.6K

LiveTalking: quelloffenes, interaktives, digitales Echtzeit-Live-System, das einen synchronen Audio- und Videodialog ermöglicht

Umfassende Einführung LiveTalking ist ein Open-Source-Echtzeit-interaktive digitale menschliche System, ist verpflichtet, hochwertige digitale menschliche Live-Lösung zu bauen. Das Projekt verwendet das Apache 2.0 Open-Source-Protokoll, integriert mit einer Reihe von Spitzentechnologien, einschließlich ER-NeRF-Rendering, Echtzeit-Audio-und Video-Streaming-Verarbeitung ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man

vor 7 Monaten

02.6K

Surya: Professionelles mehrsprachiges OCR-Tool für Dokumente, Open Source Native Deployment

Umfassende Einführung Surya ist ein Open-Source-Toolkit für die mehrsprachige OCR von Dokumenten, das die Texterkennung in über 90 Sprachen unterstützt. Es führt nicht nur eine zeilenweise Texterkennung durch, sondern auch eine Layout-Analyse, eine Erkennung der Lesereihenfolge und eine Tabellenerkennung...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 10 Monaten

02.6K

Flux Gym: einfache Benutzeroberfläche für das Training von FLUX LoRA mit geringem Grafikspeicher

Allgemeine Einführung Flux Gym ist eine einfache Web-UI für das Training von FLUX LoRA mit Unterstützung für niedrigen Grafikspeicher (12GB/16GB/20GB). Das Front-End basiert auf AI-Toolkit's Gradio UI und das Back-End wird von Kohya Scri...

Neueste AI-Ressourcen # AI-Bilderzeugungshilfsmittel # AI Java Open Source Projekt

vor 9 Monaten

02.6K

OmniGen: Ein einheitliches Bildgenerierungsmodell mit multimodalen Eingaben zur Generierung zeichenkonsistenter Bilder

Allgemeine Einführung OmniGen ist ein von VectorSpaceLab entwickeltes "universelles" Bilderzeugungsmodell, das es den Benutzern ermöglicht, mit einfachen Texteingaben oder multimodalen Eingaben vielfältige und kontextreiche visuelle Effekte zu erzeugen. Es eignet sich besonders gut für Anwendungen, bei denen es auf die Erkennung von...

Neueste AI-Ressourcen # AI Online-Bilderzeugung # AI Java Open Source Projekt

vor 9 Monaten

02.6K

edge-tts: Text-to-Speech Python-Modul | Freier Text-to-Speech-Dienst

Allgemeine Beschreibung edge-tts ist ein Open-Source-Python-Modul, das es Benutzern ermöglicht, den Online-Text-to-Speech-Dienst von Microsoft Edge in Python-Code zu verwenden, ohne dass der Microsoft Edge-Browser, das Windows-Betriebssystem oder das API-Geheimnis...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 10 Monaten

02.6K

Open R1：Hugging Face 复现 DeepSeek-R1 的训练过程

Open R1: Umarmendes Gesicht repliziert den DeepSeek-R1 Trainingsprozess

综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目，旨在构建R1管道的缺失部分，使每个人都能复现并在其基础上进行构建。该项目设计简单，主要包括训练和评...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

02.6K

Nanobrowser: Multi-Intelligenz-Plugin für die Aufgabenautomatisierung in Browsern

Allgemeine Beschreibung Nanobrowser ist eine Open-Source-Chrome-Erweiterung, die entwickelt wurde, um Web-Aufgaben durch ein KI-gesteuertes Multi-Agenten-System zu automatisieren. Es ist eine kostenlose Alternative zu OpenAI Operator, wo die Benutzer einfach ihre LLM...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 5 Monaten

02.6K

LatentSync: ein Open-Source-Tool zur Erzeugung von lippensynchronem Video direkt aus Audio

Allgemeine Einführung LatentSync ist ein Open-Source-Tool, das von ByteDance entwickelt und auf GitHub gehostet wird. Es steuert die Lippenbewegungen von Charakteren in einem Video direkt durch den Ton, so dass die Mundform genau mit der Stimme übereinstimmt. Das Projekt basiert auf Stable Di...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Anschluss-Synchronisation

vor 2 Monaten

02.6K

Model Context Provider CLI：任意大模型中使用MCP服务的命令行工具，不依赖Claude

Model Context Provider CLI: Kommandozeilentool zur Nutzung von MCP-Diensten in jedem großen Modell, unabhängig von Claude.

Umfassende Einführung Der Model Context Provider CLI (mcp-cli) ist ein Befehlszeilenwerkzeug auf Protokollebene für die Interaktion mit einem Model Context Provider-Server. Mit diesem Tool können Benutzer Befehle senden, Daten abfragen und mit verschiedenen vom Server bereitgestellten Ressourcen interagieren...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste

vor 5 Monaten

02.6K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: Die Entwicklung generativer KI-Anwendungen mit Pydantic macht es einfacher, produktionsreife KI-Anwendungen zu entwickeln

Allgemeine Einführung PydanticAI ist ein Pydantic-basiertes Python-Agenten-Framework, das die Entwicklung von generativen KI-Anwendungen vereinfachen soll. Es wurde vom Pydantic-Team entwickelt und unterstützt eine breite Palette von Modellen (z.B. OpenAI, Gemini, Groq, etc.) und...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 8 Monaten

02.6K

LibreChat: Open-Source-Projekt für KI-Dialoge, das die ChatGPT-Interaktion nachahmt

Allgemeine Einführung LibreChat ist eine freie, quelloffene KI-Chat-Plattform mit umfangreichen Anpassungsmöglichkeiten und Unterstützung für mehrere KI-Anbieter, Dienste und Integrationen. Sie vereint alle KI-Unterhaltungen an einem Ort mit einer vertrauten Oberfläche und innovativen Funktionen und unterstützt mehrere KI-Modelle, Plugins und mehrere Sprachen. Von...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 12 Monaten

02.6K

LLPlayer: ein Videoplayer, der in Echtzeit Untertitel mit zweisprachiger Übersetzung erzeugt

Allgemeine Einführung LLPlayer ist ein Open-Source-Medienplayer für Sprachschüler, der auf GitHub gehostet und vom Entwickler umlx5h erstellt wurde. Es integriert eine Vielzahl von nützlichen Funktionen wie zweisprachige Untertitel-Anzeige, AI automatisch generierte Untertitel, Echtzeit-Übersetzung und Wortsuche...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 2 Monaten

02.6K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: Extraktion und Konvertierung von PDF-Dokumenten in das multimodale Markdown-Format, Unterstützung von OCR-Scans für E-Books

Umfassende Einführung MinerU ist ein Open-Source-Tool zur Datenextraktion, das vom OpenDataLab-Team am Shanghai Artificial Intelligence Laboratory entwickelt wurde und sich auf die effiziente Extraktion von Inhalten aus komplexen PDF-Dokumenten, Webseiten und eBooks konzentriert. Es ist in der Lage, multimodale PDFs zu verarbeiten, die Bilder, Formeln, Tabellen und andere Elemente enthalten...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 10 Monaten

02.6K

Fish Speech: Schnelles und hochpräzises Klonen von chinesischer und englischer Sprache mit nur wenigen Samples

Allgemeine Einführung Fish Speech ist ein von Fish Audio entwickeltes Open-Source-Tool zur Text-zu-Sprache-Synthese (TTS). Das Tool basiert auf modernsten KI-Technologien wie VQ-GAN, Llama und VITS und ist in der Lage, Text in realistische Sprache umzuwandeln....

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 6 Monaten

02.6K

KAG: Ein professionelles Wissensdatenbank-Q&A-Framework für hybride Wissensgraphen- und Vektor-Retrieval

Umfassende Einführung KAG (Knowledge Augmented Generation) ist ein logisches, formgeleitetes Reasoning- und Retrieval-Framework, das auf der OpenSPG-Engine und Large Language Models (LLMs) basiert. Das Framework ist speziell für den Aufbau professioneller Wissensdatenbanken konzipiert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm # Wissensabfrage und RAG-Rahmen

vor 8 Monaten

02.6K

Empfohlenes Github ausgezeichnetes Open-Source-Download-Tool

在互联网高速发展的今天，下载工具作为用户获取信息和资源的重要手段，扮演着不可或缺的角色。本文将系统分析五款开源下载工具：AB Download Manager、XDM（Xtreme Download ...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 10 Monaten

02.6K

Weebo: ein Echtzeit-Sprach-Chatbot, der einen Dialog in natürlicher Sprache ermöglicht

Allgemeine Einführung Weebo ist ein quelloffener Echtzeit-Sprach-Chatbot, der Whisper Small für die Spracherkennung, Llama 3.2 für die Erzeugung natürlicher Sprache und Kokoro-82M für die Sprachsynthese verwendet. Das Projekt wurde von Aman entwickelt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 7 Monaten

02.5K

Crawl4AI: quelloffenes asynchrones Webcrawler-Tool zur Extraktion strukturierter Daten ohne LLM

Umfassende Einführung Crawl4AI ist ein quelloffenes asynchrones Webcrawler-Tool, das für Large Language Models (LLMs) und Anwendungen der Künstlichen Intelligenz (KI) entwickelt wurde. Es vereinfacht den Web-Crawling- und Datenextraktionsprozess, unterstützt effizientes Web-Crawling und bietet LLM-freundliche Ausgabeformate für...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 9 Monaten

02.5K

Anubis: Beeinflussung von KI-Crawler-Crawling durch Proof of Workloads

Allgemeine Einführung Anubis ist ein Open-Source-Tool, das vom TecharoHQ-Team entwickelt wurde, um Websites vor AI-Crawlern zu schützen. Es fügt eine SHA256 Proof-of-Work-Challenge zu HTTP-Anfragen hinzu...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 4 Monaten

02.5K

Local File Organizer: Assistent für die lokale Dateiorganisation, AI organisiert automatisch Dateien

综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具，旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型，如 Llama3.2 3B 和 Llav...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 10 Monaten

02.5K

OpenSPG: Open-Source-Wissensgraphen-Engine

Umfassende Einführung OpenSPG ist eine Open-Source-Wissensgraphen-Engine, die von der Ant Group in Zusammenarbeit mit OpenKG entwickelt wurde und auf dem SPG-Framework (Semantic Augmented Programmable Graph) basiert. Die Engine wurde entwickelt, um Funktionen wie explizite semantische Repräsentation, logische Regeldefinition und einen operativen Rahmen zur Unterstützung der Konstruktion und Verwaltung von Wissensgraphen zu bieten...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm

vor 11 Monaten

02.5K

Gemini Cursor：基于Gemini构建的AI桌面智能助手，能看、能听、能说

Gemini Cursor: ein intelligenter KI-Desktop-Assistent, der auf Gemini aufbaut und sehen, hören und sprechen kann

Allgemeine Einführung Gemini Cursor ist ein intelligenter Desktop-Assistent, der auf Googles Gemini 2.0 Flash-Modell (experimentell) basiert. Er ermöglicht visuelle, auditive und sprachliche Interaktionen über eine multimodale API und bietet Echtzeit-Niedrig-Latenz-Nutzung...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 6 Monaten

02.5K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Einsatz von Microsoft Speech Synthesis APIs mit Cloudflare, OpenAI-kompatiblem Format und Packaged Web Interface

Allgemeine Einführung Edge TTS Worker (der sich auf edge-tts stützt) ist ein Proxy-Dienst, der auf Cloudflare Worker bereitgestellt wird und den Microsoft Edge TTS-Dienst in einem OpenAI-kompatiblen Format kapselt ...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Text-to-Speech

vor 7 Monaten

02.5K

NeoAI: Open-Source-Projekt, mit dem KI den Fernbetrieb von Computern übernehmen und sie mit natürlicher Sprache steuern kann

Allgemeine Einführung NeoAI ist ein innovatives Open-Source-KI-Assistententool, mit dem Benutzer ihre Computer durch Dialoge in natürlicher Sprache einfach steuern und verwalten können. Ohne irgendeinen Code zu schreiben, können Benutzer Dateisuche, Aufgabenautomatisierung, Gerätemanagement und vieles mehr mit nur einem täglichen Dialog durchführen.NeoAI...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 7 Monaten

02.5K

Langflow: ein Low-Code-Tool zur Erstellung leistungsstarker KI-Intelligenzen und Workflows

Allgemeine Einführung Langflow ist ein Low-Code-Tool für Entwickler, um leistungsstarke KI-Agenten und Workflows zu erstellen. Es unterstützt die Verwendung einer beliebigen API, eines Modells oder einer Datenbank und vereinfacht so die Entwicklung komplexer KI-Anwendungen.Langflow bietet eine intuitive visuelle...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Niedrig-Code-Arbeitsablauf

vor 8 Monaten

02.5K

Open Operator: Automatisierung in Cloud Browsern mit KI-Intelligenz

Allgemeine Einführung Open Operator ist ein Open-Source-Projekt, das darauf abzielt, Operationen im Browser durch KI-Intelligenzen zu automatisieren. Das Projekt wird von Browserbase entwickelt und kombiniert die Technologien von Stagehand und Browserbase...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 7 Monaten

02.5K

GPT4Free: Dekompilierung der AI-Dialog-Website-Schnittstelle zur freien Nutzung mehrerer GPT-Modelle

Allgemeine Einführung GPT4Free ist ein Open-Source-Projekt, das vom Entwickler xtekky auf GitHub veröffentlicht wurde. Es zielt darauf ab, eine Vielzahl von leistungsstarken Sprachmodellen kostenlos zur Verfügung zu stellen, darunter GPT-3.5, GPT-4, Llama, Gemini-Pro, Bar...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Integrierte Multi-Modell-Dialogplattform

vor 9 Monaten

02.5K

Mehr laden