AI Open-Source-Projekt

Insgesamt 1020 Artikel

in Ordnung bringen

BlinkShot：输入提示词实时生成图像（免费接入Flux Schnell模型）

BlinkShot: Bilderzeugung in Echtzeit durch Eingabe von Schlüsselwörtern (kostenloser Zugang zum Flux Schnell Modell)

Allgemeine Beschreibung BlinkShot ist ein quelloffener Echtzeit-KI-Bildgenerator, der die Technologien Together AI und Flux Schnell nutzt, um Benutzern die Möglichkeit zu geben, bei der Eingabe von Aufforderungen qualitativ hochwertige Bilder zu erzeugen. Die Plattform ist völlig kostenlos und unterstützt die Anpassung durch den Benutzer und sekundäre offene...

Neueste AI-Ressourcen # AI Online-Bilderzeugung # AI Java Open Source Projekt

vor 10 Monaten

03.2K

MediaCrawler: Multi-Social-Media-Plattform Inhalt, Video-Kommentar-Crawler-Tool

Allgemeine Einführung MediaCrawler ist ein Crawler-Tool für soziale Medieninhalte, das für Entwickler entwickelt wurde. Durch die Bereitstellung einer leistungsstarken Crawler-Funktion kann es schnell Videos, Bilder, Kommentare, Likes, Retweets und andere Daten von sozialen Plattformen wie Xiaohongshu, Shake, Shutter, B, Weibo und anderen...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 12 Monaten

03.2K

MoneyPrinterPlus: KI-Tool zur Erstellung von Kurzvideos mit einem Klick, kostenloses Batch-Mixing

Umfassende Einführung MoneyPrinterPlus ist ein Open-Source-Projekt, das darauf abzielt, alle Arten von Kurzvideos mit einem Klick durch KI-Technologie zu erstellen und zu mischen und sie automatisch auf mehreren Videoplattformen wie Jieyin, Shutterbugs, Xiaohongshu und Video Number zu veröffentlichen. Das Tool unterstützt lokale und cloudbasierte Sprachmodelle, einschließlich Chat...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Video-Erzeugungstool

vor 11 Monaten

03.2K

Audiblez: Hörbücher erstellen, eBooks in Hörbücher umwandeln mit Kokoro

Allgemeine Einführung Audiblez ist ein Open-Source-Projekt zur Konvertierung von eBooks (z. B. im .epub-Format) in Hörbücher (z. B. im .m4b-Format). Das Projekt nutzt die hochwertige Sprachsynthesetechnologie von Kokoro, um mehrere Sprachen und mehrere Stimmen zu unterstützen. Benutzer können einfach...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 7 Monaten

03.2K

Novel: ein quelloffener Schreibeditor, der Notion AI nachahmt

Umfassende Einführung Dies ist ein Open-Source-Projekt von Steven Tey namens Novel entwickelt, ist es ein Notion Stil WYSIWYG-Text-Editor, integrierte AI Autovervollständigung Funktion, die Benutzer, um die Effizienz der Texteingabe zu verbessern helfen kann. Das Projekt bietet eine ausführliche Dokumentation und Installationsanweisungen ...

Neueste AI-Ressourcen # AI Schreiben # AI Java Open Source Projekt

vor 1 Jahr

03.2K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Beschreibung Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen, auch ohne NVIDIA GPU, und kann mit einer vorkompilierten App verwendet werden...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 10 Monaten

03.2K

EchoMimic：音频驱动人像照片生成说话视频（EchoMimicV2加速版安装包）

EchoMimic: Audiogestützte Porträts zur Erzeugung sprechender Videos (EchoMimicV2 beschleunigtes Installationsprogramm)

Allgemeine Einführung EchoMimic ist ein Open-Source-Projekt zur Erzeugung realistischer Porträtanimationen, die durch Audio gesteuert werden. Das von der Ant Group's Terminal Technologies Division entwickelte Projekt nutzt editierbare Markerpunktbedingungen, um dynamische Porträtvideos mit einer Kombination aus Audio und Gesichtsmarkerpunkten zu erzeugen.

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man

vor 7 Monaten

03.2K

KG Gen: ein Open-Source-Werkzeug zur automatischen Erstellung von Wissensgraphen aus einfachem Text

Allgemeine Einführung KGGen ist ein Open-Source-Tool, das vom Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab) entwickelt wurde und auf GitHub gehostet wird. Es dient der automatischen Generierung von Wissensgraphen aus beliebigen Texten. Es verwendet fortschrittliche Sprachmodellierungs- und Clustering-Algorithmen, um unstrukturierten Text...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm

vor 6 Monaten

03.2K

MetaGPT: Ein Multi-Intelligenz-Kollaborationsrahmen für den Aufbau von KI-Softwareentwicklungsteams für die Programmierung in natürlicher Sprache

Umfassende Einführung MetaGPT ist ein innovatives Multi-Intelligenz-Framework, mit dem der Betrieb eines kompletten KI-Softwareunternehmens simuliert werden soll. Das von geekan (Alexander Wu) entwickelte Projekt zielt darauf ab, GPT-Modelle mit unterschiedlichen Rollen zu einer kollaborativen Einheit zu kombinieren...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung # Entwicklungsrahmen für intelligente Körper

vor 5 Monaten

03.2K

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, De...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

03.2K

MCP-Dienst auf Basis der Vektorsuchmaschine Qdrant

Allgemeine Einführung mcp-server-qdrant ist ein Model Context Protocol (MCP)-Server, der auf der Vektorsuchmaschine Qdrant aufbaut. Er wird hauptsächlich verwendet, um KI-Systeme beim Speichern und Abrufen von Erinnerungen zu unterstützen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste

vor 5 Monaten

03.2K

Leave a trace (WeChatMsg): Export- und Analysetools für WeChat-Chat-Aufzeichnungen

Allgemeine Einführung WeChatMsg ist ein Open-Source-Projekt, das sich auf der GitHub-Plattform befindet. Das Tool zielt darauf ab, WeChat-Benutzern eine Möglichkeit zu bieten, WeChat-Chats zu extrahieren und in eine Vielzahl von Dokumenten (HTML, Word, CSV) zu exportieren, und die Erstellung von Jahresberichten zur Visualisierung von Chat-Daten zu unterstützen...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 1 Jahr

03.2K

Insanely Fast Whisper: schnelle und effiziente Transkription von Sprache in Text Open-Source-Projekt

Umfassende Einführung insanely-fast-whisper ist eine Audioübertragung, die das Whisper-Modell von OpenAI mit verschiedenen Optimierungstechniken (z.B. Transformers, Optimum, Flash Attention) kombiniert...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 7 Monaten

03.2K

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Eine umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und ein leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Data Science Laboratory der Universität von Hongkong (HKUDS) entwickelt, um ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm # Wissensabfrage und RAG-Rahmen

vor 7 Monaten

03.2K

Comics Downloader：开源免费漫画下载器，支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: Open-Source-Comic-Downloader, Unterstützung für Comics im PDF-, EPUB-, CBR- und CBZ-Format zum Herunterladen

Allgemeine Einführung Comics Downloader ist ein Open-Source-Tool, das Benutzern helfen soll, Comics und Comicbücher von verschiedenen Websites herunterzuladen. Das Tool unterstützt eine Vielzahl von Dateiformaten, einschließlich PDF, EPUB, CBR und CBZ, so dass die Benutzer nach ihren Bedürfnissen wählen können, um sie...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 8 Monaten

03.2K

MobileAgent: Multi-Agenten-Kollaboration für mobile Gerätebedienungsassistenten

Allgemeine Einführung MobileAgent ist ein leistungsstarker Assistent für die Bedienung von Mobilgeräten, der die Effizienz und Automatisierung der Bedienung von Mobilgeräten durch Multi-Agenten-Kollaboration und erweiterte visuelle Wahrnehmungsmodule verbessern soll. Er wurde vom X-PLUG-Team entwickelt und unterstützt Android und ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 7 Monaten

03.2K

SadTalker: Fotos zum Sprechen bringen | Mouth Sync Audio | Synthesised Mouth Sync Video | Free Digital People

Allgemeine Einführung SadTalker ist ein Open-Source-Tool, das ein einzelnes Porträtfoto mit einer Audiodatei kombiniert, um realistische sprechende Avatar-Videos für eine Vielzahl von Szenarien zu erstellen, wie z. B. personalisierte Nachrichten, Bildungsinhalte und mehr. Revolutionärer Einsatz von 3D-Modellierungstechnologien wie ExpNet und PoseVA...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man # Anschluss-Synchronisation

vor 6 Monaten

03.2K

Dify-WebUI：基于Dify API的桌面智能对话客户端，提供企业级AI对话能力

Dify-WebUI: ein intelligenter Dialog-Client für den Desktop, der auf der Dify-API basiert und KI-Dialogfähigkeiten auf Unternehmensebene bietet

Umfassende Einführung Dify-WebUI ist eine moderne intelligente Desktop-Dialoganwendung, die auf der Dify-API basiert und entwickelt wurde, um Unternehmen leistungsstarke KI-Dialogfunktionen zu bieten. Die Anwendung unterstützt mehrere voreingestellte Themenfarben, um den individuellen Bedürfnissen von Unternehmen gerecht zu werden, und verfügt über eine Wissensdatenbank-Managementfunktion, um...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 7 Monaten

03.2K

Eino: ByteDance's Open Source Golang Big Model Application Development Framework

综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架，旨在成为大模型（LLM）应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 5 Monaten

03.2K

YOLOv12: ein Open-Source-Tool für die Echtzeit-Erkennung von Bild- und Videozielen

Umfassende Einführung YOLOv12 ist ein Open-Source-Projekt, das vom GitHub-Benutzer sunsmarterjie entwickelt wurde und sich auf Echtzeit-Zielerkennungstechnologie konzentriert. Das Projekt basiert auf der YOLO (You Only Look Once) Reihe von Frameworks, die Einführung von Note ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Visuelle Zielerfassung

vor 6 Monaten

03.2K

OpenManus: die quelloffene Version von Manus von MetaGPT

Allgemeine Einführung OpenManus ist ein Open-Source-Projekt, das Nutzern helfen soll, Intelligenzen mit einfachen Konfigurationen lokal zu betreiben, um verschiedene kreative Ideen zu verwirklichen. Es wurde von den MetaGPT-Community-Mitgliedern @mannaandpoem, @XiangJinyu, @Mos...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 5 Monaten

03.2K

Firecrawl MCP Server：基于 Firecrawl 的网页爬虫 MCP 服务

Firecrawl MCP Server: Firecrawl-basierter Web Crawler MCP Dienst

Allgemeine Einführung Firecrawl MCP Server ist ein von MendableAI entwickeltes Open-Source-Tool, das auf der Implementierung des Model Context Protocol (MCP) basiert, mit Firecrawl A...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

03.2K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: Intelligentes Open-Source-Tool zur Aufzeichnung und Zusammenfassung von Meetings, das auf OpenAI Whisper basiert

Allgemeine Einführung MeetingMind ist eine fortschrittliche KI-Anwendung, die die Effizienz der Erfassung und Zusammenfassung von Geschäftsbesprechungen verbessern soll. Die App integriert die Whisper-Technologie von OpenAI für präzise Sprache-zu-Text und nutzt IBM Watso...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video

vor 10 Monaten

03.2K

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

Wasserzeichen-Entfernung：offene Quelle Bild Wasserzeichen Entfernung Werkzeug, Bild Wasserzeichen Erholung Originalbild

Allgemeine Einführung Watermark Removal ist ein Open-Source-Projekt, das maschinelles Lernen und Deep-Learning-Techniken für die Bildrestaurierung verwendet, insbesondere für die Entfernung von Wasserzeichen aus Bildern. Das Projekt wurde von Chimzuruoke Okafor entwickelt und ist inspiriert von Con...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Keying zum Ändern von Hintergründen

vor 6 Monaten

03.2K

CrewAI: Ein Rahmenwerk für kollaborative Intelligenz mit mehreren Rollen zur Vereinfachung komplexer Aufgaben

Umfassende Einführung CrewAI ist ein fortschrittliches Framework zur Orchestrierung der Zusammenarbeit zwischen Rollenspielen und autonomen KI-Agenten. Durch die Erleichterung der kollaborativen Intelligenz ermöglicht CrewAI den Agenten eine nahtlose Zusammenarbeit zur Lösung komplexer Aufgaben. Ganz gleich, ob Sie eine intelligente Assistentenplattform aufbauen, Kundenservice-Teams automatisieren oder Multi-Agenten...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 8 Monaten

03.2K

k8m: ein leichtgewichtiges KI-Konsolen-Tool zur Vereinfachung der Verwaltung von Kubernetes-Clustern

Allgemeine Einführung k8m ist ein leichtgewichtiges, plattformübergreifendes Mini Kubernetes AI Dashboard, das zur Vereinfachung der Clusterverwaltung entwickelt wurde. Es baut auf AMIS auf und ist über kom als Kubernetes-API-Gast verfügbar...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

03.2K

GPT Academic: Beste Arxiv Academic Paper Übersetzung, Fehlerkorrektur und Code-Interpretation

Allgemeine Einführung GPT Academic ist eine interaktive Plattform für große Sprachmodelle, die für die akademische Forschung optimiert ist. Sie bietet Werkzeuge für pragmatische interaktive Schnittstellen zu großen Sprachmodellen wie GPT/GLM, die speziell für das Übersetzen, Lesen, Polieren und Schreiben von Texten optimiert sind. Es verwendet ein modulares Design...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Bildungswerkzeuge # Diplomarbeit

vor 9 Monaten

03.1K

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Umfassende Einführung Easy-Voice-Toolkit ist ein multifunktionales Toolkit, das auf dem Open Source Speech Project basiert und eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI-Stimmenklonen

vor 11 Monaten

03.1K

Bailing: ein quelloffener Sprachdialogassistent mit niedriger Latenz für natürliche Konversation und Kommunikation

Umfassende Einführung Bailing (Bailing) ist ein Open-Source-Sprachdialog-Assistent, der entwickelt wurde, um einen natürlichen Dialog mit dem Benutzer durch Sprache zu führen. Das Projekt kombiniert Spracherkennung (ASR), Voice Activity Detection (VAD), Large Language Modelling (LLM) und Sprachsynthese (TTS) Technologien, um eine...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 7 Monaten

03.1K

NSFW-Detektor: Erkennt, ob eine Datei NSFW-Inhalte enthält, um die Datensicherheit zu gewährleisten.

Umfassende Einführung NSFW Detector ist ein KI-basiertes Tool zur Erkennung von anstößigen Inhalten, das hauptsächlich dazu dient, zu erkennen, ob Bilder, Videos, PDF-Dateien usw. anstößige Inhalte enthalten. Das Tool verwendet Falconsai/nsfwimagedetectio...

Neueste AI-Ressourcen # AI-Bilderzeugungshilfsmittel # AI Java Open Source Projekt

vor 8 Monaten

03.1K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: Freie Text-to-Speech-API mit Edge TTS, kompatibel mit OpenAI-Formaten

Allgemeine Einführung OpenAI Edge TTS ist ein Open-Source-Projekt, das eine native Text-to-Speech (TTS) API bereitstellt, die mit OpenAI kompatibel ist.

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 7 Monaten

03.1K

AIGCPanel: Open-Source-Klon des digital man-Integrationssystems, Bereitstellung des kostenlosen digital man-Clients mit einem Klick

Umfassende Einführung AigcPanel ist ein One-Stop AI Digital Human Production System für alle Benutzer, entwickelt mit electron+vue3+typescript Technologie Stack, unterstützt One-Click Deployment auf Windows. Das System ist so konzipiert, benutzerfreundlich zu sein, wie der Kern, auch...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man

vor 7 Monaten

03.1K

Mahilo: eine integrierte Plattform für die Verbindung verschiedener KI-Intelligenz-Frameworks zur Zusammenarbeit in Echtzeit

Allgemeine Einführung Mahilo ist eine quelloffene Multi-Intelligenz-Integrationsplattform, die vom Entwickler Jayesh Sharma auf GitHub veröffentlicht wurde. Sie soll Nutzern helfen, KI-Intelligenzen aus verschiedenen Frameworks zu verbinden, um Echtzeitkommunikation, Mensch-Computer-Interaktion und intelligente Zusammenarbeit zu unterstützen. Die ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 5 Monaten

03.1K

Llasa 1~8B: ein quelloffenes Text-zu-Sprache-Modell für hochwertige Spracherzeugung und Klonen

Allgemeine Einführung Llasa-3B ist ein Open-Source-Text-to-Speech-Modell (TTS), das vom Audio Lab der Hong Kong University of Science and Technology (HKUST Audio) entwickelt wurde. Das Modell basiert auf der Llama-3.2B-Architektur, die sorgfältig abgestimmt wurde, um eine qualitativ hochwertige Spracherzeugung zu bieten, die nicht nur mehrere...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech # AI-Stimmenklonen

vor 6 Monaten

03.1K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit von Ostris: Stabile Diffusion mit FLUX.1 Model Training Toolkit

Allgemeine Einführung AI Toolkit von Ostris ist ein Open-Source-KI-Toolset, das sich auf die Unterstützung von Stable Diffusion und FLUX.1-Modellen für Trainings- und Bilderzeugungsaufgaben konzentriert. Das Toolkit wird vom Entwickler Ostris erstellt und gepflegt,...

Neueste AI-Ressourcen # AI-Bilderzeugungshilfsmittel # AI Java Open Source Projekt # Feinabstimmung des großen Modells

vor 5 Monaten

03.1K

LogoCreator: Open-Source-Logo-Generator, der KI-Intelligenz nutzt, um professionelle Markenlogos zu erstellen

Allgemeine Einführung LogoCreator ist ein Open-Source-Logo-Generator, der auf dem Together AI- und Flux-Modell basiert und sich darauf konzentriert, schnelle und professionelle Logo-Designs für Unternehmen und Privatpersonen anzubieten. Das Projekt wird vom Entwickler Nutlope in Git entwickelt und als Open Source zur Verfügung gestellt...

Neueste AI-Ressourcen # AI Image Style Control # AI Java Open Source Projekt

vor 8 Monaten

03.1K

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

Allgemeine Beschreibung SynthLight ist ein Porträt-Relighting-Tool, das auf einem Diffusionsmodell basiert. Es lernt, synthetische Gesichtsbilder neu zu rendern, um Lichteffektanpassungen an reale Porträtfotos zu erreichen. Das Tool verwendet eine physikalische Rendering-Engine, um Datensätze zu erzeugen, die Lichttransformationen unter verschiedenen Lichtbedingungen simulieren...

Neueste AI-Ressourcen # AI Image Style Control # AI Java Open Source Projekt

vor 7 Monaten

03.1K

AI Hive: eine vielseitige Java-basierte AI-Chat-Integrationsplattform

Umfassende Einführung AI Beehive (ai-beehive) ist eine multifunktionale KI-Plattform, die auf der Java-Sprache mit Spring Boot 3 und JDK 17 basiert. Das Projekt integriert mehrere KI-Technologien, darunter ChatGPT...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 9 Monaten

03.1K

PDF-Extract-Kit: Extrahieren der komplexen Struktur des PDF-Inhalts mit dem Open-Source-Tool

Umfassende Einführung PDF-Extract-Kit ist ein Open-Source-Projekt, das vom OpenDataLab-Team entwickelt wurde und sich auf die effiziente Extraktion von hochwertigen Inhalten aus komplexen und vielfältigen PDF-Dokumenten konzentriert. Es integriert fortschrittliche Dokumenten-Parsing-Technologie zur Unterstützung von Layout-Erkennung, Formel-Erkennung ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 6 Monaten

03.1K

Wenduoduo AiPPT: KI-generierte PPT, Präsentationserstellung

Umfassende Einführung AiPPT ist ein PPT-Generierungstool, das auf der Technologie der künstlichen Intelligenz basiert und dem Benutzer helfen soll, schnell professionelle Präsentationen zu erstellen. Es generiert automatisch inhaltsreiche und schön gestaltete Folien, indem es Themen eingibt, Dateien hochlädt oder URLs bereitstellt, usw. Es unterstützt native Diagramme, Animationen und 3D-Spezialeffekte...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-generierte Präsentation/PPT

vor 6 Monaten

03.1K

n8n-mcp-server: MCP-Dienstprogramm für die Interaktion mit n8n-Workflows

Allgemeine Einführung n8n-mcp-server ist ein Open-Source-Projekt, das auf GitHub gehostet und von Leonard Sellem entwickelt wird. Es ist ein MCP (Model Context Protocol) Service-Tool, das sich auf...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste

vor 5 Monaten

03.1K

NarratoAI: Textgenerierte Film- und TV-Erzählung und automatisiertes Bearbeitungswerkzeug

Allgemeine Einführung NarratoAI ist ein vollautomatisches Tool, das Film- und Videoerzählung, automatische Bearbeitung, Synchronisation und Untertitelerstellung integriert. Es stützt sich auf die Technologie der groß angelegten Sprachmodellierung (LLM), um automatisch Texte zu generieren und Videos mit entsprechenden Synchronisationen und Untertiteln automatisch zu bearbeiten.

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Text zu Video

vor 11 Monaten

03.1K

Zonos: Hochwertige Sprachsynthese- und Sprachklonierungswerkzeuge

Allgemeine Einführung Zonos ist ein von Zyphra entwickeltes Open-Source-Sprachsynthese- und Sprachklonierungswerkzeug. Die Version Zonos-v0.1 verwendet ein fortschrittliches Transformator- und Überblendungsmodell, um eine hochwertige Sprachausgabe zu erzeugen. Das Tool unterstützt mehrere Sprachen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 6 Monaten

03.1K

Repomix: Verpackung der Code-Basis in eine Textdatei für den Abruf großer Modelle

Allgemeine Einführung Repomix (früher bekannt als Repopack) ist ein Open-Source-Tool, mit dem eine gesamte Codebasis in eine einzige, KI-freundliche Datei verpackt werden kann. Dieses Tool ermöglicht es Entwicklern, ihre Codebasis auf einfache Weise für große Sprachmodelle (wie Claude, Chat...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 7 Monaten

03.1K

YuE: Wandelt Liedtexte in ein Basismodell eines kompletten Songs um und unterstützt eine breite Palette von Musikstilen

Allgemeine Einführung YuE ist ein Open-Source-Basismodell für die Generierung kompletter Songs, das sich auf die Umwandlung von Liedtexten in komplette Songs konzentriert. Im Gegensatz zu anderen Modellen, die nur kurze Schnipsel von nicht gesungener Musik generieren, ist YuE in der Lage, komplette Songs mit Lead- und Backing Vocals von bis zu mehreren Minuten Länge zu generieren. Das Modell befasst sich mit der Musikgenerierung in...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Musik

vor 6 Monaten

03.1K

VideoReTalking: Audio-gesteuertes Lippensynchronisations- und Videobearbeitungssystem

Allgemeine Einführung VideoReTalking ist ein innovatives System, das es dem Benutzer ermöglicht, lippensynchrone Gesichtsvideos auf der Grundlage des eingegebenen Audios zu erzeugen, wobei qualitativ hochwertige und lippensynchrone Ausgabevideos auch bei unterschiedlichen Emotionen entstehen. Das System unterteilt dieses Ziel in drei aufeinanderfolgende Aufgaben: mit typischen Ausdrücken...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Anschluss-Synchronisation

vor 8 Monaten

03.1K

TimesFM 2.0: Google veröffentlicht ein vortrainiertes Modell für Zeitreihenvorhersagen

Allgemeine Einführung TimesFM 2.0 - 500M PyTorch ist ein vortrainiertes Zeitreihen-Basismodell, das von Google Research entwickelt und für Zeitreihenvorhersagen konzipiert wurde. Das Modell ist in der Lage, bis zu 2048 Zeitpunkte auf- und abwärts zu verarbeiten...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

03.1K

PromptWizard: ein Open-Source-Framework für die Optimierung von Prompt-Projekten zur Verbesserung der Aufgabenleistung

Umfassende Einführung PromptWizard ist ein von Microsoft entwickeltes Open-Source-Framework, das einen selbstevolutionären Mechanismus verwendet, der es dem Modell ermöglicht, selbständig Prompt-Wörter zu generieren, zu bewerten und zu verbessern sowie Beispiele zu generieren, wobei die Qualität der Ausgabe durch kontinuierliches Feedback verbessert wird. Es kann selbstständig Prompt-Wörter optimieren, geeignete Beispiele generieren und auswählen und...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 8 Monaten

03.1K

Orpheus-TTS: Ein Text-to-Speech-Werkzeug zur Erzeugung natürlicher chinesischer Sprache

Allgemeine Einführung Orpheus-TTS ist ein Open-Source-Text-to-Speech (TTS)-System, das auf der Llama-3b-Architektur mit dem Ziel entwickelt wurde, Audio nahe der natürlichen menschlichen Sprache zu erzeugen. Es wird vom Canopy AI Team entwickelt und unterstützt Englisch, Spanisch, Französisch...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 4 Monaten

03.1K

TF-ID: Akademisches Papierformular/Bilderkennungstool

Umfassende Einführung TF-ID (Table/Figure IDentifier) ist eine Familie von Objekterkennungsmodellen, die sich der Extraktion von Tabellen und Bildern aus wissenschaftlichen Arbeiten widmet. Das Projekt wurde von Yifei Hu ins Leben gerufen und ist auf GitHub als Open-Source verfügbar.

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 11 Monaten

03.1K

NocoDB: Erstellen von Smart Tables in mehreren Datenbanken, Open Source Airtable Alternative

Allgemeine Einführung NocoDB ist eine Open-Source-Alternative zu Airtable, die ein leistungsfähiges und einfach zu bedienendes Online-Datenbankmanagement-Tool darstellt. Mit NocoDB können Benutzer auf einfache Weise Daten aus Datenbanken erstellen, lesen, aktualisieren und löschen, ohne Code schreiben zu müssen. Die Plattform unterstützt ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Datenanalyse

vor 10 Monaten

03.1K

Marco-o1：基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型，探索开放式推理模型，解决复杂问题

Marco-o1: eine quelloffene Version des OpenAI o1-Modells auf der Grundlage von Qwen2-7B-Feinabstimmung zur Erforschung offener Inferenzmodelle für die Lösung komplexer Probleme

Umfassende Einführung Marco-o1 ist ein offenes Argumentationsmodell, das von der Alibaba International Digital Commerce Group (AIDC-AI) entwickelt wurde, um komplexe Probleme der realen Welt zu lösen. Das Modell kombiniert die Feinabstimmung der Gedankenkette (Chain of Thought, CoT), die Monte-Carlo-Baumsuche (Monte Carlo Tree Search, MCTS) und innovative Argumentationsstrategien...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 8 Monaten

03.1K

Cua: KI-Agenten zur sicheren Ausführung von Anwendungen in macOS/Linux-Sandboxen befähigen

Allgemeine Einführung Cua ist ein Open-Source-Projekt namens "Computer-Use Agent", ausgesprochen "koo-ah". Es ist für Apple-Silicon-Geräte konzipiert, kann leistungsstarke macOS-Geräte erstellen und ausführen ...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 4 Monaten

03.1K

OpenAI Codex CLI: Ein Terminal-Kommandozeilen-Assistent für KI-Programmierung von OpenAI veröffentlicht

Allgemeine Einführung OpenAI Codex CLI ist ein von OpenAI entwickeltes Open-Source-Terminal-Codierungstool für Entwickler, die an Terminals gewöhnt sind. Es generiert Code, bearbeitet Dateien, führt Befehle aus und integriert die Git-Versionskontrolle durch natürlichsprachliche Befehle....

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 4 Monaten

03.1K

Easegen: Open-Source-Plattform für die Produktion von digitalen menschlichen Kursen, PPT Ein-Klick-Generation Klonen von digitalen menschlichen Vortragsvideos

Umfassende Einführung Easegen ist eine Open-Source-Plattform zur Erstellung digitaler menschlicher Kurse, die darauf abzielt, die Effizienz der Produktion und Verwaltung von Lehrinhalten durch KI-Technologie zu verbessern. Die Plattform bietet eine Komplettlösung von der Kursproduktion über das Videomanagement bis hin zur intelligenten Befragung, die es den Nutzern ermöglicht, digitale Videokurse mit menschlicher Erklärung zu erstellen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Bildungswerkzeuge # AI Text zu Video

vor 10 Monaten

03.1K

ChatOllama: Lokale Echtzeit-Chat-Anwendung UI basierend auf Nuxt 3 und Ollama

Umfassende Einführung ChatOllama ist ein Open-Source-Online-Chat-Anwendungsprojekt auf der Grundlage eines groß angelegten Sprachmodells (LLM), das zahlreiche Sprachmodelle und die Verwaltung der Wissensbasis unterstützt. Benutzer können die Plattform für die Modellverwaltung (Listenanzeige, Download, Löschen), den Chat mit Modellen und andere Funktionen nutzen. Das Projekt verwendet ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung # Wissensabfrage und RAG-Rahmen

vor 10 Monaten

03.1K

PhotoDoodle: KI-Tool zum Hinzufügen künstlerischer Kritzeleien zu Fotos mit Textbefehlen

Allgemeine Einführung PhotoDoodle ist ein Open-Source-Bildbearbeitungstool, das von ShowLab entwickelt wurde und sich auf die künstlerische Bearbeitung von Fotos durch künstliche Intelligenztechnologie konzentriert. Benutzer können Cartoon-Stil, 3D-Effekt, Licht zu realen Fotos hinzufügen, indem sie nur einfache Textanweisungen eingeben...

Neueste AI-Ressourcen # AI Image Editor # AI Java Open Source Projekt

vor 5 Monaten

03.1K

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

Pocket AI: ein Offline-KI-Assistent, der in Ihrem Telefon läuft, angepasst für DeepSeek-R1 (5.37GB)

Allgemeine Einführung Pocket AI (chinesische Version von PocketPal AI) ist ein leistungsfähiger Offline-KI-Assistent, der es Benutzern ermöglicht, jederzeit und überall mit KI zu sprechen. Er basiert auf Small Language Models (SLMs) und läuft auf Mobiltelefonen ohne Internetverbindung, speziell angepasst an die chinesische Benutzererfahrung. Mundwerk...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 6 Monaten

03.1K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)

Umfassende Einführung Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur sehr leistungsfähig, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können schnell und genau...

Neueste AI-Ressourcen # AI Offene Dienste # AI Java Open Source Projekt # OCR

vor 9 Monaten

03.1K

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): B/C-Lösung aus einer Hand für KI-Aggregationsanwendungen mit flexibler Abrechnung und Unterstützung von Abonnementmodellen

Allgemeine Einführung CoAI.Dev (ehemals Chat Nio) ist eine Chat-Plattform, die mehrere KI-Modelle integriert und verteiltes Streaming, Bilderzeugung, geräteübergreifende Gesprächssynchronisation und -freigabe unterstützt. Sie implementiert ein Abonnement- und Token-Abrechnungssystem, einen Schlüsseltransitservice und mehrere...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 9 Monaten

03.1K

OpenUtau: kostenloses Open-Source-Werkzeug zur Bearbeitung von Songs

Allgemeine Einführung OpenUtau ist eine freie Open-Source-Song-Synthese- und Bearbeitungsplattform, die der UTAU-Gemeinschaft eine moderne Bearbeitungserfahrung bieten soll. Es ist der Nachfolger der UTAU-Software und löst die Kompatibilitäts- und Komplexitätsprobleme der ursprünglichen Software.OpenUtau unterstützt Wind...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Musik

vor 4 Monaten

03.1K

DeepChat: KI-Dialog-Client, der gleichzeitige Sitzungen mit mehreren Chats unterstützt

Allgemeine Einführung DeepChat ist ein Open-Source-Projekt für intelligente Assistenten, das vom ThinkInAIXYZ-Team auf GitHub entwickelt wurde. Es zielt darauf ab, Benutzer mit der digitalen Welt durch leistungsstarke KI-Technologie zu verbinden, um eine effiziente und natürliche Chat-Erfahrung zu bieten. Es unterstützt Win...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 5 Monaten

03.1K

J.A.R.V.I.S.：具有上下文感知的智能代码助手，生成和修改代码，多IDE支持

J.A.R.V.I.S.: Kontextabhängiger intelligenter Code-Assistent, Generieren und Ändern von Code, Multi-IDE-Unterstützung

Allgemeine Einführung J.A.R.V.I.S. (Just A Rather Very Intelligent System) ist ein intelligenter Code-Assistent, der Entwicklern bei der Code-Generierung und -Änderung sowie bei technischen Diskussionen helfen soll, indem er mehrere hochmoderne Sprachmodelle verwendet...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 7 Monaten

03.1K

Scira（MiniPerplx）：模仿Perplexity的开源项目，集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): Open-Source-Projekt, das Perplexity nachahmt und einen KI-Dialog, eine Websuche, eine Wetterabfrage usw. integriert.

Allgemeine Einführung MiniPerplx (umbenannt in Scira) ist eine minimalistisch gestaltete, KI-gesteuerte Suchmaschine, die eine Vielzahl nützlicher Funktionen integriert, um den Nutzern eine breite Palette von Diensten zur Informationsbeschaffung zu bieten. Das Projekt verwendet einen modernen Technologiestack mit Next.js, Tailwi...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Suchwerkzeug

vor 7 Monaten

03.1K

MJML: Einfaches Entwerfen von responsiven E-Mails, schnelles Generieren von Marketing-E-Mails mit ChatGPT

Allgemeine Einführung MJML (Mail Junction Markup Language) ist ein Open-Source-Framework, das vom Mailjet-Team entwickelt wurde, um die Erstellung von responsiven E-Mail-Vorlagen zu vereinfachen. Durch die semantische Auszeichnungssprache und eine reichhaltige Bibliothek von Komponenten können Entwickler weniger Code verwenden, um effizient schöne und leistungsstarke E-Mail-Vorlagen zu ...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 12 Monaten

03.1K

Ant Design X：快速构建AI聊天界面的工具包，支持模型集成和数据流管理。

Ant Design X: Ein Toolkit zur schnellen Erstellung von KI-Chat-Schnittstellen mit Unterstützung für Modellintegration und Datenflussmanagement.

Umfassende Einführung Ant Design X ist ein von der Ant Group freigegebenes Toolkit, das Entwicklern helfen soll, schnell KI-gesteuerte Dialogschnittstellen zu erstellen. Es bietet einen umfangreichen Satz von Komponenten und Vorlagen, unterstützt die Integration von Modellen, die mit OpenAI-Standards kompatibel sind, und eignet sich für eine Vielzahl von Anwendungen wie intelligenten Kundenservice, KI-Assistenten und andere...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 9 Monaten

03.1K

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligente Desktop-Automatisierung

vor 7 Monaten

03.1K

Ortlin: eine Web-GUI für die Interaktion mit allen OpenAI-Modellen und APIs

Allgemeine Einführung Ortlin ist eine webbasierte grafische Benutzeroberfläche, die sowohl technischen als auch nicht-technischen Nutzern helfen soll, mit den APIs und den zugrunde liegenden Modellen von OpenAI zu interagieren. Sie ist völlig kostenlos und quelloffen und ermöglicht es den Nutzern, die Vorteile von OpenAI auf unkomplizierte Weise zu nutzen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 10 Monaten

03.1K

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

Retrieval-basierte Sprachumwandlung WebUI: Ein Rahmenwerk für Retrieval-basierte Sprachumwandlung | Simulation realer Gesangsstimmen

Comprehensive Introduction Retrieval based Voice Conversion WebUI ist ein einfach zu bedienendes VITS-basiertes Sprachkonvertierungs-Framework, das die Sprachkonvertierung zwischen beliebigen Sprechern ermöglicht, einschließlich Song-Covers und Stimmänderungen in Echtzeit. Es hat niedrige ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Stimmenklonen

vor 10 Monaten

03.1K

pdf2htmlEX：PDF无损转换为HTML，保持文本格式，适用于学术论文和杂志排版

pdf2htmlEX: Verlustfreie Konvertierung von PDF in HTML unter Beibehaltung der Textformatierung, geeignet für wissenschaftliche Arbeiten und Magazinsatz

Umfassende Einführung pdf2htmlEX ist ein Open-Source-Tool entwickelt, um PDF-Dateien in HTML-Format zu konvertieren, durch die Analyse des Inhalts der PDF-Datei und HTML + CSS verwenden, um genau seine visuelle Wirkung wiederherzustellen, wird das PDF-Dokument in einen Browser umgewandelt werden ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 9 Monaten

03.1K

Goku: Erzeugt detaillierte und konsistente Videos, ideal für die Erstellung von Werbespots mit detaillierten Figuren und Objekten.

Umfassende Einführung Goku ist ein föderiertes Bild- und Videogenerierungsmodell, das auf Stromtransformationstechniken basiert und für eine Leistung auf Industrieniveau entwickelt wurde. Es integriert fortschrittliche, qualitativ hochwertige visuelle Generierungstechniken, einschließlich feinkörniger Datensammlung, Modelldesign und Stromtransformationsformulierung...

Neueste AI-Ressourcen # AI Bild zu Video # AI Java Open Source Projekt # AI Text zu Video

vor 6 Monaten

03.1K

Quantum Swarm: ein Rahmen für die Zusammenarbeit von Clustern mit mehreren Intelligenzen

Quantum Swarm ist ein Open-Source-Framework für künstliche Intelligenz, das sich auf die Entwicklung und Erforschung von KI-Populationsintelligenz konzentriert. Das Projekt wird vom Quarm AI Team auf GitHub gepflegt und zielt darauf ab, eine flexible und effiziente Plattform für den Aufbau und das Testen von Multi-Intelligenz-Systemen...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 7 Monaten

03.1K

OpenWebUI-Monitor：监控OpenWebUI用户活动，管理使用限额，支持一键部署。

OpenWebUI-Monitor: Überwachung der OpenWebUI-Benutzeraktivitäten, Verwaltung von Nutzungsbeschränkungen, Unterstützung der Ein-Klick-Bereitstellung.

Allgemeine Einführung OpenWebUI-Monitor ist ein Dashboard zur Überwachung von OpenWebUI-Benutzeraktivitäten und zur Verwaltung von Nutzungsquoten. Es ermöglicht Ihnen die effiziente Festlegung von Benutzerquoten, die Anzeige von Benutzerdaten und visuellen Informationen in Echtzeit, unterstützt die Bereitstellung mit einem Klick und erleichtert die Benutzerverwaltung und -überwachung...

Neueste AI-Ressourcen # AI Side Hustle Geldverdienen Projekt # AI Java Open Source Projekt

vor 9 Monaten

03.1K

DreamTalk: Erzeugen Sie ausdrucksstarke Sprechvideos mit einem einzigen Avatarbild!

DreamTalk Umfassende Einführung DreamTalk ist ein von der Tsinghua Universität, der Alibaba Gruppe und der Huazhong Universität für Wissenschaft und Technologie gemeinsam entwickeltes System zur Erzeugung von ausdrucksstarken Sprechern. Es besteht hauptsächlich aus drei Teilen: einem Netzwerk zur Rauschunterdrückung, einem Stilexperten für Lippen und einem Stilprädikator, der auf...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Digital Man # Anschluss-Synchronisation

vor 8 Monaten

03.1K

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Allgemeine Einführung Zerox ist ein Open-Source-Projekt, das entwickelt wurde, um PDF, DOCX, Bilder und andere Dokumente durch visuelle Modelle in das Markdown-Format zu konvertieren. Das Projekt wird vom getomni-ai Team entwickelt und bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung....

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 7 Monaten

03K

Sana: schnelle Erzeugung von hochauflösenden Bildern, 0,6B ultrakleines Modell, flacher Laptop-GPU-Betrieb

Allgemeine Einführung Sana ist ein effizientes Framework zur Erzeugung hochauflösender Bilder, das von NVIDIA Labs entwickelt wurde und in der Lage ist, Bilder mit einer Auflösung von bis zu 4096 × 4096 in Sekundenschnelle zu erzeugen.

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Self-Deployment Image Generation Tool

vor 9 Monaten

03K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug

Umfassende Einführung Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z. B. PDF, Word, PPTX usw.). Die API nutzt die modernste OCR-Technologie (Optical Character Recognition) und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 7 Monaten

03K

Agnai Chat: eine Open-Source-Chat-Plattform für die Interaktion mit personalisierten KI-Charakteren

Allgemeine Einführung Agnai Chat ist eine Open-Source-KI-Chat-Plattform, die es Benutzern ermöglicht, personalisierte KI-Charaktere für Einzel- oder Mehrspieler-Interaktionen zu erstellen. Sie unterstützt eine breite Palette von KI-Diensten, darunter OpenAI, Claude, Kobold usw., und eignet sich für Unterhaltung, Rollenspiele, Bildung oder...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 4 Monaten

03K

AI-Podcast-Generator: Automatische Erfassung von Nachrichten zur Erstellung von Audio-Podcasts

Allgemeine Einführung AI Podcast Generator ist ein intelligentes Tool zur Erstellung von Podcasts, das fortschrittliche KI-Technologie nutzt, um automatisch ansprechende Audioinhalte aus Webquellen zu erstellen. Das System erzeugt natürlich fließende Erzählungen, indem es Nachrichteninhalte aufnimmt und in Audio-Podcasts umwandelt. Das Projekt basiert auf dem Next...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video

vor 9 Monaten

03K

DeepSeek-VL2: ein visuelles Experten-Sprachmodell für fortgeschrittenes multimodales Verstehen

Umfassende Einführung DeepSeek-VL2 ist eine Reihe von fortschrittlichen Mixture-of-Experts (MoE) visuellen Sprachmodellen, die die Leistung des Vorgängers DeepSeek-VL deutlich verbessern. Die Modelle sind nützlich für visuelle Frage und Antwort, optische Zeichenerkennung, Text...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 6 Monaten

03K

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Text-zu-Video-Nullbeispiel-Generator vom Picsart AI Research Team veröffentlicht

Allgemeine Einführung Text2Video-Zero ist eine offizielle Implementierung eines Null-Sample-Text-zu-Video-Generators für GitHub, der vom Picsart AI Research Team entwickelt wurde. Das Projekt bietet eine Möglichkeit, Text-Hinweise zu verwenden, um Text mit zeitlicher Konsistenz und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text zu Video

vor 10 Monaten

03K

PantoMatrix（EMAGE）：全身手势生成框架，从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): Framework zur Erzeugung von Ganzkörpergesten, 3D-Animations-Framework zur Erzeugung von Ganzkörpergesten aus Audio

Umfassende Einführung PantoMatrix ist ein fortschrittliches Framework zur Erzeugung von Ganzkörpergesten, das in der Lage ist, komplette menschliche Bewegungen aus Audio- und Teilgesten zu generieren, einschließlich Gesichts-, Teilkörper-, Hand- und Ganzkörperbewegungen. Das Framework nutzt die neuesten multimodalen Datensätze und Deep-Learning-Techniken, um qualitativ hochwertige 3D-Gesten zu...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 9 Monaten

03K

AutoAgent: ein Rahmenwerk für die schnelle Entwicklung und Bereitstellung von KI-Intelligenzen durch natürliche Sprache

Allgemeine Einführung AutoAgent ist ein Open-Source-Framework für KI-Intelligenzen, das vom Data Intelligence Laboratory der Universität Hongkong (HKUDS) entwickelt wurde und auf GitHub gehostet wird. Es ermöglicht Nutzern die schnelle Erstellung und den Einsatz maßgeschneiderter KI-Intelligenzen, indem sie ihre Anforderungen in rein natürlicher Sprache beschreiben, ohne jegliche Programmiergrundlage...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Keine Code-Entwicklung # Entwicklungsrahmen für intelligente Körper

vor 2 Monaten

03K

LivePortrait: Animationswerkzeug zur Erstellung dynamischer Porträts aus Standbildern und Videos

Allgemeine Einführung LivePortrait ist ein fortschrittliches KI-Tool für dynamische Porträtanimationen, das von Racer Technology entwickelt wurde. Es nutzt eine innovative KI-Technologie, um Standbilder in lebendige Videoanimationen zu verwandeln. Ob Sie nun echte Fotos, Animationsstile oder künstlerische Porträts verwenden, LivePortrait...

Neueste AI-Ressourcen # AI Bild zu Video # AI Java Open Source Projekt # AI Video Konvertierung Stil

vor 9 Monaten

03K

Playwright MCP: Browser-Automatisierungs-MCP-Dienst von Microsoft

Allgemeine Einführung Playwright MCP ist ein Open-Source-Tool, das von Microsoft entwickelt und auf GitHub gehostet wird. Es ermöglicht künstlichen Intelligenzmodellen die direkte Steuerung von Browsern über das MCP-Protokoll (Model Context Protocol), komplett mit...

Neueste AI-Ressourcen # AI Java Open Source Projekt # MCP-Dienste # Intelligente Desktop-Automatisierung

vor 5 Monaten

03K

DeepCoder-14B-Preview: ein Open-Source-Modell, das sich bei der Codegenerierung auszeichnet

Allgemeine Einführung DeepCoder-14B-Preview ist ein Open-Source-Codegenerierungsmodell, das vom Agentica-Team entwickelt und auf der Hugging Face-Plattform veröffentlicht wurde. Es basiert auf dem DeepSeek-R1-Distilled-Q...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Feinabstimmung des großen Modells

vor 4 Monaten

03K

WrenAI: KI-Assistent zur Datenanalyse mit direktem Zugriff auf Antworten, SQL-Abfragen und Analyseberichte

Allgemeine Einführung WrenAI ist ein Open-Source-SQL-KI-Assistent, der speziell entwickelt wurde, um Datenteams, Produktteams und Geschäftsteams dabei zu helfen, durch natürlichsprachliche Konversationen Dateneinblicke zu gewinnen. Er ist in der Lage, natürliche Sprache in SQL-Abfragen zu konvertieren, Diagramme, Tabellen und Berichte zu erstellen und unterstützt mehrsprachige...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Datenanalyse

vor 7 Monaten

03K

IMS Toucan: schnelles und kontrollierbares mehrsprachiges (7000+ Sprachen unterstützt) Text-to-Speech-Tool

Allgemeine Einführung IMS Toucan ist ein modernes Text-to-Speech (TTS) Toolkit, das vom Institut für Maschinelle Sprachverarbeitung (IMS) an der Universität Stuttgart entwickelt wurde. Das Toolkit unterstützt mehr als 7000 Sprachen und ist schnell, kontrollierbar und hat geringe Anforderungen an die...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Text-to-Speech

vor 6 Monaten

03K

GraphRAG Visualizer：可视化和探索Microsoft GraphRAG工件的工具

GraphRAG Visualizer: ein Werkzeug zur Visualisierung und Erforschung von Microsoft GraphRAG Artefakten

Allgemeine Einführung GraphRAG Visualizer ist ein webbasiertes Tool, das den Benutzern helfen soll, Artefakte aus Microsoft GraphRAG zu visualisieren und zu erkunden. Durch Hochladen von Par...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Wissensdiagramm

vor 8 Monaten

03K

Linly-Dubbing: Intelligente mehrsprachige Video-KI-Synchronisation/Übersetzung

Umfassende Einführung Linly-Dubbing ist ein intelligentes, mehrsprachiges KI-Synchronisations- und Übersetzungstool, das entwickelt wurde, um Benutzern durch die Integration fortschrittlicher KI-Technologie hochwertige mehrsprachige Videosynchronisations- und Untertitelübersetzungsdienste zu bieten. Das Tool eignet sich besonders für die internationale Bildung, die Lokalisierung globaler Inhalte und andere Szenarien...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung

vor 7 Monaten

03K

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Das Ziel der Tabellenerkennung besteht darin, Tabellen in Bildern zu analysieren, Tabellenstrukturen und Zellenpositionen genau zu identifizieren und sie in strukturierte Tabellenformate (z. B. HTML) zu reduzieren. Im heutigen Informationszeitalter liegt eine große Menge wichtiger Tabellendaten immer noch in unstrukturiertem Zustand vor (z. B. gescannte Dokumente mit Bildern von statistischen Tabellen).

Neueste AI-Ressourcen # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

03K

RTranslator: eine Echtzeit-Sprachübersetzungs-App für Android, kostenlos und offline!

Allgemeine Einführung RTranslator ist eine praktisch quelloffene, kostenlose Offline-Echtzeit-Übersetzungs-App für Android-Geräte. Benutzer können ihr Telefon in der Tasche lassen, indem sie ein Bluetooth-Headset anschließen und eine Unterhaltung mit anderen führen, als ob sie ihre eigene Sprache sprechen würden.

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Übersetzung

vor 7 Monaten

03K

Paper Reviewer: Automatische Erstellung umfassender Rezensionen von arXiv-Papieren und deren Umwandlung in Blogbeiträge

Allgemeine Einführung Paper Reviewer ist ein Open-Source-Projekt, das entwickelt wurde, um umfassende Rezensionen von arXiv-Papieren zu generieren und sie in Blog-Posts zu verwandeln. Das Projekt betreibt die Website Hugging Face's Daily Papers, die automatisch...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video

vor 9 Monaten

03K

FiveThirtyNine: Vorhersage der Wahrscheinlichkeit künftiger Ereignisse auf der Grundlage von Suchwissen

Allgemeine Einführung Forecast AI ist eine hervorragende Prognoseplattform, die auf fortschrittlicher Technologie der künstlichen Intelligenz basiert. Sie nutzt leistungsstarke Datenanalysen und Algorithmen des maschinellen Lernens, um den Nutzern hochpräzise Vorhersagen über zukünftige Ereignisse zu liefern. Ob es sich um politische Wahlen, wirtschaftliche Trends oder gesellschaftliche Ereignisse handelt, Forecast ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Suchwerkzeug

vor 11 Monaten

03K

PhiData: Aufbau von KI-Intelligenzen mit Gedächtnis, Wissen und Werkzeugen

Umfassende Einführung PhiData ist ein Framework für die Entwicklung intelligenter KI-Assistenten. Es ermöglicht KI-Assistenten, sich an langfristigen Gesprächen zu beteiligen, genauen Geschäftskontext bereitzustellen und eine Vielzahl von Operationen durch erweiterte Speicher-, Wissensintegrations- und Tool-Aufruf-Fähigkeiten durchzuführen.PhiData verbessert nicht nur die...

Neueste AI-Ressourcen # AI Java Open Source Projekt # Intelligenter Körper Anwendung

vor 5 Monaten

03K

Micro Agent: KI-Programmierintelligenz, die automatisch Code generiert und diesen testet und korrigiert.

Allgemeine Einführung Micro-Agent ist ein von Builder.io entwickelter Open-Source-KI-Codierassistent, der Entwicklern die Möglichkeit bieten soll, automatisch Code zu generieren und zu testen. Er generiert Testfälle durch das Verstehen von Beschreibungen in natürlicher Sprache und iteriert den Code, bis alle Tests erfolgreich...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI-Programmierung

vor 7 Monaten

03K

mcp-ui: eine saubere KI-Chat-Schnittstelle auf der Grundlage des MCP-Protokolls

Umfassende Einführung mcp-ui ist ein Open-Source-Projekt , erstellt von dem Entwickler machaojin1917939763 , basierend auf dem Model Context Protocol (MCP) Protokoll zu bauen, ist eine Unterstützung für Web-und Desktop-Umgebungen smart ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 4 Monaten

03K

Xorbits Inference: Bereitstellung mehrerer KI-Modelle mit einem Klick, ein verteilter Inferenzrahmen

Umfassende Einführung Xorbits Inference (Xinference) ist ein leistungsfähiges und umfassendes verteiltes Inferenz-Framework, das die Inferenz für ein breites Spektrum von KI-Modellen wie Large Language Models (LLMs), Spracherkennungsmodelle und multimodale Modelle unterstützt. Mit Xorbits I...

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 11 Monaten

03K

Meetily: ein KI-Assistent zur Erstellung von Sitzungsprotokollen, Transkription und Erstellung von Sitzungszusammenfassungen in Echtzeit

Allgemeine Beschreibung Meetily ist ein von Zackriya Solutions entwickelter KI-gestützter Meeting-Assistent, der Audioaufnahmen von Meetings in Echtzeit erfasst, Sprachtranskriptionen durchführt und Zusammenfassungen von Meetings erstellt. Einzigartig ist, dass die gesamte Verarbeitung lokal auf dem Gerät erfolgt, wodurch die Privatsphäre des Nutzers...

Neueste AI-Ressourcen # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video

vor 6 Monaten

03K

Mehr laden