AI Open-Source-Projekt

Insgesamt 1020 Artikel
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: Bilderzeugung in Echtzeit durch Eingabe von Schlüsselwörtern (kostenloser Zugang zum Flux Schnell Modell)

Allgemeine Beschreibung BlinkShot ist ein quelloffener Echtzeit-KI-Bildgenerator, der die Technologien Together AI und Flux Schnell nutzt, um Benutzern die Möglichkeit zu geben, bei der Eingabe von Aufforderungen qualitativ hochwertige Bilder zu erzeugen. Die Plattform ist völlig kostenlos und unterstützt die Anpassung durch den Benutzer und sekundäre offene...
vor 10 Monaten
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus: KI-Tool zur Erstellung von Kurzvideos mit einem Klick, kostenloses Batch-Mixing

Umfassende Einführung MoneyPrinterPlus ist ein Open-Source-Projekt, das darauf abzielt, alle Arten von Kurzvideos mit einem Klick durch KI-Technologie zu erstellen und zu mischen und sie automatisch auf mehreren Videoplattformen wie Jieyin, Shutterbugs, Xiaohongshu und Video Number zu veröffentlichen. Das Tool unterstützt lokale und cloudbasierte Sprachmodelle, einschließlich Chat...
vor 11 Monaten
03.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Beschreibung Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen, auch ohne NVIDIA GPU, und kann mit einer vorkompilierten App verwendet werden...
vor 10 Monaten
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: Audiogestützte Porträts zur Erzeugung sprechender Videos (EchoMimicV2 beschleunigtes Installationsprogramm)

Allgemeine Einführung EchoMimic ist ein Open-Source-Projekt zur Erzeugung realistischer Porträtanimationen, die durch Audio gesteuert werden. Das von der Ant Group's Terminal Technologies Division entwickelte Projekt nutzt editierbare Markerpunktbedingungen, um dynamische Porträtvideos mit einer Kombination aus Audio und Gesichtsmarkerpunkten zu erzeugen.
vor 7 Monaten
03.2K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: ein Open-Source-Werkzeug zur automatischen Erstellung von Wissensgraphen aus einfachem Text

Allgemeine Einführung KGGen ist ein Open-Source-Tool, das vom Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab) entwickelt wurde und auf GitHub gehostet wird. Es dient der automatischen Generierung von Wissensgraphen aus beliebigen Texten. Es verwendet fortschrittliche Sprachmodellierungs- und Clustering-Algorithmen, um unstrukturierten Text...
vor 6 Monaten
03.2K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: Ein Multi-Intelligenz-Kollaborationsrahmen für den Aufbau von KI-Softwareentwicklungsteams für die Programmierung in natürlicher Sprache

Umfassende Einführung MetaGPT ist ein innovatives Multi-Intelligenz-Framework, mit dem der Betrieb eines kompletten KI-Softwareunternehmens simuliert werden soll. Das von geekan (Alexander Wu) entwickelte Projekt zielt darauf ab, GPT-Modelle mit unterschiedlichen Rollen zu einer kollaborativen Einheit zu kombinieren...
vor 5 Monaten
03.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, De...
vor 7 Monaten
03.2K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave a trace (WeChatMsg): Export- und Analysetools für WeChat-Chat-Aufzeichnungen

Allgemeine Einführung WeChatMsg ist ein Open-Source-Projekt, das sich auf der GitHub-Plattform befindet. Das Tool zielt darauf ab, WeChat-Benutzern eine Möglichkeit zu bieten, WeChat-Chats zu extrahieren und in eine Vielzahl von Dokumenten (HTML, Word, CSV) zu exportieren, und die Erstellung von Jahresberichten zur Visualisierung von Chat-Daten zu unterstützen...
vor 1 Jahr
03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Eine umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und ein leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Data Science Laboratory der Universität von Hongkong (HKUDS) entwickelt, um ...
vor 7 Monaten
03.2K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: Open-Source-Comic-Downloader, Unterstützung für Comics im PDF-, EPUB-, CBR- und CBZ-Format zum Herunterladen

Allgemeine Einführung Comics Downloader ist ein Open-Source-Tool, das Benutzern helfen soll, Comics und Comicbücher von verschiedenen Websites herunterzuladen. Das Tool unterstützt eine Vielzahl von Dateiformaten, einschließlich PDF, EPUB, CBR und CBZ, so dass die Benutzer nach ihren Bedürfnissen wählen können, um sie...
vor 8 Monaten
03.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: Multi-Agenten-Kollaboration für mobile Gerätebedienungsassistenten

Allgemeine Einführung MobileAgent ist ein leistungsstarker Assistent für die Bedienung von Mobilgeräten, der die Effizienz und Automatisierung der Bedienung von Mobilgeräten durch Multi-Agenten-Kollaboration und erweiterte visuelle Wahrnehmungsmodule verbessern soll. Er wurde vom X-PLUG-Team entwickelt und unterstützt Android und ...
vor 7 Monaten
03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Fotos zum Sprechen bringen | Mouth Sync Audio | Synthesised Mouth Sync Video | Free Digital People

Allgemeine Einführung SadTalker ist ein Open-Source-Tool, das ein einzelnes Porträtfoto mit einer Audiodatei kombiniert, um realistische sprechende Avatar-Videos für eine Vielzahl von Szenarien zu erstellen, wie z. B. personalisierte Nachrichten, Bildungsinhalte und mehr. Revolutionärer Einsatz von 3D-Modellierungstechnologien wie ExpNet und PoseVA...
vor 6 Monaten
03.2K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: ein intelligenter Dialog-Client für den Desktop, der auf der Dify-API basiert und KI-Dialogfähigkeiten auf Unternehmensebene bietet

Umfassende Einführung Dify-WebUI ist eine moderne intelligente Desktop-Dialoganwendung, die auf der Dify-API basiert und entwickelt wurde, um Unternehmen leistungsstarke KI-Dialogfunktionen zu bieten. Die Anwendung unterstützt mehrere voreingestellte Themenfarben, um den individuellen Bedürfnissen von Unternehmen gerecht zu werden, und verfügt über eine Wissensdatenbank-Managementfunktion, um...
vor 7 Monaten
03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: Intelligentes Open-Source-Tool zur Aufzeichnung und Zusammenfassung von Meetings, das auf OpenAI Whisper basiert

Allgemeine Einführung MeetingMind ist eine fortschrittliche KI-Anwendung, die die Effizienz der Erfassung und Zusammenfassung von Geschäftsbesprechungen verbessern soll. Die App integriert die Whisper-Technologie von OpenAI für präzise Sprache-zu-Text und nutzt IBM Watso...
vor 10 Monaten
03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Wasserzeichen-Entfernung:offene Quelle Bild Wasserzeichen Entfernung Werkzeug, Bild Wasserzeichen Erholung Originalbild

Allgemeine Einführung Watermark Removal ist ein Open-Source-Projekt, das maschinelles Lernen und Deep-Learning-Techniken für die Bildrestaurierung verwendet, insbesondere für die Entfernung von Wasserzeichen aus Bildern. Das Projekt wurde von Chimzuruoke Okafor entwickelt und ist inspiriert von Con...
vor 6 Monaten
03.2K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: Ein Rahmenwerk für kollaborative Intelligenz mit mehreren Rollen zur Vereinfachung komplexer Aufgaben

Umfassende Einführung CrewAI ist ein fortschrittliches Framework zur Orchestrierung der Zusammenarbeit zwischen Rollenspielen und autonomen KI-Agenten. Durch die Erleichterung der kollaborativen Intelligenz ermöglicht CrewAI den Agenten eine nahtlose Zusammenarbeit zur Lösung komplexer Aufgaben. Ganz gleich, ob Sie eine intelligente Assistentenplattform aufbauen, Kundenservice-Teams automatisieren oder Multi-Agenten...
vor 8 Monaten
03.2K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: Beste Arxiv Academic Paper Übersetzung, Fehlerkorrektur und Code-Interpretation

Allgemeine Einführung GPT Academic ist eine interaktive Plattform für große Sprachmodelle, die für die akademische Forschung optimiert ist. Sie bietet Werkzeuge für pragmatische interaktive Schnittstellen zu großen Sprachmodellen wie GPT/GLM, die speziell für das Übersetzen, Lesen, Polieren und Schreiben von Texten optimiert sind. Es verwendet ein modulares Design...
vor 9 Monaten
03.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Umfassende Einführung Easy-Voice-Toolkit ist ein multifunktionales Toolkit, das auf dem Open Source Speech Project basiert und eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen...
vor 11 Monaten
03.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: ein quelloffener Sprachdialogassistent mit niedriger Latenz für natürliche Konversation und Kommunikation

Umfassende Einführung Bailing (Bailing) ist ein Open-Source-Sprachdialog-Assistent, der entwickelt wurde, um einen natürlichen Dialog mit dem Benutzer durch Sprache zu führen. Das Projekt kombiniert Spracherkennung (ASR), Voice Activity Detection (VAD), Large Language Modelling (LLM) und Sprachsynthese (TTS) Technologien, um eine...
vor 7 Monaten
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: Open-Source-Klon des digital man-Integrationssystems, Bereitstellung des kostenlosen digital man-Clients mit einem Klick

Umfassende Einführung AigcPanel ist ein One-Stop AI Digital Human Production System für alle Benutzer, entwickelt mit electron+vue3+typescript Technologie Stack, unterstützt One-Click Deployment auf Windows. Das System ist so konzipiert, benutzerfreundlich zu sein, wie der Kern, auch...
vor 7 Monaten
03.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: eine integrierte Plattform für die Verbindung verschiedener KI-Intelligenz-Frameworks zur Zusammenarbeit in Echtzeit

Allgemeine Einführung Mahilo ist eine quelloffene Multi-Intelligenz-Integrationsplattform, die vom Entwickler Jayesh Sharma auf GitHub veröffentlicht wurde. Sie soll Nutzern helfen, KI-Intelligenzen aus verschiedenen Frameworks zu verbinden, um Echtzeitkommunikation, Mensch-Computer-Interaktion und intelligente Zusammenarbeit zu unterstützen. Die ...
vor 5 Monaten
03.1K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: ein quelloffenes Text-zu-Sprache-Modell für hochwertige Spracherzeugung und Klonen

Allgemeine Einführung Llasa-3B ist ein Open-Source-Text-to-Speech-Modell (TTS), das vom Audio Lab der Hong Kong University of Science and Technology (HKUST Audio) entwickelt wurde. Das Modell basiert auf der Llama-3.2B-Architektur, die sorgfältig abgestimmt wurde, um eine qualitativ hochwertige Spracherzeugung zu bieten, die nicht nur mehrere...
vor 6 Monaten
03.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: Open-Source-Logo-Generator, der KI-Intelligenz nutzt, um professionelle Markenlogos zu erstellen

Allgemeine Einführung LogoCreator ist ein Open-Source-Logo-Generator, der auf dem Together AI- und Flux-Modell basiert und sich darauf konzentriert, schnelle und professionelle Logo-Designs für Unternehmen und Privatpersonen anzubieten. Das Projekt wird vom Entwickler Nutlope in Git entwickelt und als Open Source zur Verfügung gestellt...
vor 8 Monaten
03.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

Allgemeine Beschreibung SynthLight ist ein Porträt-Relighting-Tool, das auf einem Diffusionsmodell basiert. Es lernt, synthetische Gesichtsbilder neu zu rendern, um Lichteffektanpassungen an reale Porträtfotos zu erreichen. Das Tool verwendet eine physikalische Rendering-Engine, um Datensätze zu erzeugen, die Lichttransformationen unter verschiedenen Lichtbedingungen simulieren...
vor 7 Monaten
03.1K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extrahieren der komplexen Struktur des PDF-Inhalts mit dem Open-Source-Tool

Umfassende Einführung PDF-Extract-Kit ist ein Open-Source-Projekt, das vom OpenDataLab-Team entwickelt wurde und sich auf die effiziente Extraktion von hochwertigen Inhalten aus komplexen und vielfältigen PDF-Dokumenten konzentriert. Es integriert fortschrittliche Dokumenten-Parsing-Technologie zur Unterstützung von Layout-Erkennung, Formel-Erkennung ...
vor 6 Monaten
03.1K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: KI-generierte PPT, Präsentationserstellung

Umfassende Einführung AiPPT ist ein PPT-Generierungstool, das auf der Technologie der künstlichen Intelligenz basiert und dem Benutzer helfen soll, schnell professionelle Präsentationen zu erstellen. Es generiert automatisch inhaltsreiche und schön gestaltete Folien, indem es Themen eingibt, Dateien hochlädt oder URLs bereitstellt, usw. Es unterstützt native Diagramme, Animationen und 3D-Spezialeffekte...
vor 6 Monaten
03.1K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: Textgenerierte Film- und TV-Erzählung und automatisiertes Bearbeitungswerkzeug

Allgemeine Einführung NarratoAI ist ein vollautomatisches Tool, das Film- und Videoerzählung, automatische Bearbeitung, Synchronisation und Untertitelerstellung integriert. Es stützt sich auf die Technologie der groß angelegten Sprachmodellierung (LLM), um automatisch Texte zu generieren und Videos mit entsprechenden Synchronisationen und Untertiteln automatisch zu bearbeiten.
vor 11 Monaten
03.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: Wandelt Liedtexte in ein Basismodell eines kompletten Songs um und unterstützt eine breite Palette von Musikstilen

Allgemeine Einführung YuE ist ein Open-Source-Basismodell für die Generierung kompletter Songs, das sich auf die Umwandlung von Liedtexten in komplette Songs konzentriert. Im Gegensatz zu anderen Modellen, die nur kurze Schnipsel von nicht gesungener Musik generieren, ist YuE in der Lage, komplette Songs mit Lead- und Backing Vocals von bis zu mehreren Minuten Länge zu generieren. Das Modell befasst sich mit der Musikgenerierung in...
vor 6 Monaten
03.1K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: Audio-gesteuertes Lippensynchronisations- und Videobearbeitungssystem

Allgemeine Einführung VideoReTalking ist ein innovatives System, das es dem Benutzer ermöglicht, lippensynchrone Gesichtsvideos auf der Grundlage des eingegebenen Audios zu erzeugen, wobei qualitativ hochwertige und lippensynchrone Ausgabevideos auch bei unterschiedlichen Emotionen entstehen. Das System unterteilt dieses Ziel in drei aufeinanderfolgende Aufgaben: mit typischen Ausdrücken...
vor 8 Monaten
03.1K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: ein Open-Source-Framework für die Optimierung von Prompt-Projekten zur Verbesserung der Aufgabenleistung

Umfassende Einführung PromptWizard ist ein von Microsoft entwickeltes Open-Source-Framework, das einen selbstevolutionären Mechanismus verwendet, der es dem Modell ermöglicht, selbständig Prompt-Wörter zu generieren, zu bewerten und zu verbessern sowie Beispiele zu generieren, wobei die Qualität der Ausgabe durch kontinuierliches Feedback verbessert wird. Es kann selbstständig Prompt-Wörter optimieren, geeignete Beispiele generieren und auswählen und...
vor 8 Monaten
03.1K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: Erstellen von Smart Tables in mehreren Datenbanken, Open Source Airtable Alternative

Allgemeine Einführung NocoDB ist eine Open-Source-Alternative zu Airtable, die ein leistungsfähiges und einfach zu bedienendes Online-Datenbankmanagement-Tool darstellt. Mit NocoDB können Benutzer auf einfache Weise Daten aus Datenbanken erstellen, lesen, aktualisieren und löschen, ohne Code schreiben zu müssen. Die Plattform unterstützt ...
vor 10 Monaten
03.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: eine quelloffene Version des OpenAI o1-Modells auf der Grundlage von Qwen2-7B-Feinabstimmung zur Erforschung offener Inferenzmodelle für die Lösung komplexer Probleme

Umfassende Einführung Marco-o1 ist ein offenes Argumentationsmodell, das von der Alibaba International Digital Commerce Group (AIDC-AI) entwickelt wurde, um komplexe Probleme der realen Welt zu lösen. Das Modell kombiniert die Feinabstimmung der Gedankenkette (Chain of Thought, CoT), die Monte-Carlo-Baumsuche (Monte Carlo Tree Search, MCTS) und innovative Argumentationsstrategien...
vor 8 Monaten
03.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: Open-Source-Plattform für die Produktion von digitalen menschlichen Kursen, PPT Ein-Klick-Generation Klonen von digitalen menschlichen Vortragsvideos

Umfassende Einführung Easegen ist eine Open-Source-Plattform zur Erstellung digitaler menschlicher Kurse, die darauf abzielt, die Effizienz der Produktion und Verwaltung von Lehrinhalten durch KI-Technologie zu verbessern. Die Plattform bietet eine Komplettlösung von der Kursproduktion über das Videomanagement bis hin zur intelligenten Befragung, die es den Nutzern ermöglicht, digitale Videokurse mit menschlicher Erklärung zu erstellen...
vor 10 Monaten
03.1K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Lokale Echtzeit-Chat-Anwendung UI basierend auf Nuxt 3 und Ollama

Umfassende Einführung ChatOllama ist ein Open-Source-Online-Chat-Anwendungsprojekt auf der Grundlage eines groß angelegten Sprachmodells (LLM), das zahlreiche Sprachmodelle und die Verwaltung der Wissensbasis unterstützt. Benutzer können die Plattform für die Modellverwaltung (Listenanzeige, Download, Löschen), den Chat mit Modellen und andere Funktionen nutzen. Das Projekt verwendet ...
vor 10 Monaten
03.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: KI-Tool zum Hinzufügen künstlerischer Kritzeleien zu Fotos mit Textbefehlen

Allgemeine Einführung PhotoDoodle ist ein Open-Source-Bildbearbeitungstool, das von ShowLab entwickelt wurde und sich auf die künstlerische Bearbeitung von Fotos durch künstliche Intelligenztechnologie konzentriert. Benutzer können Cartoon-Stil, 3D-Effekt, Licht zu realen Fotos hinzufügen, indem sie nur einfache Textanweisungen eingeben...
vor 5 Monaten
03.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: ein Offline-KI-Assistent, der in Ihrem Telefon läuft, angepasst für DeepSeek-R1 (5.37GB)

Allgemeine Einführung Pocket AI (chinesische Version von PocketPal AI) ist ein leistungsfähiger Offline-KI-Assistent, der es Benutzern ermöglicht, jederzeit und überall mit KI zu sprechen. Er basiert auf Small Language Models (SLMs) und läuft auf Mobiltelefonen ohne Internetverbindung, speziell angepasst an die chinesische Benutzererfahrung. Mundwerk...
vor 6 Monaten
03.1K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev (Chat Nio): B/C-Lösung aus einer Hand für KI-Aggregationsanwendungen mit flexibler Abrechnung und Unterstützung von Abonnementmodellen

Allgemeine Einführung CoAI.Dev (ehemals Chat Nio) ist eine Chat-Plattform, die mehrere KI-Modelle integriert und verteiltes Streaming, Bilderzeugung, geräteübergreifende Gesprächssynchronisation und -freigabe unterstützt. Sie implementiert ein Abonnement- und Token-Abrechnungssystem, einen Schlüsseltransitservice und mehrere...
vor 9 Monaten
03.1K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: KI-Dialog-Client, der gleichzeitige Sitzungen mit mehreren Chats unterstützt

Allgemeine Einführung DeepChat ist ein Open-Source-Projekt für intelligente Assistenten, das vom ThinkInAIXYZ-Team auf GitHub entwickelt wurde. Es zielt darauf ab, Benutzer mit der digitalen Welt durch leistungsstarke KI-Technologie zu verbinden, um eine effiziente und natürliche Chat-Erfahrung zu bieten. Es unterstützt Win...
vor 5 Monaten
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): Open-Source-Projekt, das Perplexity nachahmt und einen KI-Dialog, eine Websuche, eine Wetterabfrage usw. integriert.

Allgemeine Einführung MiniPerplx (umbenannt in Scira) ist eine minimalistisch gestaltete, KI-gesteuerte Suchmaschine, die eine Vielzahl nützlicher Funktionen integriert, um den Nutzern eine breite Palette von Diensten zur Informationsbeschaffung zu bieten. Das Projekt verwendet einen modernen Technologiestack mit Next.js, Tailwi...
vor 7 Monaten
03.1K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: Einfaches Entwerfen von responsiven E-Mails, schnelles Generieren von Marketing-E-Mails mit ChatGPT

Allgemeine Einführung MJML (Mail Junction Markup Language) ist ein Open-Source-Framework, das vom Mailjet-Team entwickelt wurde, um die Erstellung von responsiven E-Mail-Vorlagen zu vereinfachen. Durch die semantische Auszeichnungssprache und eine reichhaltige Bibliothek von Komponenten können Entwickler weniger Code verwenden, um effizient schöne und leistungsstarke E-Mail-Vorlagen zu ...
vor 12 Monaten
03.1K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: Ein Toolkit zur schnellen Erstellung von KI-Chat-Schnittstellen mit Unterstützung für Modellintegration und Datenflussmanagement.

Umfassende Einführung Ant Design X ist ein von der Ant Group freigegebenes Toolkit, das Entwicklern helfen soll, schnell KI-gesteuerte Dialogschnittstellen zu erstellen. Es bietet einen umfangreichen Satz von Komponenten und Vorlagen, unterstützt die Integration von Modellen, die mit OpenAI-Standards kompatibel sind, und eignet sich für eine Vielzahl von Anwendungen wie intelligenten Kundenservice, KI-Assistenten und andere...
vor 9 Monaten
03.1K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern...
vor 7 Monaten
03.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: eine Web-GUI für die Interaktion mit allen OpenAI-Modellen und APIs

Allgemeine Einführung Ortlin ist eine webbasierte grafische Benutzeroberfläche, die sowohl technischen als auch nicht-technischen Nutzern helfen soll, mit den APIs und den zugrunde liegenden Modellen von OpenAI zu interagieren. Sie ist völlig kostenlos und quelloffen und ermöglicht es den Nutzern, die Vorteile von OpenAI auf unkomplizierte Weise zu nutzen...
vor 10 Monaten
03.1K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

Retrieval-basierte Sprachumwandlung WebUI: Ein Rahmenwerk für Retrieval-basierte Sprachumwandlung | Simulation realer Gesangsstimmen

Comprehensive Introduction Retrieval based Voice Conversion WebUI ist ein einfach zu bedienendes VITS-basiertes Sprachkonvertierungs-Framework, das die Sprachkonvertierung zwischen beliebigen Sprechern ermöglicht, einschließlich Song-Covers und Stimmänderungen in Echtzeit. Es hat niedrige ...
vor 10 Monaten
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: Verlustfreie Konvertierung von PDF in HTML unter Beibehaltung der Textformatierung, geeignet für wissenschaftliche Arbeiten und Magazinsatz

Umfassende Einführung pdf2htmlEX ist ein Open-Source-Tool entwickelt, um PDF-Dateien in HTML-Format zu konvertieren, durch die Analyse des Inhalts der PDF-Datei und HTML + CSS verwenden, um genau seine visuelle Wirkung wiederherzustellen, wird das PDF-Dokument in einen Browser umgewandelt werden ...
vor 9 Monaten
03.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Erzeugt detaillierte und konsistente Videos, ideal für die Erstellung von Werbespots mit detaillierten Figuren und Objekten.

Umfassende Einführung Goku ist ein föderiertes Bild- und Videogenerierungsmodell, das auf Stromtransformationstechniken basiert und für eine Leistung auf Industrieniveau entwickelt wurde. Es integriert fortschrittliche, qualitativ hochwertige visuelle Generierungstechniken, einschließlich feinkörniger Datensammlung, Modelldesign und Stromtransformationsformulierung...
vor 6 Monaten
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: ein Rahmen für die Zusammenarbeit von Clustern mit mehreren Intelligenzen

Quantum Swarm ist ein Open-Source-Framework für künstliche Intelligenz, das sich auf die Entwicklung und Erforschung von KI-Populationsintelligenz konzentriert. Das Projekt wird vom Quarm AI Team auf GitHub gepflegt und zielt darauf ab, eine flexible und effiziente Plattform für den Aufbau und das Testen von Multi-Intelligenz-Systemen...
vor 7 Monaten
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: Überwachung der OpenWebUI-Benutzeraktivitäten, Verwaltung von Nutzungsbeschränkungen, Unterstützung der Ein-Klick-Bereitstellung.

Allgemeine Einführung OpenWebUI-Monitor ist ein Dashboard zur Überwachung von OpenWebUI-Benutzeraktivitäten und zur Verwaltung von Nutzungsquoten. Es ermöglicht Ihnen die effiziente Festlegung von Benutzerquoten, die Anzeige von Benutzerdaten und visuellen Informationen in Echtzeit, unterstützt die Bereitstellung mit einem Klick und erleichtert die Benutzerverwaltung und -überwachung...
vor 9 Monaten
03.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: Erzeugen Sie ausdrucksstarke Sprechvideos mit einem einzigen Avatarbild!

DreamTalk Umfassende Einführung DreamTalk ist ein von der Tsinghua Universität, der Alibaba Gruppe und der Huazhong Universität für Wissenschaft und Technologie gemeinsam entwickeltes System zur Erzeugung von ausdrucksstarken Sprechern. Es besteht hauptsächlich aus drei Teilen: einem Netzwerk zur Rauschunterdrückung, einem Stilexperten für Lippen und einem Stilprädikator, der auf...
vor 8 Monaten
03.1K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Allgemeine Einführung Zerox ist ein Open-Source-Projekt, das entwickelt wurde, um PDF, DOCX, Bilder und andere Dokumente durch visuelle Modelle in das Markdown-Format zu konvertieren. Das Projekt wird vom getomni-ai Team entwickelt und bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung....
vor 7 Monaten
03K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug

Umfassende Einführung Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z. B. PDF, Word, PPTX usw.). Die API nutzt die modernste OCR-Technologie (Optical Character Recognition) und...
vor 7 Monaten
03K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: eine Open-Source-Chat-Plattform für die Interaktion mit personalisierten KI-Charakteren

Allgemeine Einführung Agnai Chat ist eine Open-Source-KI-Chat-Plattform, die es Benutzern ermöglicht, personalisierte KI-Charaktere für Einzel- oder Mehrspieler-Interaktionen zu erstellen. Sie unterstützt eine breite Palette von KI-Diensten, darunter OpenAI, Claude, Kobold usw., und eignet sich für Unterhaltung, Rollenspiele, Bildung oder...
vor 4 Monaten
03K
AI Podcast Generator:自动抓取新闻生成音频播客

AI-Podcast-Generator: Automatische Erfassung von Nachrichten zur Erstellung von Audio-Podcasts

Allgemeine Einführung AI Podcast Generator ist ein intelligentes Tool zur Erstellung von Podcasts, das fortschrittliche KI-Technologie nutzt, um automatisch ansprechende Audioinhalte aus Webquellen zu erstellen. Das System erzeugt natürlich fließende Erzählungen, indem es Nachrichteninhalte aufnimmt und in Audio-Podcasts umwandelt. Das Projekt basiert auf dem Next...
vor 9 Monaten
03K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): Framework zur Erzeugung von Ganzkörpergesten, 3D-Animations-Framework zur Erzeugung von Ganzkörpergesten aus Audio

Umfassende Einführung PantoMatrix ist ein fortschrittliches Framework zur Erzeugung von Ganzkörpergesten, das in der Lage ist, komplette menschliche Bewegungen aus Audio- und Teilgesten zu generieren, einschließlich Gesichts-, Teilkörper-, Hand- und Ganzkörperbewegungen. Das Framework nutzt die neuesten multimodalen Datensätze und Deep-Learning-Techniken, um qualitativ hochwertige 3D-Gesten zu...
vor 9 Monaten
03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: ein Rahmenwerk für die schnelle Entwicklung und Bereitstellung von KI-Intelligenzen durch natürliche Sprache

Allgemeine Einführung AutoAgent ist ein Open-Source-Framework für KI-Intelligenzen, das vom Data Intelligence Laboratory der Universität Hongkong (HKUDS) entwickelt wurde und auf GitHub gehostet wird. Es ermöglicht Nutzern die schnelle Erstellung und den Einsatz maßgeschneiderter KI-Intelligenzen, indem sie ihre Anforderungen in rein natürlicher Sprache beschreiben, ohne jegliche Programmiergrundlage...
vor 2 Monaten
03K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: Animationswerkzeug zur Erstellung dynamischer Porträts aus Standbildern und Videos

Allgemeine Einführung LivePortrait ist ein fortschrittliches KI-Tool für dynamische Porträtanimationen, das von Racer Technology entwickelt wurde. Es nutzt eine innovative KI-Technologie, um Standbilder in lebendige Videoanimationen zu verwandeln. Ob Sie nun echte Fotos, Animationsstile oder künstlerische Porträts verwenden, LivePortrait...
vor 9 Monaten
03K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: KI-Assistent zur Datenanalyse mit direktem Zugriff auf Antworten, SQL-Abfragen und Analyseberichte

Allgemeine Einführung WrenAI ist ein Open-Source-SQL-KI-Assistent, der speziell entwickelt wurde, um Datenteams, Produktteams und Geschäftsteams dabei zu helfen, durch natürlichsprachliche Konversationen Dateneinblicke zu gewinnen. Er ist in der Lage, natürliche Sprache in SQL-Abfragen zu konvertieren, Diagramme, Tabellen und Berichte zu erstellen und unterstützt mehrsprachige...
vor 7 Monaten
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: Intelligente mehrsprachige Video-KI-Synchronisation/Übersetzung

Umfassende Einführung Linly-Dubbing ist ein intelligentes, mehrsprachiges KI-Synchronisations- und Übersetzungstool, das entwickelt wurde, um Benutzern durch die Integration fortschrittlicher KI-Technologie hochwertige mehrsprachige Videosynchronisations- und Untertitelübersetzungsdienste zu bieten. Das Tool eignet sich besonders für die internationale Bildung, die Lokalisierung globaler Inhalte und andere Szenarien...
vor 7 Monaten
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Das Ziel der Tabellenerkennung besteht darin, Tabellen in Bildern zu analysieren, Tabellenstrukturen und Zellenpositionen genau zu identifizieren und sie in strukturierte Tabellenformate (z. B. HTML) zu reduzieren. Im heutigen Informationszeitalter liegt eine große Menge wichtiger Tabellendaten immer noch in unstrukturiertem Zustand vor (z. B. gescannte Dokumente mit Bildern von statistischen Tabellen).
vor 5 Monaten
03K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: Automatische Erstellung umfassender Rezensionen von arXiv-Papieren und deren Umwandlung in Blogbeiträge

Allgemeine Einführung Paper Reviewer ist ein Open-Source-Projekt, das entwickelt wurde, um umfassende Rezensionen von arXiv-Papieren zu generieren und sie in Blog-Posts zu verwandeln. Das Projekt betreibt die Website Hugging Face's Daily Papers, die automatisch...
vor 9 Monaten
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: Vorhersage der Wahrscheinlichkeit künftiger Ereignisse auf der Grundlage von Suchwissen

Allgemeine Einführung Forecast AI ist eine hervorragende Prognoseplattform, die auf fortschrittlicher Technologie der künstlichen Intelligenz basiert. Sie nutzt leistungsstarke Datenanalysen und Algorithmen des maschinellen Lernens, um den Nutzern hochpräzise Vorhersagen über zukünftige Ereignisse zu liefern. Ob es sich um politische Wahlen, wirtschaftliche Trends oder gesellschaftliche Ereignisse handelt, Forecast ...
vor 11 Monaten
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: Aufbau von KI-Intelligenzen mit Gedächtnis, Wissen und Werkzeugen

Umfassende Einführung PhiData ist ein Framework für die Entwicklung intelligenter KI-Assistenten. Es ermöglicht KI-Assistenten, sich an langfristigen Gesprächen zu beteiligen, genauen Geschäftskontext bereitzustellen und eine Vielzahl von Operationen durch erweiterte Speicher-, Wissensintegrations- und Tool-Aufruf-Fähigkeiten durchzuführen.PhiData verbessert nicht nur die...
vor 5 Monaten
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Micro Agent: KI-Programmierintelligenz, die automatisch Code generiert und diesen testet und korrigiert.

Allgemeine Einführung Micro-Agent ist ein von Builder.io entwickelter Open-Source-KI-Codierassistent, der Entwicklern die Möglichkeit bieten soll, automatisch Code zu generieren und zu testen. Er generiert Testfälle durch das Verstehen von Beschreibungen in natürlicher Sprache und iteriert den Code, bis alle Tests erfolgreich...
vor 7 Monaten
03K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: ein KI-Assistent zur Erstellung von Sitzungsprotokollen, Transkription und Erstellung von Sitzungszusammenfassungen in Echtzeit

Allgemeine Beschreibung Meetily ist ein von Zackriya Solutions entwickelter KI-gestützter Meeting-Assistent, der Audioaufnahmen von Meetings in Echtzeit erfasst, Sprachtranskriptionen durchführt und Zusammenfassungen von Meetings erstellt. Einzigartig ist, dass die gesamte Verarbeitung lokal auf dem Gerät erfolgt, wodurch die Privatsphäre des Nutzers...
vor 6 Monaten
03K