AI Open-Source-Projekt

Insgesamt 1020 Artikel
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: schnelles und kontrollierbares mehrsprachiges (7000+ Sprachen unterstützt) Text-to-Speech-Tool

Allgemeine Einführung IMS Toucan ist ein modernes Text-to-Speech (TTS) Toolkit, das vom Institut für Maschinelle Sprachverarbeitung (IMS) an der Universität Stuttgart entwickelt wurde. Das Toolkit unterstützt mehr als 7000 Sprachen und ist schnell, kontrollierbar und hat geringe Anforderungen an die...
vor 6 Monaten
03.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: Gewährleistung des Datenschutzes durch Kommunikation mit mehreren Dokumenten auf lokalen Geräten

Allgemeine Einführung LocalGPT ist ein Open-Source-Projekt, das es Benutzern ermöglichen soll, mit Dokumenten auf lokalen Geräten zu kommunizieren und dabei den Datenschutz zu gewährleisten. Durch die Verwendung verschiedener Open-Source-Modelle kann LocalGPT Dokumenteninhalte verarbeiten und verstehen, ohne Daten in die Cloud hochzuladen. Das Projekt unterstützt eine Vielzahl von P...
vor 8 Monaten
03.1K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: Animationswerkzeug zur Erstellung dynamischer Porträts aus Standbildern und Videos

Allgemeine Einführung LivePortrait ist ein fortschrittliches KI-Tool für dynamische Porträtanimationen, das von Racer Technology entwickelt wurde. Es nutzt eine innovative KI-Technologie, um Standbilder in lebendige Videoanimationen zu verwandeln. Ob Sie nun echte Fotos, Animationsstile oder künstlerische Porträts verwenden, LivePortrait...
vor 9 Monaten
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: ein Rahmen für die Zusammenarbeit von Clustern mit mehreren Intelligenzen

Quantum Swarm ist ein Open-Source-Framework für künstliche Intelligenz, das sich auf die Entwicklung und Erforschung von KI-Populationsintelligenz konzentriert. Das Projekt wird vom Quarm AI Team auf GitHub gepflegt und zielt darauf ab, eine flexible und effiziente Plattform für den Aufbau und das Testen von Multi-Intelligenz-Systemen...
vor 7 Monaten
03.1K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: Generieren und bearbeiten Sie mehrsprachige Bildtexte, die in hohem Maße kontrollierbar sind, um mehrere Zeilen Chinesisch im Bild zu generieren

Umfassende Einführung AnyText ist ein revolutionäres mehrsprachiges visuelles Texterzeugungs- und -bearbeitungswerkzeug, das auf der Grundlage des Diffusionsmodells entwickelt wurde. Es erzeugt natürlichen, hochwertigen mehrsprachigen Text in Bildern und unterstützt flexible Textbearbeitungsmöglichkeiten. Es wurde von einem Team von Forschern entwickelt und auf der ICLR 2024 vorgestellt...
vor 7 Monaten
03.1K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: Intelligente Bodybuilding-Plattform für Workflow-Automatisierung und autonome Aufgabenausführung

Allgemeine Beschreibung AutoGPT ist eine leistungsstarke Plattform, die Benutzern hilft, kontinuierlich laufende KI-Agenten zu erstellen, bereitzustellen und zu verwalten und komplexe Workflows zu automatisieren. Die von Significant Gravitas entwickelte Plattform bietet eine breite Palette von Tools und Funktionen, die es den Anwendern ermöglichen, sich auf...
vor 8 Monaten
03.1K
Browse AI:无代码提取和监控结构化数据

KI durchsuchen: Extrahieren und Überwachen strukturierter Daten ohne Code

Browse Browse AI ist eine Cloud-basierte Web-Automatisierungssoftware, die Benutzern hilft, Daten von jeder beliebigen Website ohne Programmierung zu extrahieren und zu überwachen. Sie können einen Bot trainieren, um Datenextraktion, Überwachung und Automatisierungsaufgaben mit nur einem Mausklick durchzuführen...
vor 11 Monaten
03.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: ein effizientes Tool zur Generierung von Retrieval-Erweiterungen (RAG), das mehrere Datenbanken und Sprachmodelle unterstützt.

Allgemeine Einführung RAGLite ist ein Python-Toolkit für Retrieval Augmented Generation (RAG) mit Unterstützung für PostgreSQL- oder SQLite-Datenbanken. Es bietet flexible Konfigurationsoptionen, die es dem Benutzer erlauben, verschiedene Sprachmodelle und Reorderer zu wählen...
vor 9 Monaten
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: Intelligente mehrsprachige Video-KI-Synchronisation/Übersetzung

Umfassende Einführung Linly-Dubbing ist ein intelligentes, mehrsprachiges KI-Synchronisations- und Übersetzungstool, das entwickelt wurde, um Benutzern durch die Integration fortschrittlicher KI-Technologie hochwertige mehrsprachige Videosynchronisations- und Untertitelübersetzungsdienste zu bieten. Das Tool eignet sich besonders für die internationale Bildung, die Lokalisierung globaler Inhalte und andere Szenarien...
vor 7 Monaten
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Das Ziel der Tabellenerkennung besteht darin, Tabellen in Bildern zu analysieren, Tabellenstrukturen und Zellenpositionen genau zu identifizieren und sie in strukturierte Tabellenformate (z. B. HTML) zu reduzieren. Im heutigen Informationszeitalter liegt eine große Menge wichtiger Tabellendaten immer noch in unstrukturiertem Zustand vor (z. B. gescannte Dokumente mit Bildern von statistischen Tabellen).
vor 5 Monaten
03K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter: Ein-Klick-Bereitstellung des Batch-Export-Tools für öffentliche Wechat-Nummern

Umfassende Einführung wechat-article-exporter ist ein Open-Source-Tool entwickelt, um Benutzer Batch-Export WeChat öffentliche Zahl Artikel zu helfen. Das Tool unterstützt den Export der eingebetteten Audio-und Video in den Artikel, ohne den Aufbau einer Umgebung, kann 100% Wiederherstellung der Artikel-Stil, und die Unterstützung für private Teil...
vor 10 Monaten
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: Vorhersage der Wahrscheinlichkeit künftiger Ereignisse auf der Grundlage von Suchwissen

Allgemeine Einführung Forecast AI ist eine hervorragende Prognoseplattform, die auf fortschrittlicher Technologie der künstlichen Intelligenz basiert. Sie nutzt leistungsstarke Datenanalysen und Algorithmen des maschinellen Lernens, um den Nutzern hochpräzise Vorhersagen über zukünftige Ereignisse zu liefern. Ob es sich um politische Wahlen, wirtschaftliche Trends oder gesellschaftliche Ereignisse handelt, Forecast ...
vor 11 Monaten
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: Aufbau von KI-Intelligenzen mit Gedächtnis, Wissen und Werkzeugen

Umfassende Einführung PhiData ist ein Framework für die Entwicklung intelligenter KI-Assistenten. Es ermöglicht KI-Assistenten, sich an langfristigen Gesprächen zu beteiligen, genauen Geschäftskontext bereitzustellen und eine Vielzahl von Operationen durch erweiterte Speicher-, Wissensintegrations- und Tool-Aufruf-Fähigkeiten durchzuführen.PhiData verbessert nicht nur die...
vor 5 Monaten
03K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need: Aufbau eines intelligenten Systems zur Dokumentensuche mit visuellen Sprachmodellen (Vision RAG)

Umfassende Einführung Vision-is-all-you-need ist ein innovatives visuelles RAG (Retrieval Augmented Generation) System-Demonstrationsprojekt, das neue Wege bei der Anwendung von Visual Language Modelling (VLM) auf den Bereich der Dokumentenverarbeitung beschreitet. Im Gegensatz zu traditionellen Text-Chunking-Methoden ermöglicht das System direkt...
vor 7 Monaten
03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: Generierung von Blog-Beiträgen aus gesprochenen Inhalten auf Basis von LangGraph, automatisches Schreiben von Blogs

Allgemeine Einführung Robo Blogger ist ein innovatives Tool zur Erstellung von Blogs, das den Prozess der Inhaltserstellung durch die Sprache-zu-Text-Technologie vereinfacht. Benutzer können Ideen über eine beliebige Sprache-zu-Text-Anwendung aufzeichnen, und Robo Blogger verwandelt diese Ideen in strukturierte Blog-Inhalte...
vor 8 Monaten
03K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: Bewertung der RAG-Rückruf-QA-Genauigkeit und Antwortkorrelation

Umfassende Einführung Ragas ist ein Werkzeug, das speziell für die Bewertung und Optimierung von Retrieval Augmented Generation (RAG) Systemen entwickelt wurde. Es bietet eine umfassende Reihe von Evaluierungsmetriken, indem es die Beziehungen zwischen Anfragen, Retrieval-Kontexten und generierten Antworten analysiert. Diese Metriken umfassen Treue, Relevanz der Antwort, Kontextrelevanz,...
vor 7 Monaten
03K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: KI-Digitalmenschen mit reibungsloser Echtzeit-Interaktion auf Grafikkarten der Serie 30/40

Allgemeine Einführung DH_live ist ein Echtzeit-Live-Projekt für digitale Menschen, das auf beispiellosem Lernen basiert und darauf abzielt, den Benutzern ein reibungsloses und interaktives Live-Streaming-Erlebnis zu bieten. Das Projekt unterstützt NVIDIA-Grafikkarten der Serien 30 und 40 und ist in der Lage, in Echtzeit mit 25+ fps zu laufen. Benutzer können...
vor 9 Monaten
03K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: Open Source Multimodale Großsprachmodelle für visuelle und sprachliche Interaktion in Echtzeit

Allgemeine Einführung VITA ist ein führendes Open-Source-Projekt zur interaktiven multimodalen Modellierung großer Sprachen und leistet Pionierarbeit bei der Realisierung echter multimodaler Interaktion. Das Projekt startete VITA-1.0 im August 2024 und leistete damit Pionierarbeit für das erste quelloffene interaktive vollmodale große Sprachmodell.2024...
vor 7 Monaten
03K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: KI-gestütztes Bildbearbeitungstool im Doodle-Stil

Allgemeine Einführung FramePainter ist ein revolutionäres, KI-gesteuertes Bildbearbeitungstool, das fortschrittliche Videodiffusionstechnologie und intuitive Skizzensteuerungen nutzt, um den Benutzern die komplexe Bildbearbeitung zu erleichtern. Ob es sich um eine einfache Anpassung oder eine komplexe kreative Transformation handelt, Fr...
vor 7 Monaten
03K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework: Integration von Sprachmodellen und digitalen 3D-Charakteren zur Unterstützung verschiedener Anwendungsszenarien

Umfassende Einführung Fay ist ein Open-Source-Framework für virtuelle digitale 3D-Menschen, das Sprachmodelle und digitale Charaktere für eine Vielzahl von Anwendungsszenarien integriert, wie z.B. virtuelle Einkaufsführer, virtuelle Moderatoren, Assistenten, Kellner, Lehrer und sprach- oder textbasierte mobile Assistenten....
vor 7 Monaten
03K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: Open-Source-KI-Software-Ingenieur-Intelligenz, die Anweisungen versteht, in Teilaufgaben zerlegt und Code schreibt

Allgemeine Einführung Devika ist ein fortgeschrittener KI-Softwareentwickler, der menschliche Anweisungen auf hohem Niveau versteht, sie in Schritte zerlegt, die relevanten Informationen studiert und Code schreibt, um ein bestimmtes Ziel zu erreichen. Devika entwickelt Software auf intelligente Weise, indem es umfangreiche Sprachmodelle, Planungs- und Schlussfolgerungsalgorithmen sowie Web-Browsing-Fähigkeiten einsetzt...
vor 5 Monaten
03K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: professionelles Werkzeug zur Erstellung von Manga-Illustrationen mit vier Feldern, zur Erzeugung von Bildern und zur Bearbeitung von Manga-Seiten

Allgemeine Einführung SP-MangaEditer ist eine unabhängige Manga-Bearbeitungsplattform, die für Manga-Ersteller entwickelt wurde. Die Plattform unterstützt Bilderzeugung, Ebenenbearbeitung, Bildanpassung, Filteranwendung und viele andere Funktionen, die dem Benutzer helfen, auf einfache Weise hochwertige Manga-Illustrationen zu erstellen. Benutzer können einfach manipulieren...
vor 7 Monaten
03K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenzzeit auf der Grundlage von Whisper

Allgemeine Einführung RealtimeSTT ist eine effiziente Echtzeit-Sprache-zu-Text-Bibliothek mit fortschrittlicher Sprachaktivitätserkennung und Wake-Word-Aktivierung mit geringer Latenz. Sie wurde von Kolja Beigel entwickelt, um Anwendungen zu unterstützen, die eine schnelle und genaue Sprache-zu-Text...
vor 7 Monaten
03K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: Leistungsstarke Engine für die Inferenz großer Modelle: Extreme Beschleunigung, flexible Befähigung

KTransformers: Ein hochleistungsfähiges Python-Framework zur Überwindung des Engpasses bei der Inferenz großer Modelle. Es ist mehr als nur ein einfaches Werkzeug zur Modellausführung, es ist eine Reihe von extrem leistungsfähigen Optimierungsmotoren und eine flexible Plattform zur Schnittstellenerweiterung. KTransf...
vor 6 Monaten
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: Abfrage und Zusammenfassung von WeChat-Nachrichten in Claude auf Basis von MCP

Allgemeine Einführung MCP Server ChatSum ist ein Open-Source-Projekt, das Benutzern helfen soll, Chat-Nachrichten abzufragen und zusammenzufassen. Das Projekt wird auf GitHub gehostet und bietet ein leistungsstarkes Toolset, mit dem Benutzer Chatprotokolle anhand bestimmter Parameter abfragen und entsprechende Zusammenfassungen generieren können...
vor 5 Monaten
03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: leichtgewichtige Big Model API konvertiert zur OpenAI-Schnittstelle, YAML-Datei zur Konfiguration des API-Kanals

Umfassende Einführung Kein Front-End, reine Konfigurationsdatei Konfiguration API-Kanal. Schreiben Sie einfach eine Datei kann eine API-Station von ihren eigenen laufen, hat das Dokument eine detaillierte Konfigurationsanleitung, weiß freundlich. uni-api ist eine einheitliche Verwaltung von großen Modell-API-Projekt, so dass eine einheitliche ...
vor 9 Monaten
03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: Open-Source-Full-Stack-KI-Ingenieure, die schnell komplette TypeScript-Projekte erstellen und wiederholen

Allgemeine Einführung Srcbook ist eine TypeScript-zentrierte Anwendungsentwicklungsplattform, die für die schnelle Erstellung und Iteration von Webanwendungen mit KI-Assistenten konzipiert ist. Es unterstützt die native Laufzeit, bietet eine interaktive Notebook-Schnittstelle und ermöglicht es Benutzern, Backend-Code zu schreiben und auszuführen....
vor 9 Monaten
03K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: Revolutionäre Werkzeuge zur Spracherzeugung und zum Klonen von Sprache

Umfassende Einführung GPT-SoVITS ist ein Open-Source-Sprachkonvertierungs- und -synthesewerkzeug, das das GPT-Modell und die SoVITS-Sprachwandlertechnologie kombiniert. Das Tool unterstützt die fliegende Text-zu-Sprache-Konvertierung mit null und wenigen Samples sowie die Migration von Sprachstilen mit nur 5 Sekunden Audio-Samples. Zu seinen Funktionen gehören sprachübergreifende ...
vor 11 Monaten
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Kostenloser Zugang zu GPT-4, Llama-3 und vielen anderen AI-Modellen über Raycast!

Allgemeine Einführung Raycast-G4F (GPT4Free) ist eine leistungsstarke Raycast-Erweiterung, die den Benutzern freien Zugang zu einer breiten Palette von fortschrittlichen KI-Modellen, einschließlich GPT-4 und Llama-3, bietet. Die Erweiterung bietet nicht nur Dialog-Streaming in Echtzeit...
vor 7 Monaten
03K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: eine experimentelle Bibliothek zur Optimierung großer Modell-Prompt-Wörter, die Prompt automatisch optimiert

Allgemeine Einführung Promptimizer ist eine experimentelle Bibliothek zur Optimierung von Stichwortwörtern, die Benutzern helfen soll, die Stichwortwörter ihrer KI-Systeme systematisch zu verbessern. Durch die Automatisierung des Optimierungsprozesses kann Promptimizer die Leistung von Schlagwörtern bei bestimmten Aufgaben verbessern. Die Benutzer müssen nur die...
vor 9 Monaten
03K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: Intelligenter Video-Agent für die Durchführung von Video-Such-, -Bearbeitungs- und -Generierungs-Workflows mit natürlichsprachlichen Beschreibungen

Allgemeine Einführung Director ist ein Open-Source-Framework zur Vereinfachung und Optimierung von Videointeraktionen und -workflows durch den Aufbau intelligenter Videoagenten. Das Framework basiert auf der "Video-als-Daten"-Infrastruktur von VideoDB und ist in der Lage, komplexe Videoaufgaben wie das Suchen, Bearbeiten, Kompilieren und Generieren...
vor 8 Monaten
03K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: Open-Source-Videomodelle für die Erstellung von qualitativ hochwertigen Videos über menschliche Handlungen

Allgemeine Einführung SkyReels-V1 ist ein Open-Source-Projekt, das vom SkyworkAI-Team entwickelt wurde und sich auf die Generierung hochwertiger, auf den Menschen bezogener Videoinhalte konzentriert. Das Projekt basiert auf dem HunyuanVideo-Modell, durch das Millionen von hochwertigen Film- und Fernsehclips von...
vor 6 Monaten
03K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: Open-Source-Programmierassistent, KI-Assistent zum Schreiben von Code und Bearbeiten von Dateien

Allgemeine Einführung Aider ist ein leistungsstarkes Open-Source-KI-Programmierassistententool, das Entwicklern beim Schreiben, Bearbeiten und Refactoring von Code durch Dialoge in natürlicher Sprache hilft. Als interaktives KI-Paar-Programmierwerkzeug unterstützt Aider viele wichtige Programmiersprachen und kann nahtlos in Git integriert werden...
vor 4 Monaten
03K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: Laden Sie ein Zimmerfoto hoch und gestalten Sie es mithilfe von KI neu!

Allgemeine Einführung RoomGPT ist ein Open-Source-Projekt, das vom GitHub-Benutzer Nutlope entwickelt wurde. Es ermöglicht Benutzern, Fotos von Räumen hochzuladen und mithilfe von künstlicher Intelligenz neu gestaltete Versionen davon zu generieren. Das Projekt zielt darauf ab, Nutzern Zugang zu professioneller Innenraumgestaltung zu verschaffen, ohne teure Designergebühren...
vor 9 Monaten
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: parst jede Art von Dokument in LLM-verfügbare Daten, wobei alle Informationen im Dokument, wie z. B. Tabellen und Bilder, in ihrer Gesamtheit erhalten bleiben.

Allgemeine Einführung MegaParse ist ein leistungsfähiges und vielseitiges Dokument-Parsing-Tool, das zur Optimierung der Datenverarbeitung für das Large Language Model (LLM) entwickelt wurde. Ob Sie nun mit Text, PDF, PowerPoint-Präsentationen oder Word-Dokumenten arbeiten, MegaParse...
vor 8 Monaten
03K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: Intelligenter Assistent für die Stellensuche, automatisierte Lebenslaufplatzierung (nur auf Englisch)

Allgemeine Einführung Auto_Jobs_Applier_AIHawk ist ein Tool zur Automatisierung der Stellensuche mit Hilfe von Technologie der künstlichen Intelligenz. Es hilft den Nutzern, eine große Anzahl von Lebensläufen in kurzer Zeit zu automatisieren und sie entsprechend ihren persönlichen Informationen und ihren Absichten bei der Stellensuche zu personalisieren. Das Tool wurde entwickelt, um die...
vor 8 Monaten
03K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: ein kostenloses Tool für Bildkommentare zur Steigerung der Effizienz von Computer-Vision-Projekten

Allgemeine Einführung Make Sense ist ein kostenloses Online-Tool zur Bildkommentierung, das Benutzern helfen soll, Datensätze für Computer-Vision-Projekte schnell vorzubereiten. Es erfordert keine komplizierte Installation, sondern lediglich einen Browser-Zugang, unterstützt mehrere Betriebssysteme und ist ideal für kleine Deep-Learning-Projekte. Benutzer können...
vor 6 Monaten
03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: fassen Sie ein ganzes Buch mit einem Klick zusammen, destillieren Sie effizient den Inhalt des Buches und erfassen Sie schnell die Kernideen

Umfassende Einführung TextDistiller ist ein fortschrittliches, KI-gesteuertes Tool, das Bücher kapitelweise oder als Ganzes zusammenfasst und so einen prägnanten und dennoch umfassenden Überblick bietet. Durch die Verwendung von TextDistiller können die Benutzer schnell die Kernideen und Schlüsselpunkte eines Buches erfassen...
vor 8 Monaten
03K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: quelloffenes KI-Lesezeichen-Management-Tool, Unterstützung für mehrere Formate, intelligente Tag-Klassifizierung, Volltextsuche

Allgemeine Beschreibung Hoarder ist ein selbstgehostetes Tool zur Verwaltung von Lesezeichen, das die Speicherung von Links, Notizen, PDFs und Bildern unterstützt. Es verwendet KI-Technologie für die automatische Verschlagwortung und bietet Volltextsuchfunktionen. Benutzer können das Chrome-Plugin und Firefox-Plugin verwenden...
vor 8 Monaten
03K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: ein leichtes, quelloffenes visuelles Sprachmodell für Batch-Backpropagation von Bildwörtern

Umfassende Einführung Moondream ist ein quelloffenes, leichtgewichtiges visuelles Sprachmodell, das entwickelt wurde, um Bildbeschreibungsfähigkeiten durch Deep Learning und Computer Vision Techniken zu ermöglichen. Das Modell ist in der Lage, effizient auf einer Vielzahl von Plattformen zu laufen, und ist besonders geeignet für Edge-Geräte.Moondream nutzt fortschrittliche Techniken und...
vor 7 Monaten
03K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: Werkzeug zum Lesen von Quellcode, das LLM zur Analyse des Codes verwendet und detaillierte Erklärungen zum Code liefert, Unterstützung für eine Vielzahl von Programmiersprachen

Allgemeine Einführung askrepo ist ein Tool zum Lesen von Quellcode, das auf LLM (Large Language Model) basiert. Es kann den Inhalt einer Git-verwalteten Textdatei in einem bestimmten Verzeichnis lesen und ihn an die Google Gemini API senden, um Antworten auf Fragen zu geben, die auf bestimmten Aufforderungen basieren...
vor 9 Monaten
03K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: ein KI-Open-Source-Workflow-Framework, das viele Stichworte zur effizienten Bearbeitung einer Vielzahl von Transaktionen integriert

Allgemeine Einführung Fabric ist ein Open-Source-KI-Framework, das von Daniel Miessler entwickelt wurde, um alltägliche Computeraufgaben zu vereinfachen und zu automatisieren und künstliche Intelligenz leichter nutzbar zu machen. Es hilft den Nutzern effizient durch einen modularen Aufbau und vordefinierte Aufforderungswörter (Patterns)...
vor 10 Monaten
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: Ein RAG-Rahmenwerk für das Verstehen ultralanger Videos mit Unterstützung für multimodales Retrieval und Wissensgraphenkonstruktion

Umfassende Einführung VideoRAG ist ein Retrieval-verbessertes generatives Framework für die Verarbeitung und das Verständnis von sehr langen kontextuellen Videos. Das Tool kombiniert eine graphengesteuerte textuelle Wissensbasis mit hierarchischer multimodaler Kontextkodierung zur effizienten Verarbeitung auf einer einzigen NVIDIA RTX 3090 GPU...
vor 6 Monaten
03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Dokumenten-Chat-Assistent, zuverlässige Antworten aus einzelnen Dokumenten, Web-Quellen, Unterstützung der lokalen Bereitstellung

Allgemeine Einführung DocsGPT ist ein Open-Source-Dokumentationsassistent, der den Prozess der Abfrage von Projektdokumentation vereinfacht. Durch die Integration eines leistungsstarken GPT-Modells können Entwickler einfach Fragen über das Projekt stellen und erhalten genaue Antworten.DocsGPT unterstützt die lokale Bereitstellung, um...
vor 9 Monaten
03K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: Audio-gesteuerte Porträtbilder erzeugen digitale Demo-Videos mit lebendiger Mimik

Allgemeine Einführung Sonic ist eine innovative Plattform, die sich auf die globale Audiowahrnehmung konzentriert und darauf ausgelegt ist, lebendige Porträtanimationen zu erzeugen, die durch Audio gesteuert werden. Die von einem Forscherteam von Tencent und der Zhejiang University entwickelte Plattform nutzt Audioinformationen zur Steuerung von Gesichtsausdrücken und Kopfbewegungen, um natürliche und flüssige Animationsvideos zu erzeugen...
vor 4 Monaten
03K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: All-in-One-Tool für die Restaurierung und Bearbeitung von Bildern von Tencent ARC veröffentlicht

Umfassende Einführung BrushEdit ist ein von Tencent ARC Labs entwickeltes All-in-One-Werkzeug zur Bildreparatur und -bearbeitung. Das Tool basiert auf der neuesten KI-Technologie und ist in der Lage, Defekte in Bildern automatisch zu erkennen und zu reparieren, während es gleichzeitig die interaktive Bearbeitung durch den Benutzer unterstützt.BrushEdit...
vor 8 Monaten
03K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: Umkehrung der mündlichen Berechnungen des kleinen Affen, Reverse Engineering und Entschlüsselungsalgorithmen

Umfassende Einführung Ape Mouth Calculator Reverse Notes ist ein Open-Source-Projekt, das darauf abzielt, den Prozess und die Methoden des Reverse Engineering der Ape Mouth Calculator-Anwendung zu dokumentieren und zu teilen. Das Projekt enthält eine Vielzahl von Reverse-Tools und Techniken, um die Anweisungen zu verwenden, wie z.B. Frida, dexdump, usw., um den Benutzern zu helfen, die kleine Affenmund-Rechenanwendung zu verstehen und zu knacken...
vor 10 Monaten
03K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: lokal trainierte KI-Doppelgänger mit persönlichen Erinnerungen und Gewohnheiten

Second Me ist ein Open-Source-Projekt, das vom Mindverse-Team entwickelt wurde und es Ihnen ermöglicht, eine KI auf Ihrem Computer zu erstellen, die wie ein "digitaler Doppelgänger" agiert, Ihre Sprachmuster und Gewohnheiten durch Ihre Worte und Erinnerungen lernt und zu einer intelligenten Person wird, die Sie versteht...
vor 5 Monaten
02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: eine Intelligenz, die mehr als 500 Forschungswerkzeuge integriert, um Forschungs- und wissenschaftliche Aufgaben zu automatisieren

Umfassende Einführung SciToolAgent ist eine Open-Source-Werkzeugplattform, die vom Innovationszentrum der Zhejiang-Universität in Hangzhou (HICAI-ZJU) entwickelt wurde. Sie integriert mehr als 500 wissenschaftliche Werkzeuge durch Wissensgraphen (SciToolKG) und Big-Language-Modellierungstechnologien, um Forschern zu helfen, mit...
vor 5 Monaten
02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: Lesen von Textdateien aus dem Git-Repository und schnelles Chunking für große Modelle

Allgemeine Einführung Yek ist ein schnelles Rust-basiertes Werkzeug zum Lesen von Textdateien aus Repositories oder Verzeichnissen, zum Chunking und zur Serialisierung für die Verwendung in Large Language Models (LLMs). Das Tool verwendet standardmäßig die .gitignore-Regel, um nicht benötigte Dateien zu überspringen, und verwendet...
vor 7 Monaten
02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: eine saubere Chat-Schnittstelle für die Interaktion mit nativen Ollama-Modellen

Allgemeine Einführung HiOllama ist eine benutzerfreundliche Schnittstelle, die auf Python und Gradio basiert und für die Interaktion mit Ollama-Modellen entwickelt wurde. Sie bietet eine einfache und intuitive Weboberfläche, die Textgenerierung in Echtzeit und Funktionen zur Modellverwaltung unterstützt. Benutzer können Parameter wie die Temperatur und die meisten...
vor 9 Monaten
02.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: YouTube Downloader, YouTube Video kostenlos herunterladen, Audio extrahieren, Untertitel erhalten

Allgemeine Einführung YTSage ist ein moderner YouTube-Downloader mit einer sauberen PyQt6-Oberfläche. Benutzer können YTSage verwenden, um Videos beliebiger Qualität herunterzuladen, Audio zu extrahieren, Untertitel abzurufen (einschließlich automatisch generierter Untertitel) und die Metadaten des Videos anzuzeigen...
vor 8 Monaten
02.9K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: Ein Open-Source-Tool zur Umsetzung von Fotos und Videos in Anime-Stilistik

Allgemeine Einführung DCT-Net ist ein Open-Source-Projekt, das von der DAMO Academy und dem Wang Xuan Institute of Computer Technology, Peking University, entwickelt wurde und auf die stilisierte Transformation von Bildern abzielt. Das Projekt nutzt Deep-Learning-Techniken durch Domain-Calibrated Translation (Domain-Calibrat...
vor 7 Monaten
02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: End-to-End-KI-Stimmenklon-Assistent, Echtzeit-Sprachdialog-Assistent, Fish Speech-Spin-off-Projekt

Umfassende Einführung Fish Speech Derivative Project Fish Agent ist ein revolutionäres End-to-End-KI-Sprachklon-System, das auf der Grundlage der 3B-Modellarchitektur V0.1 entwickelt wurde. Als ein vollständig durchgängiges Sprachklon-Verarbeitungssystem ist sein wichtigstes Merkmal die Verwendung innovativer sprachloser...
vor 7 Monaten
02.9K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: KI-Helfer-Erweiterung, die die VSCode-Entwicklungserfahrung verbessert, Ein-Klick-Kommentar, Konvertierung und UI-Generierung von Code

Allgemeine Einführung AIDE (AI-assisted Development Extension) ist eine leistungsstarke KI-unterstützte Entwicklungserweiterung für VSCode, die sich auf die Bereitstellung einzigartiger und nützlicher KI-Programmierhilfen konzentriert. Sie unterscheidet sich von GitHu...
vor 7 Monaten
02.9K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: Open-Source-Tool zur Erstellung intelligenter KI-Foto-IDs

Umfassende Einführung HivisionIDPhotos ist ein Open-Source-Leichtbau-KI-Dokument Foto-Produktionstool, kann intelligent identifizieren die Benutzer Foto-Szene und Keying, ein Standard-Dokument Foto im Einklang mit einer Vielzahl von Spezifikationen zu generieren. Das Tool unterstützt benutzerdefinierte Hintergrundfarben und Größen, und in der Zukunft wird auch Schönheit und...
vor 11 Monaten
02.9K
ANP:实现智能代理间安全高效通信的开源协议

ANP: Ein Open-Source-Protokoll für die sichere und effiziente Kommunikation zwischen intelligenten Agenten

Allgemeine Einführung AgentNetworkProtocol (kurz ANP) ist ein Open-Source-Protokollprojekt, das auf GitHub gehostet wird und sich auf die Bereitstellung sicherer und effizienter Kommunikationslösungen für intelligente Agenten (AI-Agenten) konzentriert. Es arbeitet mit einer dreischichtigen Architektur - Identität und Verschlüsselung...
vor 5 Monaten
02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Wissensdatenbank + LLM-gesteuerter intelligenter Code-Review-Mentor für GitHub

Umfassende Einführung CR-Mentor ist ein intelligentes Code-Review-Tool, das eine professionelle Wissensbasis mit der Leistungsfähigkeit von Large Language Modelling (LLM) kombiniert. Es unterstützt nicht nur Code-Reviews für alle Programmiersprachen, sondern passt auch exklusive Review-Kriterien und Schwerpunktbereiche für Teams an, die auf den in der Wissensdatenbank gesammelten Best Practices basieren. Durch...
vor 9 Monaten
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: KI-Chat-Schnittstelle zur Visualisierung baumbasierter Konversationen

Allgemeine Einführung TreeGPT ist eine auf Next.js basierende Open-Source-Chat-Anwendung, die sich auf die Visualisierung von Unterhaltungen mit großen Sprachmodellen (LLMs, z.B. GPTs) durch Baumgraphenstrukturen (gerichtete azyklische Graphen, DAGs) konzentriert und damit traditionelle lineare Chat-Methoden ersetzt, um die Geschwindigkeit und...
vor 6 Monaten
02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: Parsing komplexer Formatdokumente, Extraktion multimodaler Daten in Metadaten und Text

Umfassende Einführung NV Ingest (NVIDIA Ingest) ist eine Reihe von Microservices für den frühen Zugriff, die für das Parsen von Hunderttausenden von komplexen, unübersichtlichen unstrukturierten PDFs und anderen Unternehmensdokumenten entwickelt wurden. Sie kann diese Dokumente in Metadaten und Text umwandeln, um sie in Retrievalsysteme einzubetten...
vor 7 Monaten
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: Ein fortschrittliches KI-Retrieval-System (RAG) für multimodales Content-Parsing und die Kombination von Wissensgraphen mit hybrider Suche

Umfassende Einführung R2R (RAG to Riches) ist ein fortschrittliches KI-Retrievalsystem, das Retrieval Augmented Generation (RAG)-Funktionen mit produktionsreifen Features unterstützt. Das System basiert auf einer containerisierten RESTful API und bietet multimodales Content-Parsing, hybride Suchfunktionen...
vor 8 Monaten
02.9K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

Allgemeine Einführung AingDesk ist eine quelloffene und kostenlose Software, die Benutzern helfen soll, verschiedene KI-Modelle auf ihren lokalen Computern einfach einzusetzen und auszuführen. Egal, ob es sich um ein DeepSeek- oder ein Llama-Modell handelt, AingDesk ermöglicht eine einfache Schritt-für-Schritt...
vor 6 Monaten
02.9K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: Eine einheitliche API für die Integration von bekannter Spracherzeugung, Sprachtranskription und Sprachmodellierung

Allgemeine Einführung Orate ist ein KI-Toolkit, das sich auf Spracherzeugung und Transkription konzentriert. Es bietet eine einheitliche API, die sich nahtlos mit führenden KI-Anbietern wie OpenAI, ElevenLabs und AssemblyAI integrieren lässt, um Nutzern zu helfen,...
vor 6 Monaten
02.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Eine benutzerfreundliche Schnittstelle für ComfyUI zur Rationalisierung von Arbeitsabläufen

Allgemeine Einführung ComfyUI-disty-Flow ist ein benutzerdefinierter Knoten, der eine benutzerfreundliche Schnittstelle zu ComfyUI bietet. Er soll die Ausführung von Workflows vereinfachen, indem er eine alternative Benutzeroberfläche für die Erstellung von Workflows bereitstellt.ComfyUI-disty...
vor 7 Monaten
02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: Text-Bild-Modell zur Erzeugung hochwertiger Bilder, mit Unterstützung für die Erstellung chinesischer Poster

Umfassende Einführung Kolors ist ein vom Racer-Team entwickeltes groß angelegtes Modell zur Text-Bild-Erzeugung, das auf Potenzialdiffusionstechniken basiert. Das Modell wurde mit Milliarden von Text-Bild-Datenpaaren trainiert und ist in der Lage, qualitativ hochwertige, komplexe, semantisch korrekte Bilder zu erzeugen, die sowohl chinesische als auch englische Eingaben unterstützen....
vor 8 Monaten
02.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: Ein visuelles Bewertungsinstrument zur Optimierung von Systemen zur Retrievalverbesserung

Umfassende Einführung XRAG (eXamining the Core) ist ein Benchmarking-Framework, das für die Bewertung der zugrundeliegenden Komponenten von fortgeschrittenen Retrieval Augmentation Generation (RAG)-Systemen entwickelt wurde. Durch die Erstellung von Profilen und die Analyse jedes Kernmoduls liefert XRAG Informationen darüber, wie verschiedene Konfigurationen und Komponenten die RAG beeinflussen...
vor 7 Monaten
02.9K
Supermemory:导入书签和网页内容构建个人知识库

Supermemory: Importieren von Lesezeichen und Webinhalten zum Aufbau einer persönlichen Wissensdatenbank

Allgemeine Einführung Supermemory ist ein Open-Source-Projekt, das Benutzern helfen soll, ihr "zweites Gehirn" aufzubauen. Mit einer leistungsstarken Chrome-Erweiterung und KI-Technologie ermöglicht es den Nutzern, Daten von Webseiten, Twitter-Lesezeichen und Co. einfach zu speichern, zu organisieren und abzurufen.
vor 6 Monaten
02.9K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: Open-Source-großes Modell Instant-Messaging-Roboter, Unterstützung für mehrere WeChat, QQ, Flybook und andere Multi-Plattform-Einsatz von AI-Roboter

LangBot ist eine große modellbasierte Instant-Messaging-Bot-Plattform, die mehrere Messaging-Plattformen und große Modelle unterstützt. Die Plattform passt sich an QQ, WeChat (WeChat für Unternehmen, WeChat für Privatpersonen), Flybook, Discord, OneBot und andere Messaging-Plattformen an und unterstützt Open...
vor 6 Monaten
02.9K