AI Open-Source-Projekt

Insgesamt 1020 Artikel
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: ein Visualisierungstool zur Überwachung und Optimierung von LLM-Prozessen auf der Grundlage des DSPy-Frameworks

Umfassende Einführung LangWatch ist eine umfassende Plattform für den Betrieb von Large Language Models (LLM), die Überwachung, Analyse, Bewertung, Datensatzverwaltung und Cue-Optimierung bietet. Die Plattform basiert auf dem DSPy-Framework der Stanford University und wurde entwickelt, um den Benutzern eine bessere Verwaltung und Optimierung...
vor 7 Monaten
02K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: Ein einfacher Programmierassistent auf Basis von Langgraph

Allgemeine Einführung Coding Agent ist ein intelligenter Programmierassistent, der von AbhinavTheDev entwickelt wurde, um Entwicklern zu helfen, ihre Programmiereffizienz zu verbessern. Das Tool nutzt die Technologie der künstlichen Intelligenz, um automatisch Code zu generieren, Programmiervorschläge zu machen und Entwickler bei verschiedenen...
vor 7 Monaten
02.4K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: Bewertung der RAG-Rückruf-QA-Genauigkeit und Antwortkorrelation

Umfassende Einführung Ragas ist ein Werkzeug, das speziell für die Bewertung und Optimierung von Retrieval Augmented Generation (RAG) Systemen entwickelt wurde. Es bietet eine umfassende Reihe von Evaluierungsmetriken, indem es die Beziehungen zwischen Anfragen, Retrieval-Kontexten und generierten Antworten analysiert. Diese Metriken umfassen Treue, Relevanz der Antwort, Kontextrelevanz,...
vor 7 Monaten
03K
VeighNa:国内流行的开源量化交易框架

VeighNa: ein in China beliebtes Open-Source-System für den quantitativen Handel

Umfassende Einführung VeighNa ist eine auf Python basierende Open-Source-Plattform für quantitativen Handel, die ursprünglich von einheimischen privaten Händlern entwickelt und 2015 offiziell eingeführt wurde. Sie hat sich von einem einfachen Handelsschnittstellen-Paket zu einem vollwertigen Framework für die Handelsentwicklung entwickelt. Zu den Nutzern gehören Private-Equity-Fonds, Zertifikate...
vor 5 Monaten
03.7K
AutoGen:微软开发的多智能体对话框架

AutoGen: Ein von Microsoft entwickeltes Multi-Intelligent Body Dialogue Framework

Allgemeine Einführung AutoGen ist ein Open-Source-Framework, das von einem Team von Microsoft-Forschern entwickelt wurde und sich auf die Vereinfachung des Aufbaus von Large-Language-Model (LLM)-Anwendungen durch multi-intelligente Körperdialoge konzentriert. Es ermöglicht Entwicklern, KI-Agenten zu erstellen, die miteinander kommunizieren und zusammenarbeiten können, um Aufgaben zu lösen. Dieser Ansatz verbessert nicht nur die Leistung von LLM...
vor 7 Monaten
03.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: Web-Assistent-Plugin für nativen KI-Modell-Dialog und Abruf von Dokumenten

Allgemeine Einführung Page Assist ist eine Open-Source-Browser-Erweiterung, die Benutzern eine einfache Möglichkeit zur Interaktion mit lokalen KI-Modellen bietet. Mit dieser Erweiterung können Benutzer eine Seitenleiste auf jeder Webseite öffnen, um mit lokal laufenden KI-Modellen zu interagieren....
vor 4 Monaten
04.5K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: Multi-Agenten-Kollaboration für mobile Gerätebedienungsassistenten

Allgemeine Einführung MobileAgent ist ein leistungsstarker Assistent für die Bedienung von Mobilgeräten, der die Effizienz und Automatisierung der Bedienung von Mobilgeräten durch Multi-Agenten-Kollaboration und erweiterte visuelle Wahrnehmungsmodule verbessern soll. Er wurde vom X-PLUG-Team entwickelt und unterstützt Android und ...
vor 7 Monaten
03.2K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: KI-gestütztes Bildbearbeitungstool im Doodle-Stil

Allgemeine Einführung FramePainter ist ein revolutionäres, KI-gesteuertes Bildbearbeitungstool, das fortschrittliche Videodiffusionstechnologie und intuitive Skizzensteuerungen nutzt, um den Benutzern die komplexe Bildbearbeitung zu erleichtern. Ob es sich um eine einfache Anpassung oder eine komplexe kreative Transformation handelt, Fr...
vor 7 Monaten
03K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: ein intelligenter Körper, der Computer über Sprache und Text steuert und Sprachfeedback in Echtzeit liefert

Allgemeine Einführung TankWork ist ein Open-Source-Desktop-Agent-Framework, das entwickelt wurde, um KI in die Lage zu versetzen, Ihren Computer durch Computer Vision und Interaktion auf Systemebene wahrzunehmen und zu steuern. Das Framework ermöglicht Agenten die direkte Steuerung von Computern durch Sprach- und Textbefehle, die Verarbeitung von Bildschirminhalten in Echtzeit und die Bereitstellung kontinuierlicher audiovisueller...
vor 7 Monaten
02.9K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: ein Rahmen für die Zusammenarbeit von Clustern mit mehreren Intelligenzen

Quantum Swarm ist ein Open-Source-Framework für künstliche Intelligenz, das sich auf die Entwicklung und Erforschung von KI-Populationsintelligenz konzentriert. Das Projekt wird vom Quarm AI Team auf GitHub gepflegt und zielt darauf ab, eine flexible und effiziente Plattform für den Aufbau und das Testen von Multi-Intelligenz-Systemen...
vor 7 Monaten
03.1K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: Ein visuelles Bewertungsinstrument zur Optimierung von Systemen zur Retrievalverbesserung

Umfassende Einführung XRAG (eXamining the Core) ist ein Benchmarking-Framework, das für die Bewertung der zugrundeliegenden Komponenten von fortgeschrittenen Retrieval Augmentation Generation (RAG)-Systemen entwickelt wurde. Durch die Erstellung von Profilen und die Analyse jedes Kernmoduls liefert XRAG Informationen darüber, wie verschiedene Konfigurationen und Komponenten die RAG beeinflussen...
vor 7 Monaten
02.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: Verschönerung von Markdown-Artikeln mit einem Mausklick, Anpassung an die Formate mehrerer Medienplattformen (lokaler Open-Source-Client)

Umfassende Einführung WenYan ist ein Werkzeug für Markdown Artikel Satz und Verschönerung, unterstützt die Umwandlung von bearbeiteten Markdown Artikel in ein Format geeignet für WeChat, Zhihu, Today's Schlagzeilen und anderen Plattformen. Benutzer können den Artikel mit einem Klick kopieren, der Artikel direkt...
vor 7 Monaten
02.1K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Tool zur Zusammenfassung von Zeitleisten zur Verbesserung der Effizienz bei der Suche nach Nachrichten und der Erstellung von Zeitleisten

Allgemeine Einführung CHRONOS ist ein vom Alibaba NLP-Team entwickeltes Tool zur Zusammenfassung von Zeitleisten in Nachrichten. Das Tool generiert Zusammenfassungen von Nachrichtenereignissen durch iterative Selbstbefragung. CHRONOS ist nicht nur in der Lage, Open-Domain-Timeline-Zusammenfassungsaufgaben zu bewältigen, sondern auch in Bezug auf Effizienz und Skalierbarkeit...
vor 7 Monaten
02.4K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: Steuert die Bewegung von Objekten im Video, wobei alle sich bewegenden Objekte im Video addiert oder subtrahiert werden.

Allgemeine Einführung Go-with-the-Flow ist ein Open-Source-Projekt, das vom Forschungsteam der Netflix Eyeline Studios entwickelt wurde, um die Bewegungsmuster von Video-Diffusionsmodellen durch Verzerrung des Rauschens zu steuern. Das Projekt ermöglicht es dem Benutzer zu bestimmen, wie die Kamera der Szene und die...
vor 7 Monaten
02.3K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Still Portrait Reference Video Pose Generation Video um Missys Fotos tanzen zu lassen

Allgemeine Einführung X-Dyna ist ein Open-Source-Projekt, das von ByteDance entwickelt wurde, um dynamische Porträtanimationen mithilfe von Zero-Sample-Diffusion-Techniken zu erzeugen. Das Projekt nutzt Gesichtsausdrücke und Körperbewegungen in Laufwerksvideos, um einzelne Porträtbilder zu animieren und so realistische und kontextbezogene Bewegungseffekte zu erzeugen.X-Dyna...
vor 7 Monaten
02.5K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): Erzeugung hochauflösender 3D-Assets, mehrere Workflows zur Erzeugung von 3D-Material

Umfassende Einführung Tencent Hunyuan3D (Hunyuan3D 2.0) ist ein fortschrittliches, groß angelegtes 3D-Compositing-System von Tencent, das für die Erzeugung hochauflösender texturierter 3D-Assets entwickelt wurde. Das System besteht aus zwei Kernkomponenten: Hunyuan3D-DiT, einem groß angelegten Modell zur Formerzeugung, und Hunyuan3D-DiT, einer groß angelegten Textur...
vor 7 Monaten
03.4K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Aufbau eines intelligenten Dokumenten-Q&A-Systems und einfache Erstellung einer privaten web-seitigen Wissensdatenbank

Umfassende Einführung RAG Web UI ist ein intelligentes Dialogsystem, das auf der RAG-Technologie (Retrieval Augmented Generation) basiert. Es hilft Unternehmen und Einzelpersonen, intelligente Q&A-Systeme auf der Grundlage ihrer eigenen Wissensbasis zu erstellen. Durch die Kombination von Dokumentenabfrage und großen Sprachmodellen bietet RAG Web UI genaue und zuverlässige...
vor 7 Monaten
02.5K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern...
vor 7 Monaten
03.1K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: Lesen von Textdateien aus dem Git-Repository und schnelles Chunking für große Modelle

Allgemeine Einführung Yek ist ein schnelles Rust-basiertes Werkzeug zum Lesen von Textdateien aus Repositories oder Verzeichnissen, zum Chunking und zur Serialisierung für die Verwendung in Large Language Models (LLMs). Das Tool verwendet standardmäßig die .gitignore-Regel, um nicht benötigte Dateien zu überspringen, und verwendet...
vor 7 Monaten
02.9K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: Multi-Rollen-Intelligenz, die den Output überprüft, validiert und formatiert, um qualitativ hochwertige Ergebnisse zu erzielen

Umfassende Einführung Kheish ist ein quelloffener Multi-Rollen-Agent, der für Large Language Modelling (LLM)-Aufgaben entwickelt wurde, die eine strukturierte, schrittweise Zusammenarbeit erfordern.Kheish ist mehr als nur ein einfacher Koordinator, er ist ein eigenständiger intelligenter Agent, der bei Bedarf Module anfordert,...
vor 7 Monaten
02.7K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: ein vielseitiges Tool zur Erstellung von KI-Inhalten für Kurzgeschichten, Dialogskripte, Voiceover und Grafiken

Allgemeine Beschreibung AI ContentCraft ist ein vielseitiges Tool für die Erstellung von Inhalten, das Texterstellung, Sprachsynthese, Bilderzeugung und vieles mehr integriert. Es hilft Erstellern, schnell Geschichten, Podcast-Skripte und begleitende Audio- und Videoinhalte zu erstellen. Das Tool unterstützt mehrere Sprachkonvertierungen und kann...
vor 7 Monaten
02.9K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: Aufbau von lokal laufenden Wissensgraphen und persönlichen Suchmaschinen

Allgemeine Einführung Unigraph ist ein lokaler, universeller Wissensgraph und eine persönliche Suchmaschine, die Benutzern einen integrierten Arbeitsbereich zur Verfügung stellt, um eine Vielzahl von Daten in ihrem persönlichen Leben zu verwalten und zu suchen. Mit Unigraph können Benutzer Daten aus verschiedenen Quellen in einen...
vor 7 Monaten
02.7K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: Eine benutzerfreundliche Schnittstelle für ComfyUI zur Rationalisierung von Arbeitsabläufen

Allgemeine Einführung ComfyUI-disty-Flow ist ein benutzerdefinierter Knoten, der eine benutzerfreundliche Schnittstelle zu ComfyUI bietet. Er soll die Ausführung von Workflows vereinfachen, indem er eine alternative Benutzeroberfläche für die Erstellung von Workflows bereitstellt.ComfyUI-disty...
vor 7 Monaten
02.9K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Video Analyzer: analysiert Videoinhalte und erstellt detaillierte Beschreibungen

Comprehensive Introduction Video Analyzer ist ein umfassendes Videoanalysetool, das Computer Vision, Audiotranskription und Techniken zur Verarbeitung natürlicher Sprache kombiniert, um detaillierte Beschreibungen von Videoinhalten zu erstellen. Das Tool transkribiert Audioinhalte, indem es Schlüsselbilder aus dem Video extrahiert...
vor 6 Monaten
04.1K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

Umfassende Einführung MaxKB (Max Knowledge Base) ist ein Open-Source-Wissensdatenbank-Q&A-System, das auf großen Sprachmodellen und RAG (Retrieval Augmented Generation) basiert. Das System ist weit verbreitet in der intelligenten Kundenbetreuung, unternehmensinternen Wissensdatenbank, akademischen Forschung und Bildung und anderen Szenarien.MaxKB...
vor 7 Monaten
03.6K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: ein Schreibrahmen für die Erstellung hochwertiger langer Aufsätze, die Suche nach externem Wissen und die anschließende Reflexion darüber sowie der schrittweise Aufbau eines Wissensbaums

Umfassende Einführung OmniThink ist ein innovatives Framework für maschinelles Schreiben, das entwickelt wurde, um qualitativ hochwertige Essays zu erstellen, indem es die iterative Erweiterung und Reflexion menschlicher kognitiver Prozesse nachahmt. OmniThink konzentriert sich darauf, die Grenzen des Wissens zu erweitern und Informationen zu generieren, die reichhaltig und tiefgründig...
vor 7 Monaten
02.5K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

Allgemeine Einführung OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-API von OpenAI verwendet werden kann, um multi-intelligente Körpersprache-Anwendungen zu erstellen. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt von OpenAI Swarm), das es erlaubt,...
vor 7 Monaten
03.4K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库

DeepFace: eine leichtgewichtige Python-Bibliothek zur Erkennung von Alter, Geschlecht, Emotionen und Ethnie im Gesicht

Allgemeine Einführung DeepFace ist eine leichtgewichtige Python-Bibliothek für die Gesichtserkennung und die Analyse von Gesichtsmerkmalen (einschließlich Alter, Geschlecht, Emotionen und ethnischer Zugehörigkeit). Sie integriert mehrere fortschrittliche Gesichtserkennungsmodelle wie VGG-Face, FaceNet, OpenFace, De...
vor 7 Monaten
03.3K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: Rendering von Porträtbildern mit natürlichem Licht (unveröffentlicht)

Allgemeine Beschreibung SynthLight ist ein Porträt-Relighting-Tool, das auf einem Diffusionsmodell basiert. Es lernt, synthetische Gesichtsbilder neu zu rendern, um Lichteffektanpassungen an reale Porträtfotos zu erreichen. Das Tool verwendet eine physikalische Rendering-Engine, um Datensätze zu erzeugen, die Lichttransformationen unter verschiedenen Lichtbedingungen simulieren...
vor 7 Monaten
03.2K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, Bildkonvertierung in Markdown, visuelles Modell, hochpräzise OCR

Allgemeine Einführung Zerox ist ein Open-Source-Projekt, das entwickelt wurde, um PDF, DOCX, Bilder und andere Dokumente durch visuelle Modelle in das Markdown-Format zu konvertieren. Das Projekt wird vom getomni-ai Team entwickelt und bietet eine einfache und effiziente OCR (Optical Character Recognition) Lösung....
vor 7 Monaten
03.2K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: ein minimalistisches, endpunktbasiertes KI-Chat-Tool mit nativer Integration in das Ollama-Backend

Allgemeine Beschreibung Charla ist eine endpunktbasierte Chat-Anwendung, die für den Dialog mit muttersprachlichen Modellen entwickelt wurde. Die Anwendung ist mit dem Ollama-Backend integriert, unterstützt kontextbezogene Dialoge und speichert Chatsitzungen als Markdown-Dateien. Benutzer können einfach...
vor 7 Monaten
02.8K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: Simplified Retrieval Enhanced Generation Framework, Entity Graph Index Recall Relevante Textblöcke

Eine umfassende Einführung MiniRAG ist ein extrem einfaches Retrieval Augmented Generation (RAG)-Framework, das darauf abzielt, eine gute RAG-Leistung auch für kleine Modelle durch heterogene Graphenindizierung und ein leichtgewichtiges topologieerweitertes Retrieval zu ermöglichen. Es wurde vom Data Science Laboratory der Universität von Hongkong (HKUDS) entwickelt, um ...
vor 7 Monaten
03.2K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: Ein multimodales Grand-Modell für das Verständnis von Bild- und Videoregionen zur Verbesserung der Analyse visueller Inhalte

Umfassende Einführung Omni-RGPT ist ein multimodales großes Sprachmodell, das das Verstehen von Bildern und Videos auf Regionsebene ermöglicht. Durch die Einführung der Token-Mark-Technik ist Omni-RGPT in der Lage, die Zielregion im visuellen Merkmalsraum zu markieren und die Zielregion durch regionale Hinweise (z.B. Boxen oder...
vor 7 Monaten
02.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: ein quelloffener Sprachdialogassistent mit niedriger Latenz für natürliche Konversation und Kommunikation

Umfassende Einführung Bailing (Bailing) ist ein Open-Source-Sprachdialog-Assistent, der entwickelt wurde, um einen natürlichen Dialog mit dem Benutzer durch Sprache zu führen. Das Projekt kombiniert Spracherkennung (ASR), Voice Activity Detection (VAD), Large Language Modelling (LLM) und Sprachsynthese (TTS) Technologien, um eine...
vor 7 Monaten
03.2K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: Open-Source-Version des Tools zum digitalen Klonen von Menschen und zur Erstellung kurzer Videos

Umfassende Einführung Metaverse AI (Open-Source-Version) ist ein auf GitHub gehostetes Projekt, das vom libn-net-Team entwickelt wurde. Es kann digitale menschliche Bilder und Stimmen durch KI-Technologie klonen, um kurze Videos zu erzeugen, und unterstützt auch Synchronisation und Untertitelung. Dieses Tool bietet Windo...
vor 5 Monaten
01.7K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: ein Chat-Tool zum Abrufen von Wissen anhand von Wikipedia-Daten

Allgemeine Einführung WikiChat ist ein experimenteller Chatbot, der an der Stanford University entwickelt wurde und darauf abzielt, die Faktizität von großen Sprachmodellen zu verbessern, indem er Daten aus Wikipedia abruft. Große Sprachmodelle (wie ChatGPT und GPT-4) neigen dazu, aktuelle Informationen oder weniger populäre Themen zu verarbeiten, wenn...
vor 7 Monaten
02.1K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: Ein effizientes Rahmenwerk für die Erstellung multiintelligenter kollaborativer Anwendungen

Allgemeine Einführung AIEvo ist das Open-Source-Multi-Agent-Framework der Ant Group, das für die effiziente Erstellung von Multi-Agent-Anwendungen entwickelt wurde. Das Framework folgt strikt dem SOP-Aufgabengraphen, um die Erfolgsrate bei der Ausführung komplexer Aufgaben zu verbessern, und gewährleistet durch Feedback- und Überwachungsmechanismen eine hohe Flexibilität und Skalierbarkeit.AIEvo wurde innerhalb der Ant Group entwickelt...
vor 7 Monaten
02.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: automatische Erstellung und Auswertung von PPT-Präsentationen, Dokumente zu PPTs

Allgemeine Einführung PPTAgent ist ein innovatives System zur automatischen Erstellung von Präsentationen aus Dokumenten. Das System stützt sich auf die menschliche Herangehensweise an die Erstellung von Präsentationen und verwendet einen zweistufigen Prozess, um die Qualität des Inhalts und die visuelle Wirkung sicherzustellen. Darüber hinaus stellt PPTAgent PPTEval vor, eine umfassende...
vor 7 Monaten
02.8K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: Aufbau einer Knoten-Drag-and-Drop-Schnittstelle für benutzerdefinierte LLM-Anwendungen

Allgemeine Einführung FlowiseAI ist ein quelloffenes Low-Code-Tool, das Entwicklern helfen soll, benutzerdefinierte LLM-Anwendungen (Large Language Model) und KI-Agenten zu erstellen. Mit einer einfachen Drag-and-Drop-Schnittstelle können Benutzer schnell LLM-Anwendungen erstellen und iterieren, wodurch der Prozess vom Testen bis zur Produktion effizienter wird...
vor 7 Monaten
03.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenzzeit auf der Grundlage von Whisper

Allgemeine Einführung RealtimeSTT ist eine effiziente Echtzeit-Sprache-zu-Text-Bibliothek mit fortschrittlicher Sprachaktivitätserkennung und Wake-Word-Aktivierung mit geringer Latenz. Sie wurde von Kolja Beigel entwickelt, um Anwendungen zu unterstützen, die eine schnelle und genaue Sprache-zu-Text...
vor 7 Monaten
03K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: Schnelle Implementierung der semantischen Text-Deduplizierung zur Verbesserung der Effizienz der Datenbereinigung

Umfassende Einführung SemHash ist ein leichtgewichtiges und flexibles Werkzeug zum Entduplizieren von Datensätzen durch semantische Ähnlichkeit. Es kombiniert die schnelle Einbettungsgenerierung von Model2Vec mit der effizienten ANN (approximate nearest neighbour) Ähnlichkeitssuche von Vicinity.SemHa...
vor 7 Monaten
02.7K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: eine .NET-basierte Multi-Intelligenz-KI-Plattform zur Entwicklung und Verwaltung

Umfassende Einführung BotSharp ist ein Open-Source-Projekt auf der Grundlage von .NET Core, das ein umfassendes Tool zur Erstellung einer AI-Chatbot-Plattform bereitstellt. Es verwendet C#-Programmierung, unterstützt plattformübergreifenden Betrieb und zielt darauf ab, die Anwendung von Algorithmen des maschinellen Lernens zu vereinfachen, so dass Entwickler auf Unternehmensebene effizient...
vor 7 Monaten
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: ein intelligenter Körperrahmen für den Aufbau multimodaler intelligenter Geräte

Umfassende Einführung OmAgent ist ein multimodales intelligentes Körper-Framework, das vom Om AI Lab entwickelt wurde und darauf abzielt, leistungsstarke KI-gestützte Funktionen für intelligente Geräte bereitzustellen. Durch die Integration modernster multimodaler Basismodelle und intelligenter Körperalgorithmen ermöglicht das Projekt Entwicklern die Erstellung effizienter intelligenter Geräte für eine Vielzahl von...
vor 7 Monaten
02.6K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: Entwicklung humanisierter KI-Gedächtnismodule zur Speicherung und Aktualisierung von Informationen über Interaktionen mit Menschen

Allgemeine Einführung Memora ist ein Agent, der entwickelt wurde, um menschliche Erinnerungen für jede personalisierte KI zu replizieren. Er hilft KIs, sich an Details vergangener Interaktionen, Emotionen und gemeinsamer Erlebnisse zu erinnern, genau wie Menschen, durch Funktionen wie zeitgestempelte Erinnerungen, Emotionsmarker und multimodale Erinnerungen....
vor 7 Monaten
02.7K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Micro Agent: KI-Programmierintelligenz, die automatisch Code generiert und diesen testet und korrigiert.

Allgemeine Einführung Micro-Agent ist ein von Builder.io entwickelter Open-Source-KI-Codierassistent, der Entwicklern die Möglichkeit bieten soll, automatisch Code zu generieren und zu testen. Er generiert Testfälle durch das Verstehen von Beschreibungen in natürlicher Sprache und iteriert den Code, bis alle Tests erfolgreich...
vor 7 Monaten
03.1K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Intelligente Körper-Workflows in natürlicher Sprache für Desktop- und Browser-Automatisierung

Allgemeine Einführung Eko ist ein produktionsreifes JavaScript-Framework zur Erstellung effizienter intelligenter Agenten-Workflows durch Beschreibungen in natürlicher Sprache. Es wurde entwickelt, um Entwicklern die Möglichkeit zu geben, alltägliche Aufgaben mit Hilfe von KI-Technologien zu automatisieren, ohne...
vor 5 Monaten
02.7K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: ein intelligenter Assistent für soziale Medien, der automatisch Inhalte für soziale Medien erstellt und verwaltet

Allgemeine Einführung Social Media Agent (Social Media Agent) ist ein Open-Source-Projekt, das Interaktionsinformationen durch den neuen Agent Inbox verwaltet und Benutzern helfen soll, die Erstellung und Verwaltung von Social-Media-Inhalten zu automatisieren. Das Projekt wird von dem LangChain-Team entwickelt...
vor 7 Monaten
02.6K
Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程

KI-Assistent für Führungskräfte: KI-Assistent für Führungskräfte, Erinnerungen zum Lesen von E-Mails und zur Planung von Arbeitsplänen

Allgemeine Einführung Executive AI Assistant (EAIA) ist ein KI-basiertes Assistenz-Tool, das Benutzern helfen soll, ihre täglichen Aufgaben zu automatisieren und zu verwalten. Das von LangChain entwickelte Tool ist in der Lage, E-Mails zu bearbeiten, Termine zu planen, Aufgaben zu verwalten und andere...
vor 7 Monaten
02.8K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: ein automatisiertes Werkzeug zum Einfärben von Linien, um Anime-Schwarz-Weiß-Zeichnungen schnell einzufärben.

Umfassende Einführung MangaNinjia ist ein Open-Source-Projekt, das von Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab) entwickelt wurde und sich auf die automatische Verarbeitung von Strichzeichnungen konzentriert. Dieses Tool erreicht eine genaue Farbanpassung von Referenzbildern durch Deep-Learning-Techniken und verbessert so...
vor 7 Monaten
02.5K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Suche o1: Ermächtigung von Inferenzmodellen zur aktiven Suche, so dass große Modelle während des Denkens nach externem Wissen suchen können

Umfassende Einführung Search-o1 ist ein Open-Source-Projekt, das darauf abzielt, die Leistung von Large-Scale-Reasoning-Modellen (LRMs) durch die Integration fortgeschrittener Suchmechanismen zu verbessern. Die Kernidee besteht darin, das Problem des Wissensdefizits, das im Schlussfolgerungsprozess auftritt, durch dynamische Suche und Wissensintegration zu lösen. Das Projekt wird gesponsert von sunn...
vor 7 Monaten
02.4K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: Automatisch kurze YouTube-Videos und Twitter-Inhalte erstellen und veröffentlichen

Allgemeine Einführung MoneyPrinter V2 ist ein Open-Source-Projekt, das von FujiwaraChoki entwickelt wurde, um Benutzern zu helfen, durch Automatisierung online Geld zu verdienen. Das Projekt integriert hauptsächlich Twitter-Automatisierung, YouTube-Kurzvideo-Generierung und Affiliate-Camping...
vor 7 Monaten
03.4K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: Generierung von Browser-Automatisierungscode zur Umwandlung von Mausaktionen in Selenium-Python-Skripte über KI

Allgemeine Einführung AutoMouser ist eine Chrome-Erweiterung, die Benutzerinteraktionen intelligent verfolgt und automatisch Selenium-Testcode unter Verwendung der GPT-Modelle von OpenAI generiert. Dies geschieht durch die Aufzeichnung von Benutzer-Browser-Aktionen und deren Konvertierung...
vor 7 Monaten
02.8K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: Verwendung von RAG-Techniken zur Erstellung genauer SQL-Abfragen aus Text

Umfassende Einführung Vanna ist ein vom MIT lizenziertes Open-Source-Python-Framework, das sich auf die Generierung von SQL-Abfragen durch RAG-Techniken (Retrieval Augmented Generation) konzentriert. Benutzer können RAG-Modelle trainieren, sie auf ihre eigenen Daten anwenden und dann Fragen stellen, woraufhin Vanna die entsprechenden S...
vor 7 Monaten
02.6K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: Ein einheitlicher Rahmen für die Implementierung von Video-Gesichtsreparaturen, Reparatur von Schwarz-Weiß-Videos, verschwommenen Porträts und alten Videos

Umfassende Einführung SVFR (Stable Video Face Restoration) ist ein einheitliches Framework für die Restaurierung von Videogesichtern, das Basic Face Restoration (BFR), Farbgebung, Reparatur und deren Kombination unterstützt. Das Framework nutzt generative und kinematische Prioritäten durch die Vereinheitlichung...
vor 7 Monaten
03.5K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: quelloffenes, interaktives, digitales Echtzeit-Live-System, das einen synchronen Audio- und Videodialog ermöglicht

Umfassende Einführung LiveTalking ist ein Open-Source-Echtzeit-interaktive digitale menschliche System, ist verpflichtet, hochwertige digitale menschliche Live-Lösung zu bauen. Das Projekt verwendet das Apache 2.0 Open-Source-Protokoll, integriert mit einer Reihe von Spitzentechnologien, einschließlich ER-NeRF-Rendering, Echtzeit-Audio-und Video-Streaming-Verarbeitung ...
vor 7 Monaten
03.8K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: Open-Source-Programmierassistent, KI-Assistent zum Schreiben von Code und Bearbeiten von Dateien

Allgemeine Einführung Aider ist ein leistungsstarkes Open-Source-KI-Programmierassistententool, das Entwicklern beim Schreiben, Bearbeiten und Refactoring von Code durch Dialoge in natürlicher Sprache hilft. Als interaktives KI-Paar-Programmierwerkzeug unterstützt Aider viele wichtige Programmiersprachen und kann nahtlos in Git integriert werden...
vor 4 Monaten
03K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: Audiogesteuerte 3D-Tiefenerkennung für sprechende Porträtvideos

Umfassende Einführung JoyGen ist ein innovatives zweistufiges Videogenerierungssystem für sprechende Gesichter, das sich auf die Lösung des Problems der audiogesteuerten Gesichtsausdruckserzeugung konzentriert. Es wurde von einem Team von Jingdong Technology entwickelt und verwendet fortschrittliche 3D-Rekonstruktionstechniken und Methoden zur Extraktion von Audiomerkmalen, um die Identitätsmerkmale des Sprechers und den Gesichtsausdruck genau zu erfassen...
vor 7 Monaten
02.6K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: KI-Technologie zur verlustfreien Entfernung von Video-Wasserzeichen und Software zur Erstellung von Untertiteln (Client zur Entfernung von Video-Wasserzeichen 7G+)

Umfassende Einführung Video Subtitle Remover (Video-Subtitle-Remover, kurz VSR) ist eine auf KI-Technologie basierende Videoverarbeitungssoftware, die speziell für die Entfernung von harten Untertiteln und Textwasserzeichen aus Videos entwickelt wurde. Das Tool verwendet eine Vielzahl von KI-Algorithmusmodellen (STTN, L...
vor 7 Monaten
03.4K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Schnelles Herunterladen von WeChat Video No. Video, unterstützt mehrere Formate und Plattformen

Umfassende Einführung WeChat Video No. Downloader ist ein Open-Source-Projekt, das Benutzern helfen soll, schnell Videoinhalte von WeChat-Videonummern herunterzuladen. Das Tool unterstützt eine Vielzahl von Videoformaten und Plattformen, und Benutzer können es problemlos auf Windows- und macOS-Systemen verwenden. Das Projekt wird von ltaoo entwickelt und auf...
vor 7 Monaten
02.6K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: automatisierte interaktive Intelligenzen für soziale Medien, die automatisch suchen, liken und Kommentare hinterlassen

Allgemeine Einführung Riona-AI-Agent ist ein innovatives KI-gestütztes Automatisierungstool, das speziell für die Verwaltung und Optimierung des Betriebs der wichtigsten Social-Media-Plattformen entwickelt wurde. Das Projekt nutzt fortschrittliche KI-Modelle für Plattformen wie Instagram, Twitter und GitHub, um die...
vor 7 Monaten
08.1K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: Parsing komplexer Formatdokumente, Extraktion multimodaler Daten in Metadaten und Text

Umfassende Einführung NV Ingest (NVIDIA Ingest) ist eine Reihe von Microservices für den frühen Zugriff, die für das Parsen von Hunderttausenden von komplexen, unübersichtlichen unstrukturierten PDFs und anderen Unternehmensdokumenten entwickelt wurden. Sie kann diese Dokumente in Metadaten und Text umwandeln, um sie in Retrievalsysteme einzubetten...
vor 7 Monaten
02.9K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: ein Open-Source-Framework für den Einsatz von KI-Intelligenzen beim Browsen im Internet, das es KI ermöglicht, Webseiten automatisch zu bearbeiten

Allgemeine Einführung Browser Use Web UI ist ein innovatives Open-Source-Projekt, das sich auf die Bereitstellung von KI-Agenten mit Browser-Interaktionsfähigkeiten als grafisches Schnittstellenwerkzeug konzentriert. Das Projekt baut auf dem Kern-Framework von Browser Use auf, das mit Gradio ...
vor 2 Monaten
04.3K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA und LangChain starten: Ein fortgeschrittener Leitfaden zum Schreiben strukturierter Berichte für die Analytik, der die KI-gesteuerte Erstellung technischer Berichte ermöglicht

Allgemeine Einführung Dies ist ein von LangChain und NVIDIA gemeinsam entwickeltes Blueprint-Projekt zur strukturierten Berichterstellung, das in einem Jupyter-Notebook-Tutorial auf GitHub vorgestellt wird. Das Projekt nutzt fortschrittliche KI-Techniken, insbesondere Llama-3.3-7...
vor 4 Monaten
02.3K
BrownChat:开源实时语音聊天的AI助手

BrownChat: quelloffener Echtzeit-Sprachchat-KI-Assistent

Allgemeine Einführung BrownChat ist eine Echtzeit-Audio-Chat-Anwendung, die auf Large Language Modelling (LLM) Technologie basiert. Entwickelt von GitHub-Benutzer sugarforever, zielt das Projekt darauf ab, das Kommunikationserlebnis des Benutzers durch fortschrittliche Technologie zur Verarbeitung natürlicher Sprache zu verbessern...
vor 7 Monaten
02.3K