AI Open-Source-Projekt

Insgesamt 1020 Artikel
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: Die Gemini-Modell-API ist mit dem OpenAI-Format kompatibel, hebt regionale Beschränkungen auf und unterstützt die Abfrage von Multi-API-Schlüsseln.

Umfassende Einführung Gemini Balance ist ein OpenAI-API-Proxy-Dienst, der auf der Grundlage des FastAPI-Frameworks entwickelt wurde und darauf abzielt, effiziente Multi-API-Schlüsselverwaltung und Optimierungsfunktionen bereitzustellen. Das Projekt unterstützt Gemini-Modellaufrufe, und die Hauptfunktionen umfassen Multi-API...
vor 4 Monaten
02.9K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: Stummes Video mit lebendigem, synchronisiertem Sound versehen

Allgemeine Einführung FoleyCrafter ist ein Open-Source-Projekt, das von OpenMMLab entwickelt wurde, um lebendige und synchronisierte Soundeffekte für stumme Videos zu erzeugen. Das Projekt nutzt fortschrittliche Techniken der künstlichen Intelligenz, um semantisch relevante und zeitsynchrone Soundeffekte durch die Analyse von Videoinhalten zu erzeugen...
vor 8 Monaten
02.9K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: aus Text und Bildern SVG-Vektorgrafiken erzeugen Open-Source-Projekt

Allgemeine Einführung OmniSVG ist ein Open-Source-Projekt, das sich auf die Erzeugung hochwertiger Vektorgrafiken (SVG) durch ein multimodales Modell konzentriert. Es verwendet vortrainierte visuell-linguistische Modelle, um die Generierung von SVG aus textlichen Beschreibungen oder Bildeingaben zu unterstützen. Dabei wird ein breites Spektrum von Szenarien abgedeckt, von einfachen Icons bis hin zu komplexen Anime-Figuren. Artikel ...
vor 4 Monaten
02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: ein intelligenter Körper, der Computer über Sprache und Text steuert und Sprachfeedback in Echtzeit liefert

Allgemeine Einführung TankWork ist ein Open-Source-Desktop-Agent-Framework, das entwickelt wurde, um KI in die Lage zu versetzen, Ihren Computer durch Computer Vision und Interaktion auf Systemebene wahrzunehmen und zu steuern. Das Framework ermöglicht Agenten die direkte Steuerung von Computern durch Sprach- und Textbefehle, die Verarbeitung von Bildschirminhalten in Echtzeit und die Bereitstellung kontinuierlicher audiovisueller...
vor 7 Monaten
02.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

light card: HTML5 Kartengenerator, erstellen Sie schöne Inhaltskarten mit einfachen Mitteln

Allgemeine Beschreibung lightcard ist ein einfaches und elegantes Tool zur Erstellung von Karten, mit dem Benutzer leicht schöne Inhaltskarten erstellen können. Das Tool unterstützt benutzerdefinierte Textinhalte, mehrere Themenstile und QR-Codes, um die Erstellung einfacher und unterhaltsamer zu gestalten. Benutzer können den Titel, den Textkörper und den Autor bearbeiten...
vor 8 Monaten
02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: Intelligenter Programmierassistent, der in einem Kommandozeilen-Terminal läuft, eine lokalisierte Alternative zum ChatGPT-Code-Interpreter

Umfassende Einführung GPTMe ist ein revolutionäres Terminal-KI-Assistententool, das die Arbeitseffizienz von Entwicklern verbessern soll. Es kombiniert leistungsstarke KI-Fähigkeiten perfekt mit der Terminalumgebung und unterstützt verschiedene Funktionen wie Codeausführung, Dateibearbeitung, Webbrowsing und visuelle Erkennung. Als ChatGPT-Code-Löser...
vor 8 Monaten
02.9K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: quelloffenes, unbegrenztes Canvas-Whiteboard-SDK, KI zur Erstellung minimalistischer Wireframes und UML-Diagramme

Allgemeine Beschreibung tldraw ist ein kostenloses und sofortiges kollaboratives Zeichentool, das eine unbegrenzte Leinwand bietet, auf der Benutzer schnell Grafiken zeichnen, Text schreiben und sofort zusammenarbeiten können. Mit seiner intuitiven Benutzeroberfläche und ausgezeichneten Leistung eignet es sich für die Zusammenarbeit im Team und die Arbeit aus der Ferne. Unterstützt durch die Open-Source-Gemeinschaft, tldr...
vor 9 Monaten
02.8K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: ein leichtgewichtiges und flexibles Framework für intelligente Körper, mit einfacher Konfiguration von Rollen und Werkzeugen zur Bewältigung einer Vielzahl von Aufgaben

Allgemeine Einführung Bambo ist ein neuartiges Proxy-Framework, das leichter und flexibler als die gängigen Frameworks ist und eine Vielzahl von Lastaufgaben bewältigen kann. Bambo erreicht eine effiziente Proxy-Funktionalität, indem es alle Werkzeuge im Werkzeugkatalog definiert und asynchrone benutzerdefinierte Funktionen verwendet. Benutzer können die llm_c...
vor 8 Monaten
02.8K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: ein End-to-End-Audiomodell, das Sprachinteraktion in Echtzeit unterstützt

Umfassende Einführung Baichuan-Audio ist ein von Baichuan Intelligence (baichuan-inc) entwickeltes Open-Source-Projekt, das auf GitHub gehostet wird und sich auf End-to-End-Sprachinteraktionstechnologie konzentriert. Das Projekt bietet ein komplettes Audioverarbeitungs-Framework, das die Sprachverarbeitung ...
vor 5 Monaten
02.8K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: Schnelle Implementierung der semantischen Text-Deduplizierung zur Verbesserung der Effizienz der Datenbereinigung

Umfassende Einführung SemHash ist ein leichtgewichtiges und flexibles Werkzeug zum Entduplizieren von Datensätzen durch semantische Ähnlichkeit. Es kombiniert die schnelle Einbettungsgenerierung von Model2Vec mit der effizienten ANN (approximate nearest neighbour) Ähnlichkeitssuche von Vicinity.SemHa...
vor 7 Monaten
02.8K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: Extrahiert beliebige unstrukturierte Daten aus Dokumenten/Multimedia und parst sie in strukturierte Daten

Allgemeine Einführung OmniParse ist eine leistungsstarke Datenparsing- und Optimierungsplattform zur Umwandlung unstrukturierter Daten in strukturierte, verwertbare Daten, die für das GenAI-Framework (Generative Artificial Intelligence) optimiert wurden. Ob Sie nun mit Dokumenten, Tabellen, Bildern, Videos, Audiodateien oder...
vor 9 Monaten
02.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: Bereitstellung einer effizienten KI-Gateway-Lösung zur Vereinfachung der Microservice-Verwaltung und Verbesserung der Sicherheit

Umfassende Einführung Higress ist ein von Alibaba entwickeltes Cloud-natives API-Gateway, das auf Istio und Envoy aufbaut und für eine effiziente Verkehrsplanung, Service Governance und Sicherheitslösungen konzipiert ist. Es unterstützt Wasm-Plugin-Erweiterungen für mehrere Programmiersprachen für KI-Business...
vor 9 Monaten
02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-Preview: ein durchgängiges anthropomorphes Sprachdialog-Makromodell für Echtzeit-Interaktion

SpeechGPT 2.0-Preview ist das erste anthropomorphe Echtzeit-Interaktionssystem von OpenMOSS, das auf der Grundlage von Millionen von Stunden an Sprachdaten trainiert wurde. Das System ist mit einem anthropomorphen Sprachausdruck und einer niedrigen Latenzzeit von 100 ms ausgestattet, was eine natürliche und...
vor 6 Monaten
02.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: ein Open-Source-Tool zur Verbesserung der Qualität der Bild- und Videoerzeugung

Umfassende Einführung CFG-Zero-star ist ein Open-Source-Projekt, das von Weichen Fan und dem S-Lab-Team an der Nanyang Technological University entwickelt wurde. Es konzentriert sich auf die Verbesserung der Classifier Free Guidance (CFG)-Technik in Stream-Matching-Modellen durch Optimierung der Guidance-Strategie und der Null-Initialisierung ...
vor 5 Monaten
02.8K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: ein experimentelles Projekt zur Demonstration der Fähigkeiten von Llama 3.3 70B zur Erzeugung von HTML-Code unter Verwendung der Groq-API

Allgemeine Einführung Groq AppGen ist ein innovativer interaktiver Webanwendungsgenerator, der von Groq entwickelt wurde und als Open Source zur Verfügung steht. Das Projekt demonstriert die Leistungsfähigkeit des Llama 3.3 70B-Modells für die Generierung von HTML-Code. Durch die Integration von Groq...
vor 7 Monaten
02.8K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: Generierung erkundbarer 360°-3D-Welten aus einem einzigen Bild (der Code wird nach und nach freigegeben)

Allgemeine Einführung GenEx ist ein fortschrittliches KI-Modell, das in der Lage ist, eine vollständig erkundbare 360°-3D-Welt aus einem einzigen Bild zu generieren. Benutzer können diese generierte Welt interaktiv erforschen. GenEx erweitert die Grenzen der figurativen KI im Bereich der Vorstellungskraft und hat das Potenzial,...
vor 8 Monaten
02.8K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: Windows Native AI Model Development Toolset, End-Side Model Integration in Windows Anwendungen

Allgemeine Einführung AI Dev Gallery ist eine Anwendung für KI-Entwicklungstools von Microsoft (derzeit in der öffentlichen Vorschau), die für Windows-Entwickler konzipiert ist. Sie bietet eine umfassende Plattform, die Entwicklern hilft, KI-Funktionen einfach in ihre Windo...
vor 7 Monaten
02.8K
Pyramid Flow:快手推出的开源版

Pyramid Flow: eine von Racer eingeführte Open-Source-Version von "Kringle", die auf SD3 basiert und auf Grafikprozessoren mit weniger als 8 GB läuft (Version mit Ein-Klick-Bereitstellung)

Umfassende Einführung Pyramid Flow ist eine effiziente autoregressive Methode zur Videogenerierung, die auf der Flow-Matching-Technik basiert. Die Methode erreicht eine höhere Recheneffizienz bei der Erzeugung und Dekomprimierung von Videoinhalten durch Interpolation zwischen verschiedenen Auflösungen und Rauschpegeln...
vor 9 Monaten
02.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: Ein Open-Source-Tool für den einfachen Einsatz von multimodalen KI-Modellen

Allgemeine Einführung Aana SDK ist ein von Mobius Labs entwickeltes Open-Source-Framework, benannt nach dem Malayalam-Wort ആന (Elefant). Es hilft Entwicklern, multimodale KI-Modelle schnell einzusetzen und zu verwalten und unterstützt die Verarbeitung von Text, Bildern, Audio und Video sowie anderen Daten...
vor 5 Monaten
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: ein intelligenter Körperrahmen für den Aufbau multimodaler intelligenter Geräte

Umfassende Einführung OmAgent ist ein multimodales intelligentes Körper-Framework, das vom Om AI Lab entwickelt wurde und darauf abzielt, leistungsstarke KI-gestützte Funktionen für intelligente Geräte bereitzustellen. Durch die Integration modernster multimodaler Basismodelle und intelligenter Körperalgorithmen ermöglicht das Projekt Entwicklern die Erstellung effizienter intelligenter Geräte für eine Vielzahl von...
vor 7 Monaten
02.8K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: Eine Datenanalyse-Dialogplattform für Datenabfragen und Diagrammerstellung in natürlicher Sprache

Allgemeine Einführung PandasAI ist eine auf Python basierende Open-Source-Plattform, die den Prozess der Datenanalyse durch Techniken der natürlichen Sprachverarbeitung vereinfachen soll. Sie ermöglicht es den Benutzern, im Dialog mit Datenbanken zu arbeiten (z.B. SQL, CSV, Pandas, Polars, Mongodb, N...
vor 9 Monaten
02.8K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: Erzeugen Sie kontinuierliche und konsistente grafische Illustrationen auf der Grundlage einer langen Geschichte.

Allgemeine Einführung Story-Adapter ist ein innovatives Framework zur Visualisierung von Geschichten, das Textgeschichten in kohärente Bildsequenzen umwandelt. Das von Forschern entwickelte Projekt verwendet einen iterativen Ansatz, der kein Training erfordert, um qualitativ hochwertige Story-Illustrationen zu erzeugen. Das Framework zeichnet sich durch seine Fähigkeit aus, lange...
vor 7 Monaten
02.8K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: KI-Datenanalyse- und Visualisierungs-Client für die schnelle Erstellung von Diagrammen und Berichten

Allgemeine Einführung DataLine ist ein leistungsfähiges KI-Werkzeug zur Datenanalyse und -visualisierung, mit dem Benutzer durch einfache Operationen mit einer Vielzahl von Datenquellen interagieren können. Ob es sich um eine CSV-Datei oder eine gängige Datenbank wie Postgres, MySQL, Snowflake, SQL...
vor 6 Monaten
02.8K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: Erzeugen Sie Videokopien und kurze HD-Videos mit einem Klick durch Eingabe eines Videothemas

Umfassende Einführung MoneyPrinterTurbo ist ein Open-Source-Projekt, das fortschrittliche AI Big Model-Technologie verwendet, um die Funktion der Erzeugung von kurzen HD-Videos mit einem Klick zu erreichen. Benutzer müssen nur ein Videothema oder Schlüsselwörter angeben, das System wird automatisch Videokopien, Videoclips, Videountertitel und...
vor 5 Monaten
02.8K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: Hochentwickeltes Open-Source-Tool zum Einbetten und Extrahieren von versteckten Wasserzeichen zum Schutz von Videocopyrights

Allgemeine Einführung VideoSeal ist ein von Facebook Research entwickeltes Open-Source-Tool für das Einbetten und Extrahieren von Wasserzeichen in Videos, das eine effiziente Einbettung und Extraktion von Wasserzeichen ermöglicht. Das Tool unterstützt die neuesten Open-Source-Modelle und enthält vortrainierte Modelle, Trainingscode, Inferenzcode und Auswertungstools...
vor 8 Monaten
02.8K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Ermöglicht Benutzern die Abfrage von SQLite-Datenbanken und CSV/JSON-Dateien für Abfragedaten

Allgemeine Einführung SQLite-Utils-Ask ist ein leistungsfähiges Tool, das Benutzern helfen soll, Frage-und-Antwort-Datenabfragen auf SQLite-Datenbanken und CSV/JSON-Dateien mit Hilfe von LLM (Large Language Model) durchzuführen. Das Tool ist in der Lage, automatisch Benutzerfragen zu generieren, die auf...
vor 9 Monaten
02.8K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: ein KI-gesteuertes Tool zur Datenvisualisierung

Allgemeine Einführung Data Formulator ist ein von Microsoft Research entwickeltes Open-Source-Tool zur KI-gesteuerten Datenvisualisierung. Das Tool kombiniert eine grafische Benutzeroberfläche (GUI) und natürlichsprachliche Eingaben (NL), um Benutzern die schnelle Erstellung und Iteration durch einfache Interaktionen und Befehle zu ermöglichen...
vor 6 Monaten
02.8K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: ein intelligenter Assistent für soziale Medien, der automatisch Inhalte für soziale Medien erstellt und verwaltet

Allgemeine Einführung Social Media Agent (Social Media Agent) ist ein Open-Source-Projekt, das Interaktionsinformationen durch den neuen Agent Inbox verwaltet und Benutzern helfen soll, die Erstellung und Verwaltung von Social-Media-Inhalten zu automatisieren. Das Projekt wird von dem LangChain-Team entwickelt...
vor 7 Monaten
02.8K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: Audiogesteuerte 3D-Tiefenerkennung für sprechende Porträtvideos

Umfassende Einführung JoyGen ist ein innovatives zweistufiges Videogenerierungssystem für sprechende Gesichter, das sich auf die Lösung des Problems der audiogesteuerten Gesichtsausdruckserzeugung konzentriert. Es wurde von einem Team von Jingdong Technology entwickelt und verwendet fortschrittliche 3D-Rekonstruktionstechniken und Methoden zur Extraktion von Audiomerkmalen, um die Identitätsmerkmale des Sprechers und den Gesichtsausdruck genau zu erfassen...
vor 7 Monaten
02.8K
Vision Parse: Intelligente Konvertierung von PDF-Dokumenten in das Markdown-Format mithilfe visueller Sprachmodelle

Vision Parse: Intelligente Konvertierung von PDF-Dokumenten in das Markdown-Format mithilfe visueller Sprachmodelle

Umfassende Einführung Vision Parse ist ein revolutionäres Werkzeug zur Dokumentenverarbeitung. Es kombiniert geschickt die fortschrittlichste Technologie für visuelle Sprachmodelle (Vision Language Models) mit der Fähigkeit, PDF-Dokumente auf intelligente Weise in das hochwertige Markdown-Format umzuwandeln...
vor 8 Monaten
02.8K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Schnelles Herunterladen von WeChat Video No. Video, unterstützt mehrere Formate und Plattformen

Umfassende Einführung WeChat Video No. Downloader ist ein Open-Source-Projekt, das Benutzern helfen soll, schnell Videoinhalte von WeChat-Videonummern herunterzuladen. Das Tool unterstützt eine Vielzahl von Videoformaten und Plattformen, und Benutzer können es problemlos auf Windows- und macOS-Systemen verwenden. Das Projekt wird von ltaoo entwickelt und auf...
vor 7 Monaten
02.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: GraphRAG-basierte konversationelle Wissensbasis/Tiefensuche mit Dialogen, die in andere Websites integriert werden können

Allgemeine Einführung AutoFlow ist ein Open-Source-Tool, das von PingCAP entwickelt wurde, um graphenbasierte Wissensdatenbanken mit TiDB Serverless Vector Storage aufzubauen. Es integriert LlamaIndex und DSPy-Frameworks zur Unterstützung komplexer Dialogsuche und Wissensgraphen...
vor 7 Monaten
02.8K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: Aufbau eines Entwicklungsrahmens für KI-native Datenanwendungen, der Multi-Modell-Management und intelligente Datenverarbeitung integriert

Umfassende Einführung DB-GPT ist ein Open-Source-Framework zur Entwicklung nativer KI-Datenanwendungen, das auf AWEL (Agentic Workflow Expression Language) und Smart-Body-Technologien basiert. Das Projekt zielt darauf ab, eine Infrastruktur im Bereich großer Modelle aufzubauen...
vor 5 Monaten
02.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: Wisdom Spectrums quelloffenes Kaskaden-Diffusions-Textgenerierungs-Bildmodell

Umfassende Einführung CogView3 ist ein fortschrittliches, textgeneriertes Bildsystem, das von der Tsinghua Universität und dem Think Tank Team (Chi Spectrum Qingyan) entwickelt wurde. Es basiert auf einem kaskadierenden Diffusionsmodell und erzeugt hochauflösende Bilder in mehreren Stufen. Zu den Hauptmerkmalen von CogView3 gehören die mehrstufige Generierung, die innovative Architektur und die effiziente Leistung...
vor 10 Monaten
02.8K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: Multi-Intelligenz-Simulation von Social-Media-Interaktionen von Millionen von Nutzern zur Untersuchung komplexer sozialer Phänomene

Allgemeine Einführung OASIS (Open Agent Social Interaction Simulations) ist ein Open-Source-Simulator für soziale Medien, der das Verhalten von bis zu einer Million Nutzer simulieren kann. Die Plattform kombiniert ein umfangreiches Sprachmodell mit einem regelbasierten...
vor 5 Monaten
02.8K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: Generierung sprecherspezifischer Text-to-Speech-Modelle aus Eingabetext

Allgemeine Einführung Parler-TTS ist eine Open-Source-Text-to-Speech (TTS)-Modellbibliothek, die von Hugging Face entwickelt wurde, um hochwertige, natürlich klingende Sprache zu erzeugen. Das Modell ist in der Lage, Sprache auf der Grundlage von Eingabetext mit einem bestimmten Sprecherstil (z.B. Geschlecht, Tonhöhe, Sprechstil...
vor 6 Monaten
02.8K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Still Portrait Reference Video Pose Generation Video um Missys Fotos tanzen zu lassen

Allgemeine Einführung X-Dyna ist ein Open-Source-Projekt, das von ByteDance entwickelt wurde, um dynamische Porträtanimationen mithilfe von Zero-Sample-Diffusion-Techniken zu erzeugen. Das Projekt nutzt Gesichtsausdrücke und Körperbewegungen in Laufwerksvideos, um einzelne Porträtbilder zu animieren und so realistische und kontextbezogene Bewegungseffekte zu erzeugen.X-Dyna...
vor 7 Monaten
02.8K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: KI-gestützte Verwaltung des Tagesbudgets für die einfache Verfolgung des Tagesbudgets

Allgemeine Beschreibung Porkybank ist eine Open-Source-Anwendung zur Verwaltung der persönlichen Finanzen, die den Nutzern helfen soll, ihr tägliches Budget leicht zu verfolgen. Mit einer einfachen Formel (Einnahmen - Ausgaben) / Tage = Bargeld, können Benutzer ihre finanzielle Situation visualisieren. Das Projekt wird auf GitHu gehostet...
vor 7 Monaten
02.8K
GaiaNet node:安装和运行自己的本地模型在线代理服务

GaiaNet-Knoten: Installieren und betreiben Sie Ihren eigenen lokalen Modell-Online-Proxy-Dienst

Allgemeine Einführung GaiaNet-AI/gaianet-node ist ein Open-Source-Projekt, das es Nutzern ermöglicht, den Standard-Node-Software-Stack auf Mac, Linux oder Windows WSL mit einem einzigen Befehl schnell zu installieren. Benutzer können Knoten initialisieren, Konfigurationen anpassen,...
vor 11 Monaten
02.8K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Agent Laboratory: automatisierter Code- und Studienschreibassistent für Forscher

Umfassende Einführung Agent Laboratory ist ein autonomer End-to-End-Forschungsworkflow, der Forschern helfen soll, ihre Forschungsideen zu verwirklichen. Das System besteht aus dedizierten Agenten, die von umfangreichen Sprachmodellen gesteuert werden und den gesamten Forschungsablauf unterstützen - von der Literaturrecherche über die Entwicklung von Plänen bis hin zur Ausführung von...
vor 4 Monaten
02.8K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren

Allgemeine Einführung Open NotebookLM ist ein Open-Source-Projekt, das entwickelt wurde, um jedes PDF-Dokument in einen Podcast zu konvertieren. Das Tool verwendet quelloffene Large Language Model (LLM)- und Text-to-Speech (TTS)-Modelle zur Verarbeitung von PDF-Inhalten, um natürliche Dialoge zu erzeugen, die für Audio-Podcasts geeignet sind...
vor 6 Monaten
02.8K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Behebt ungültige JSON-Zeichenfolgen und behebt mögliche Formatierungsfehler in von LLMs generierten JSON-Daten.

Allgemeine Beschreibung Ein Modul zum Reparieren ungültiger JSON-Dateien, insbesondere zum Parsen falscher JSON-Daten, die von Large Language Models (LLMs) ausgegeben werden. Das Modul behebt häufige JSON-Syntaxfehler wie fehlende Anführungszeichen, falsche Kommas, nicht abgeschnittene Zeichen und unvollständige Schlüssel-Wert...
vor 10 Monaten
02.8K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: ein Echtzeit-Sprachdialog-Framework mit Unterstützung für mehrere Sprachen und Akzente für Sprachdialog-Basismodelle

Allgemeine Einführung Moshi Chat ist ein durchgängiger Echtzeit-KI-Sprachassistent von Kyutai, einem französischen Non-Profit-KI-Labor. Er hört nicht nur in Echtzeit zu, sondern nimmt auch an natürlichen Gesprächen teil und unterstützt multimodale Interaktionen, einschließlich der Fähigkeit zu sehen, zu hören und zu sprechen.
vor 11 Monaten
02.8K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: Ein auf heterogenen Graphen basierendes Werkzeug für die genaue Informationsbeschaffung und -generierung

Eine umfassende Einführung NodeRAG ist ein quelloffenes Retrieval Augmented Generation (RAG) System, das auf GitHub gehostet und von Terry-Xu-666 entwickelt wird. Es optimiert das Retrieval und die Generierung von Informationen durch heterogene Graphenstrukturen, wodurch die Retrievalgenauigkeit und die kontextuelle Relevanz deutlich verbessert werden....
vor 4 Monaten
02.8K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ein KI-Assistent zur Unterstützung der mehrsprachigen Tiefenforschung

Umfassende Einführung Deep Research Web UI ist ein auf KI-Technologie basierendes Open-Source-Recherche-Assistenz-Tool, das Benutzern hilft, tiefgehende iterative Recherchen zu beliebigen Themen durchzuführen. Es kombiniert die Leistung von Suchmaschinen, Web-Crawling und groß angelegter Sprachmodellierung in einer intuitiven Weboberfläche...
vor 4 Monaten
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot Backend Proxy Service: Übernahme des GitHub Copilot Plugin Servers mit anderen Modellen

Allgemeine Einführung Der Copilot Backend Agent Service ist ein Open-Source-Projekt zur Verwaltung des GitHub Copilot-Plugin-Servers, das andere FIM-Modelle wie DeepSeek nutzt und gleichzeitig mehrere Personen unterstützt, die sich offizielle Konten teilen. Der Dienst unterstützt eine Vielzahl von IDEs, einschließlich V...
vor 8 Monaten
02.8K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro: Erstellen Sie detaillierte Berichte zu jedem beliebigen Thema, z. B. Geschäftsanalysen, Jahresendberichte usw.

Allgemeine Beschreibung Report mAIstro ist ein leistungsfähiges Tool, mit dem Benutzer auf einfache Weise benutzerdefinierte Berichte mithilfe der Technologie zur Verarbeitung natürlicher Sprache erstellen können. Das Tool nutzt die LangChain-Technologie, um vom Benutzer eingegebene Themen und Strukturen in detaillierte Berichte umzuwandeln,...
vor 4 Monaten
02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: Open-Source-KI-Suchmaschinen-Framework zum Einsatz Ihrer eigenen Perplexity-Suchmaschine!

Umfassende Einführung MindSearch ist ein Open-Source-KI-Suchmaschinen-Framework, das vom Shanghai Artificial Intelligence Laboratory (SAL) ins Leben gerufen wurde und darauf abzielt, den menschlichen Denkprozess für komplexe Informationsbeschaffung und -integration zu simulieren. Das Tool kombiniert die fortschrittlichen Technologien von Large-Scale Language Modelling (LLM) und Suchmaschinen durch Multi-Intelligenz...
vor 8 Monaten
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: Ein Open-Source-Tool für die effiziente Extraktion und Erkundung von strukturierten Daten

Umfassende Einführung Knowledge Table (Knowledge Table) ist ein Open-Source-Projekt, das den Prozess der Extraktion und Erforschung strukturierter Daten aus unstrukturierten Dokumenten vereinfachen soll. Benutzer können strukturierte Wissensrepräsentationen wie Tabellen und Graphen über eine natürlichsprachliche Abfrageoberfläche erstellen. Das Tool unterstützt die Anpassung der Extraktion ...
vor 10 Monaten
02.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: ein KI-Dialog-Client, der MCP-Intelligenz zur Durchführung komplexer Aufgaben nutzt

Allgemeine Einführung HyperChat ist ein Open-Source-Chat-Client, der von BigSweetPotatoStudio entwickelt und auf GitHub gehostet wird. Er wurde entwickelt, um einen umfassenden Überblick über das BigSweetPotatoStudio-Sprachmodell zu geben, indem APIs von mehreren großen Sprachmodellen (LLMs) wie OpenAI, Cla...
vor 5 Monaten
02.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: Aufbau von lokal laufenden Wissensgraphen und persönlichen Suchmaschinen

Allgemeine Einführung Unigraph ist ein lokaler, universeller Wissensgraph und eine persönliche Suchmaschine, die Benutzern einen integrierten Arbeitsbereich zur Verfügung stellt, um eine Vielzahl von Daten in ihrem persönlichen Leben zu verwalten und zu suchen. Mit Unigraph können Benutzer Daten aus verschiedenen Quellen in einen...
vor 7 Monaten
02.8K
Vector Vein(向量脉络):无代码AI工作流构建平台

Vector Vein: Code-freie KI-Plattform zur Erstellung von Workflows

Umfassende Einführung Vector Vein ist eine Code-freie Plattform zur Erstellung von KI-Workflows, mit der Benutzer leicht intelligente, automatisierte Workflows erstellen können. Da keine Programmierkenntnisse erforderlich sind, können Benutzer einfach verschiedene Funktionsmodule per Drag-and-Drop miteinander verbinden, um komplexe KI-Workflows zu...
vor 8 Monaten
02.8K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Aufbau von LLM-Mini-Intelligenzen mit "gerichteter Graphenstruktur" in 100 Codezeilen

Allgemeine Einführung miniLLMFlow ist ein minimalistisches Large Language Model (LLM)-Entwicklungsframework, das nur 100 Zeilen Kerncode enthält und die Designphilosophie "Keep it simple" demonstriert. Das Framework wurde speziell entwickelt, um KI-Assistenten (z.B. ChatGPT, Claude, etc.) zu ermöglichen,...
vor 7 Monaten
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Serverlose Bereitstellung einer multimodalen Gemini-Dialogseite

Allgemeine Einführung Gemini Playground ist ein Open-Source-Projekt entwickelt, um Benutzern zu helfen, schnell einen multimodalen Dialog Website bereitstellen. Das Projekt wird durch technische Crawling Garnelen entwickelt, unterstützen die Verwendung von Gemini API Key in 10 Sekunden, um den Einsatz zu vervollständigen. Ob der Benutzer ist ...
vor 6 Monaten
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: Extrahieren und Kategorisieren von Dokumenten in strukturierte Daten, um den Prozess der Dokumentenbearbeitung zu optimieren

Umfassende Einführung ExtractThinker ist ein flexibles Dokument-Intelligenz-Tool, das strukturierte Daten aus Dokumenten mit Hilfe von Large Language Models (LLMs) extrahiert und klassifiziert und einen nahtlosen ORM-ähnlichen Dokumentenverarbeitungs-Workflow bietet. Es unterstützt eine Vielzahl von Dokumentenladern, einschließlich Tess...
vor 7 Monaten
02.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: ein Modell zur direkten Generierung von Rap-Vocals aus Texten und Backing Tracks (derzeit offener Datensatz)

Allgemeine Einführung RapBank ist ein Datensatz und ein Toolset für die Erstellung von Rap-Texten. Das Projekt wurde von NZqian ins Leben gerufen, um Forschern und Entwicklern qualitativ hochwertige Rap-Lyrik-Daten zur Verfügung zu stellen, indem Rap-Songs von YouTube gesammelt und verarbeitet werden...
vor 8 Monaten
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: Eine visuelle Open-Source-Programmierumgebung zum Testen und Evaluieren der Effektivität großer Sprachmodell-Hinweise

Allgemeine Einführung ChainForge ist eine visuelle Open-Source-Programmierumgebung, die für das Testen und Bewerten der Effektivität von Cues für große Sprachmodelle (LLM) entwickelt wurde. Es bietet eine Datenfluss-Cueing-Engineering-Umgebung, durch die Benutzer schnell die Qualität verschiedener Cues auf LLM-Antworten untersuchen und analysieren können...
vor 8 Monaten
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: Auf visueller Einbettung basierender Dokumentenspeicher- und Retrievaldienst

Allgemeine Einführung ColiVara ist ein Dokumentenspeicher- und -abrufdienst, der auf der Technologie der visuellen Einbettung basiert. Es macht eine optische Zeichenerkennung (OCR) oder Textextraktion überflüssig und vermeidet das Problem zerbrochener Formulare oder verlorener Bilder. ColiVara unterstützt mehr als 100 Dateiformate, einschließlich PDF...
vor 6 Monaten
02.7K
Atomic Agents:构建轻量级模块化AI智能体框架

Atomare Agenten: ein Rahmen für den Aufbau leichter, modularer KI-Intelligenzen

Allgemeine Einführung Atomic Agents ist ein extrem leichtgewichtiges und modulares Framework, das auf dem Konzept der Atomizität basiert, um Agenten-KI-Pipelines und -Anwendungen zu erstellen. Das Framework bietet eine Reihe von Tools und Agenten, die kombiniert werden können, um leistungsstarke Anwendungen zu erstellen. Es basiert auf Instruc...
vor 8 Monaten
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum hat ein leistungsfähiges Modell für die Erstellung ultralanger Texte auf den Markt gebracht, das die Erstellung von mehr als 10.000 Wörtern in einem einzigen Gespräch ermöglicht.

Umfassende Einführung LongWriter ist ein leistungsfähiges Tool zur Erzeugung langer Texte, das von der Tsinghua University Data Mining Research Group (THUDM) entwickelt wurde. Das Tool basiert auf dem fortschrittlichen Long Context Language Model (LLM) und ist in der Lage, lange Texte mit mehr als 10.000 Wörtern zu generieren.LongWriter...
vor 8 Monaten
02.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: ein KI-Tool zur Analyse der Beziehungen zwischen Buchcharakteren und zur Erstellung von Diagrammen

Allgemeine Einführung Austen ist ein Open-Source-KI-Tool, das das Angular-Framework und die Analogjs-Initialisierung in Kombination mit der Mermaidjs-Technologie verwendet, um Diagramme zu erstellen, die den Benutzern bei der Analyse der Beziehungen zwischen Charakteren in Büchern helfen. Benutzer können Open...
vor 4 Monaten
02.7K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: Extrahieren von Daten aus einer HTML-URL, Ausgabe von einfachem Text/Markdown

Allgemeine Einführung magic-html ist eine Python-Bibliothek, die den Prozess der Extraktion von Inhalten aus HTML vereinfachen soll. Egal, ob es sich um komplexe HTML-Strukturen oder einfache Webseiten handelt, diese Bibliothek zielt darauf ab, dem Benutzer eine bequeme und effiziente Schnittstelle zu bieten. Sie unterstützt die multimodale Extraktion...
vor 11 Monaten
02.7K