AI Open-Source-Projekt

Insgesamt 1020 Artikel
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: Open-Source-Workflow-Builder für KI-Agenten

Umfassende Einführung Sim Studio ist eine Open-Source-Plattform für die Erstellung von KI-Agenten-Workflows, die den Nutzern hilft, große Sprachmodell-Workflows (LLM) über eine leichtgewichtige, intuitive visuelle Schnittstelle schnell zu entwerfen, zu testen und einzusetzen. Benutzer können komplexe Workflows ohne tiefgreifende Programmierung durch Ziehen und Ablegen von...
vor 3 Monaten
01.2K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: Ein Open-Source-Tool für die Bearbeitung von Bildern mit Anweisungen in natürlicher Sprache

Allgemeine Einführung Step1X-Edit ist ein Open-Source-Framework zur Bildbearbeitung, das vom Stepfun AI-Team entwickelt wurde und auf GitHub gehostet wird. Es kombiniert ein multimodales großes Sprachmodell (Qwen-VL) und einen Diffusionstransformator (DiT), um es den Benutzern zu ermöglichen, Bilder durch ein einfaches und natu...
vor 3 Monaten
0918
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: natürlich gesprochener Dialog mit niedriger Latenz und KI

Allgemeine Einführung RealtimeVoiceChat ist ein Open-Source-Projekt, das sich auf natürliche Unterhaltungen in Echtzeit mit künstlicher Intelligenz über Sprache konzentriert. Benutzer verwenden ein Mikrofon, um ihre Stimme einzugeben, und das System nimmt das Audio über einen Browser auf, wandelt es schnell in Text um, und ein großes Sprachmodell (LLM) erzeugt...
vor 3 Monaten
0798
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: ein kleines Open-Source-Modell für effiziente mathematische Schlussfolgerungen und Codegenerierung

Allgemeine Einführung MiMo ist ein von Xiaomi entwickeltes Open-Source-Projekt zur Modellierung großer Sprachen mit Schwerpunkt auf mathematischer Argumentation und Codegenerierung. Das Kernprodukt ist die MiMo-7B-Modellfamilie, die ein Basismodell (Base), ein überwachtes Feinabstimmungsmodell (SFT), ein starkes chemisches Modell, das auf der Grundlage des Basismodells trainiert wurde,...
vor 3 Monaten
01.1K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: MCP-Dienste zur Steuerung von CAD-Software durch natürlichsprachliche Befehle

Allgemeine Einführung CAD-MCP ist ein Open-Source-Projekt, das es Benutzern ermöglicht, CAD-Software durch natürlichsprachliche Befehle für Zeichenoperationen zu steuern. Es kombiniert die Verarbeitung natürlicher Sprache mit der CAD-Automatisierungstechnologie, so dass die Benutzer die CAD-Schnittstelle nicht manuell bedienen müssen, sondern nur einfache Textbefehle eingeben, die ...
vor 3 Monaten
01.2K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer Daten

Umfassende Einführung GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde und auf GitHub gehostet wird. Es konzentriert sich auf die Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs), indem es die Erzeugung synthetischer Daten durch Wissensgraphen anleitet. Es wurde entwickelt aus ...
vor 3 Monaten
0884
Abogen:将多种文本格式转换为有声读物的工具

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

Allgemeine Einführung Abogen ist ein Open-Source-Tool zur schnellen Konvertierung von ePub-, PDF- oder reinen Textdateien in qualitativ hochwertiges Audio. Es verwendet das Kokoro-82M-Modell, um natürliche und flüssige Sprache zu erzeugen, und unterstützt die gleichzeitige Erzeugung von Untertiteln, was für die Produktion von Hörbüchern geeignet ist...
vor 3 Monaten
0947
Local Deep Research:本地运行的生成深度研究报告工具

Local Deep Research: ein lokal betriebenes Tool zur Erstellung detaillierter Forschungsberichte

Allgemeine Einführung Local Deep Research ist ein quelloffener KI-Forschungsassistent, der Benutzern helfen soll, tiefgreifende Forschungen durchzuführen und detaillierte Berichte für komplexe Probleme zu erstellen. Er unterstützt die lokale Ausführung, so dass die Nutzer Forschungsaufgaben erledigen können, ohne auf Cloud-Dienste angewiesen zu sein. Das Tool ...
vor 3 Monaten
01.1K
Trackers:用于视频对象跟踪的开源工具库

Trackers: Open-Source-Werkzeugbibliothek für die Verfolgung von Videoobjekten

Allgemeine Einführung Trackers ist eine Open-Source-Python-Werkzeugbibliothek, die sich auf die Verfolgung von mehreren Objekten in Videos konzentriert. Sie integriert mehrere führende Verfolgungsalgorithmen wie SORT und DeepSORT und ermöglicht es dem Benutzer, verschiedene Modelle zur Objekterkennung zu kombinieren (wie YOLO...
vor 3 Monaten
01.2K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell

Allgemeine Einführung Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf Audioverstehen, -erzeugung und -dialog konzentriert. Es unterstützt eine breite Palette von Audioverarbeitungsaufgaben wie Spracherkennung, Audio-Q&A und Sprach-Emotionserkennung. Das Modell wurde über 130 Mal getestet...
vor 3 Monaten
0986
Cooragent:一句话构建多智能体任务协作工具

Cooragent: Aufbau eines Multi-Intelligenz-Tools für die Zusammenarbeit in einem einzigen Satz

Allgemeine Einführung Cooragent ist ein Open-Source-Framework für die Zusammenarbeit von KI-Agenten, das von LeapLab an der Tsinghua-Universität entwickelt und auf GitHub gehostet wird. Es ermöglicht Benutzern, intelligente KI-Agenten mit einer Ein-Satz-Beschreibung zu erstellen und unterstützt mehrere Agenten bei der Zusammenarbeit an komplexen Aufgaben. Das Framework bietet zwei...
vor 3 Monaten
01K
Claude生成深度研究报告的MCP服务

Claude's MCP-Dienst für die Erstellung ausführlicher Forschungsberichte

Allgemeine Einführung MCP Server Deep Research ist ein Open-Source-Tool, das durch künstliche Intelligenz und Websuche automatisch strukturierte Forschungsberichte für komplexe Probleme erstellt. Benutzer geben eine Forschungsfrage ein, und das Tool zerlegt die Frage, sucht nach maßgeblichen Informationen, bewertet die Glaubwürdigkeit der Quellen...
vor 3 Monaten
0861
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: ein Open-Source-Tool, das einen Speicherrahmen der Unternehmensklasse für große Modelle bietet

Umfassende Einführung Deep Recall ist ein Open-Source-Gedächtnis-Framework der Unternehmensklasse, das für Large Language Models (LLMs) entwickelt wurde. Es bietet hyper-personalisierte Reaktionsfähigkeit durch effiziente kontextbezogene Abfrage und Integration. Das Framework verwendet eine dreistufige Architektur, einschließlich eines Speicherdienstes, eines Schlussfolgerungsdienstes und eines Koordinators, der die...
vor 3 Monaten
0981
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: Automatisches Umwandeln von Papieren zum maschinellen Lernen in lauffähigen Code

Allgemeine Einführung Paper2Code ist ein Open-Source-Projekt, das das Problem des Mangels an Code-Implementierungen für Arbeiten zum maschinellen Lernen lösen soll. Es wandelt wissenschaftliche Arbeiten durch das Multi-Agenten-System PaperCoder (Large Language Modelling, LLM) automatisch in lauffähige Code-Repositories um. Das System verwendet Planung ...
vor 3 Monaten
0950
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: ein Open-Source-Framework für TypeScript zum schnellen Aufbau von KI-Intelligenzen

Allgemeine Einführung VoltAgent ist ein quelloffenes TypeScript-Framework, das Entwicklern helfen soll, schnell KI-Intelligenzen zu erstellen und zu orchestrieren. Es bietet modulare Werkzeuge und ein standardisiertes Entwicklungsmodell, das die Interaktion mit großen Sprachmodellen (LLMs),...
vor 3 Monaten
0914
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: Browser-Erweiterung für die schnelle Verwaltung und Verwendung von Prompts

General Quick Prompt ist eine Open-Source-Browsererweiterung, die sich auf die Verwaltung von Eingabeaufforderungen (Prompts) und schnelle Eingaben konzentriert. Benutzer können Bibliotheken von Prompts erstellen, organisieren und speichern und schnell voreingestellte Prompt-Inhalte in das Eingabefeld einer beliebigen Webseite einfügen. Dieses Tool ist besonders ...
vor 3 Monaten
01.2K
Suna:集成浏览器操作与数据分析的智能代理

Suna: Intelligente Agenten, die Browserbetrieb und Datenanalyse integrieren

Allgemeine Einführung Suna ist ein von Kortix AI entwickelter Open-Source-Allzweck-KI-Agent, der auf GitHub gehostet wird und auf der Apache 2.0-Lizenz basiert, so dass Benutzer ihn kostenlos herunterladen, verändern und selbst hosten können. Er verwendet natürlichsprachliche Dialoge, um den Benutzern bei...
vor 4 Monaten
01.2K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: ein KI-Ingenieurassistent für die schnelle Erstellung eigener Code-Basen

Umfassende Einführung Potpie AI ist eine Open-Source-Plattform, die sich darauf konzentriert, Entwicklern maßgeschneiderte KI-Entwicklungsassistenten zur Verfügung zu stellen. Sie ermöglicht es KI-Agenten, Code-Struktur und -Logik zu verstehen und Aufgaben wie Debugging, Testen und Code-Generierung zu automatisieren, indem sie einen Wissensgraphen der Code-Basis aufbauen. Benutzer können einfache...
vor 4 Monaten
01.2K
Vexa:实时会议转录与智能知识提取工具

Vexa: ein Tool zur Echtzeit-Transkription von Sitzungen und zur intelligenten Wissensextraktion

Umfassende Einführung Vexa ist eine Open-Source-Plattform für die Echtzeit-Transkription von Meetings und das Wissensmanagement, die entwickelt wurde, um effiziente Meeting-Aufzeichnungen und intelligente Wissensextraktionsdienste für Unternehmen und Privatpersonen bereitzustellen. Sie verbindet sich automatisch mit Plattformen wie Google Meet, Zoom usw. durch API-gesteuerte Meeting-Roboter...
vor 4 Monaten
01K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: Ein System zur Speichererweiterung basierend auf Roo Code Extension

Umfassende Einführung RooFlow ist ein quelloffenes KI-gestütztes Programmierwerkzeug mit der Kernfunktionalität, Code, Entscheidungen und Aufgabenfortschritt während der Entwicklung durch Projektprotokollierung zu erhalten. Es basiert auf der Roo Code-Erweiterung und integriert fünf Modi: Architektur, Codierung, Testen, Debugging und Q&A. Diese Modi inter...
vor 4 Monaten
0926
Zev:用自然语言快速查询终端命令的CLI工具

Zev: Ein CLI-Tool zur schnellen Abfrage von Terminal-Befehlen in natürlicher Sprache

Allgemeine Einführung Zev ist ein benutzerfreundliches Tool für die Befehlszeilenschnittstelle (CLI), mit dem Benutzer schnell Terminalbefehle in natürlicher Sprache abfragen und erzeugen können. Anstatt sich eine komplexe Befehlssyntax merken zu müssen, generiert Zev Terminalbefehle, indem es Ihre Bedürfnisse in Alltagssprache beschreibt. Basierend auf Ope...
vor 4 Monaten
0588
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: ein Management-Tool, das intelligente automatische Prozessgenehmigungen mit menschlichen Audits kombiniert

Allgemeine Einführung LLManager ist ein Open-Source-Tool für intelligentes Genehmigungsmanagement, das auf der Grundlage des LangGraph-Frameworks von LangChain entwickelt wurde und sich auf die Automatisierung der Bearbeitung von Genehmigungsanträgen bei gleichzeitiger Optimierung der Entscheidungsfindung in Verbindung mit menschlicher Überprüfung konzentriert. Es tut dies durch semantische Suche, stichprobenloses Lernen und...
vor 4 Monaten
01.1K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: Unterstützung für kundenspezifische Bilderzeugungstools für ein oder mehrere Themen (geeignet für E-Commerce-Grafiken)

UNO ist ein Open-Source-Framework zur Bilderzeugung, das vom ByteDance Intelligent Creation Team entwickelt wurde. Es basiert auf dem FLUX.1-Modell und konzentriert sich auf die Generierung von benutzerdefinierten Bildern mit einem oder mehreren Objekten durch einen "Weniger-zu-Mehr"-Ansatz.UNO verwendet den Diffusionstransformator...
vor 4 Monaten
0857
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: Ein auf heterogenen Graphen basierendes Werkzeug für die genaue Informationsbeschaffung und -generierung

Eine umfassende Einführung NodeRAG ist ein quelloffenes Retrieval Augmented Generation (RAG) System, das auf GitHub gehostet und von Terry-Xu-666 entwickelt wird. Es optimiert das Retrieval und die Generierung von Informationen durch heterogene Graphenstrukturen, wodurch die Retrievalgenauigkeit und die kontextuelle Relevanz deutlich verbessert werden....
vor 4 Monaten
01.4K
Dia:生成超现实多人对话的文本转语音模型

Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge

Allgemeine Einführung Dia ist ein Open-Source-Text-to-Speech (TTS)-Modell, das von Nari Labs entwickelt wurde und sich auf die Erzeugung von hyperrealistischem Dialog-Audio konzentriert. Es wandelt Text-Skripte in einem einzigen Prozess in realistische Multi-Charakter-Dialoge um, unterstützt Emotions- und Intonationskontrolle und generiert sogar nonverbale Repräsentationen...
vor 4 Monaten
0837
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: Das KI-Tool, das automatisch Markdown-Notizen aus Videos erstellt

Umfassende Einführung BiliNote ist ein Open-Source-KI-Video-Notizen-Tool, das die Extraktion von Inhalten aus BiliNote- und YouTube-Videolinks unterstützt, um automatisch klar strukturierte Notizen im Markdown-Format zu erstellen. Es nutzt die native Audiotranskription und eine Vielzahl von großen Modellen (z.B. ...
vor 4 Monaten
0814
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: Integration mehrerer Datenquellen in eine einzige Textdatei

Umfassende Einführung OneFileLLM ist ein Open-Source-Befehlszeilen-Tool, das entwickelt wurde, um mehrere Datenquellen in einer einzigen Textdatei für die einfache Eingabe in Large Language Models (LLMs) zu konsolidieren. Es unterstützt die Verarbeitung von GitHub-Repositories, ArXiv-Papers, YouTube-Videotranskriptionen,...
vor 4 Monaten
01.2K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G niedrigen Grafikspeicher schnelles Wachstum von langen Video-Open-Source-Projekt

Allgemeine Einführung FramePack ist ein Open-Source-Tool zur Videogenerierung, das sich darauf konzentriert, Videodiffusionstechniken praktischer zu machen. Es entkoppelt den Generierungsaufwand von der Videolänge, indem es die Eingabeframes durch ein einzigartiges neuronales Netzwerk zur Vorhersage des nächsten Frames auf eine feste Länge komprimiert. Das bedeutet, dass selbst bei der Erzeugung langer Videos der Videospeicherbedarf...
vor 3 Monaten
0944
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: ein quelloffenes Videogenerierungstool zur Optimierung der Gesichtskonsistenz

Allgemeine Einführung Open-Sora ist ein Open-Source-Projekt, das es jedem ermöglichen soll, auf effiziente Weise qualitativ hochwertige Videos zu erzeugen. Es wurde vom hpcaitech-Team entwickelt, um Werkzeuge zur Erzeugung von Videos aus Text oder Bildern bereitzustellen, die mehrere Auflösungen und Laufzeiten unterstützen. Das Projekt ist vollständig quelloffen, mit öffentlichen Modellgewichten...
vor 4 Monaten
0874
OneLine:生成热点事件时间轴的AI工具

OneLine: ein KI-Tool zur Erstellung von Zeitleisten für aktuelle Ereignisse

Allgemeine Einführung OneLine ist ein Open-Source-Tool zur Erstellung von Zeitleisten für heiße Ereignisse, das auf GitHub gehostet und vom Benutzer chengtx809 entwickelt wurde. Es generiert schnell eine Zeitleiste von Ereignissen anhand von Schlüsselwörtern, die vom Benutzer eingegeben werden, und zeigt die Zeit, den Titel, die Beschreibung und die Personen, die mit dem Ereignis in Verbindung stehen, an...
vor 4 Monaten
0985
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: eine Open-Source-Chat-Plattform für die Interaktion mit personalisierten KI-Charakteren

Allgemeine Einführung Agnai Chat ist eine Open-Source-KI-Chat-Plattform, die es Benutzern ermöglicht, personalisierte KI-Charaktere für Einzel- oder Mehrspieler-Interaktionen zu erstellen. Sie unterstützt eine breite Palette von KI-Diensten, darunter OpenAI, Claude, Kobold usw., und eignet sich für Unterhaltung, Rollenspiele, Bildung oder...
vor 4 Monaten
01.1K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: Open-Source-Tool zum Extrahieren und Abfragen von WeChat-Chat-Protokollen

Allgemeine Einführung Chatlog ist ein Open-Source-Tool, das sich auf die Extraktion und Abfrage von Chat-Protokollen aus der lokalen Datenbank von WeChat konzentriert. Es unterstützt die WeChat-Versionen 3.x und 4.0 und deckt sowohl Windows- als auch macOS-Systeme ab. Benutzer können die Befehlszeile, Terminalschnittstelle oder H...
vor 4 Monaten
01.4K
VOP:提取复杂图表与数学公式的OCR工具

VOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer Formeln

Umfassende Einführung Das Versatile OCR Program ist ein Open-Source-Tool zur optischen Zeichenerkennung (OCR), das für die Arbeit mit komplexen akademischen und Bildungsdokumenten entwickelt wurde. Es kann Text, Tabellen, mathematische Formeln, Diagramme und Schemata aus PDFs, Bildern und anderen Dokumenten extrahieren und...
vor 4 Monaten
01.2K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: aus Text und Bildern SVG-Vektorgrafiken erzeugen Open-Source-Projekt

Allgemeine Einführung OmniSVG ist ein Open-Source-Projekt, das sich auf die Erzeugung hochwertiger Vektorgrafiken (SVG) durch ein multimodales Modell konzentriert. Es verwendet vortrainierte visuell-linguistische Modelle, um die Generierung von SVG aus textlichen Beschreibungen oder Bildeingaben zu unterstützen. Dabei wird ein breites Spektrum von Szenarien abgedeckt, von einfachen Icons bis hin zu komplexen Anime-Figuren. Artikel ...
vor 4 Monaten
01.4K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: Hochladen von Wireframes zur Erzeugung von Front-End-Code auf der Grundlage von Llama4

Allgemeine Einführung Napkins.dev ist ein kostenloses Open-Source-Projekt, dessen Kernfunktion darin besteht, dass Benutzer Screenshots oder Wireframes von Benutzeroberflächen hochladen können, um automatisch lauffähigen Front-End-Code zu generieren. Benutzer müssen nur eine Design-Zeichnung zur Verfügung stellen, das Tool wird durch das Llama 4 Modell (von Together ...
vor 4 Monaten
0980
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: Xiaomis quelloffenes End-to-End-Framework für selbstfahrende Autos und deren Planung

Umfassende Einführung Orion ist ein Open-Source-Projekt, das von Xiaomi Labs entwickelt wurde und sich auf die End-to-End-Technologie für autonomes Fahren konzentriert. Es löst das Problem der unzureichenden kausalen Argumentation in komplexen Szenarien traditioneller autonomer Fahrmethoden durch Visual Language Modelling (VLM) und generative Planer....
vor 4 Monaten
0865
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: Rendering-Tool zur Erstellung von Videos mit mehreren Ansichten aus einem einzigen Video

Allgemeine Einführung ReCamMaster ist ein Open-Source-Videobearbeitungswerkzeug, dessen Kernfunktion darin besteht, aus einem einzigen Video neue Kameraansichten zu erzeugen. Benutzer können die Kameraspur festlegen und das Video neu rendern, um ein dynamisches Bild mit verschiedenen Blickwinkeln zu erhalten. Es wurde von einem Team der Zhejiang Universität und Racer Technology entwickelt und basiert auf...
vor 4 Monaten
01K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: ein KI-Tool zur Analyse der Beziehungen zwischen Buchcharakteren und zur Erstellung von Diagrammen

Allgemeine Einführung Austen ist ein Open-Source-KI-Tool, das das Angular-Framework und die Analogjs-Initialisierung in Kombination mit der Mermaidjs-Technologie verwendet, um Diagramme zu erstellen, die den Benutzern bei der Analyse der Beziehungen zwischen Charakteren in Büchern helfen. Benutzer können Open...
vor 4 Monaten
01.1K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: Open-Source-Tools zur Bildvergrößerung und -entschärfung in beliebiger Größe

Allgemeine Einführung Thera ist ein Open-Source-Tool für die Superauflösung von Bildern, das von einem Team der ETH Zürich und der Universität Zürich entwickelt wurde. Es kann niedrig aufgelöste Bilder auf beliebige Skalen zoomen, wie z.B. 2x, 3.14x oder sogar nicht-ganzzahlige Vielfache, und...
vor 4 Monaten
0942
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google veröffentlicht offenes Protokoll für die Kommunikation zwischen KI-Intelligenzen

Allgemeine Einführung A2A (Agent2Agent) ist ein Open-Source-Protokoll, das von Google entwickelt wurde, damit KI-Intelligenzen, die von verschiedenen Frameworks oder Anbietern entwickelt wurden, miteinander kommunizieren und zusammenarbeiten können. Es bietet eine standardisierte Reihe von Methoden für Intelligenzen, um die Fähigkeiten der anderen zu entdecken, Aufgaben zu teilen und die Arbeit abzuschließen...
vor 4 Monaten
01.3K
LM Speed:快速测试大模型API性能

LM-Geschwindigkeit: Schnelles Testen der API-Leistung großer Modelle

Allgemeine Einführung LM Speed ist ein Tool, das speziell für KI-Entwickler entwickelt wurde und auch als Online-Dienst unter lmspeed.net zur Verfügung steht. Seine Hauptfunktion besteht darin, die Leistung von Sprachmodell-APIs zu testen und zu analysieren, um den Benutzern zu helfen, Geschwindigkeitsengpässe schnell zu erkennen und die Aufrufstrategien zu optimieren. Diese...
vor 4 Monaten
01K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: ein MCP-Dienst zum schnellen Durchsuchen und Organisieren technischer Dokumentation

Allgemeine Einführung DevDocs ist ein völlig kostenloses Open-Source-Tool, das vom CyberAGI-Team entwickelt und auf GitHub gehostet wird. Es wurde für Programmierer und Softwareentwickler entwickelt und beginnt mit der URL eines technischen Dokuments, durchsucht automatisch die relevanten Seiten und organisiert sie in einem übersichtlichen Ma...
vor 4 Monaten
01.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: ein intelligentes Tool für automatisierte Softwaretests mit KI

Allgemeine Einführung TestDriver ist eine Website, die mit Hilfe künstlicher Intelligenz Entwickler beim Testen von Software unterstützt. Sie automatisiert die Aufgabe des Testens von Software, indem sie menschliche Handlungen simuliert, wie z. B. das Klicken einer Maus oder die Eingabe von Text. Das Herzstück der Website ist ein "Computer mit einem KI-Agenten", der wie ein echter Mensch arbeitet...
vor 4 Monaten
0900
自动解析PDF内容并提取文字与表格的开源服务

Automatisches Parsen von PDF-Inhalten und Extrahieren von Text und Tabellen von Open-Source-Diensten

Umfassende Einführung Es analysiert automatisch das Layout von PDF-Dokumenten, identifiziert Text, Titel, Bilder, Tabellen, Formeln und andere Elemente auf der Seite und bestimmt ihre richtige Reihenfolge. Das Tool unterstützt OCR-Funktionalität und kann gescannte PDFs in durchsuchbaren Text umwandeln. Es läuft auf Docker und bietet zwei Modelle...
vor 4 Monaten
0968
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische Sprachen

Umfassende Einführung Dolphin ist ein Open-Source-Modell, das von DataoceanAI und der Tsinghua-Universität entwickelt wurde und sich auf Spracherkennung und Spracherkennung für asiatische Sprachen konzentriert. Es unterstützt 40 Sprachen in Ostasien, Südasien, Südostasien und dem Nahen Osten sowie 22 chinesische Dialekte...
vor 4 Monaten
01K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: Ausbildung von digitalen Doppelgängern mit WeChat-Chat-Protokollen und Stimmen

Umfassende Einführung WeClone ist ein Open-Source-Projekt, das WeChat-Chat-Protokolle und Sprachnachrichten in Kombination mit großen Sprachmodellen und Sprachsynthesetechnologie verwendet, um Benutzern die Erstellung personalisierter digitaler Doppelgänger zu ermöglichen. Das Projekt kann die Chat-Gewohnheiten des Benutzers analysieren, um das Modell zu trainieren, aber auch eine kleine Anzahl von Stimmproben, um einen realistischen Klang zu erzeugen...
vor 4 Monaten
01.2K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: Mehrsprachiges Globalisierungstool für Videos mit Ein-Klick-Übersetzung und -Synchronisation

Umfassende Einführung KrillinAI ist ein Open-Source-Videobearbeitungstool, das sich auf die Verwendung künstlicher Intelligenz konzentriert, um Benutzern bei der Übersetzung von Videos zu helfen und sie automatisch zu synchronisieren. Es kann vom Herunterladen des Videos bis zur Erstellung des fertigen Produkts, das an verschiedene Plattformen angepasst ist, alles mit wenigen Klicks erledigen. Die Entwickler sind auf GitHub verfügbar...
vor 2 Monaten
01.6K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: Auf Verstärkungslernen basierende Fahr-KI zur Untersuchung komplexer Probleme

Umfassende Einführung DeepResearcher ist ein Open-Source-Projekt, das vom GAIR-NLP-Team an der Shanghai Jiao Tong University entwickelt wurde. Es ist ein intelligentes Forschungswerkzeug, das auf großen Sprachmodellen (Large Language Models, LLMs) basiert, die durchgängig in realen Webumgebungen durch Reinforcement Learning (RL) trainiert werden. Das Projekt ...
vor 4 Monaten
0850
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: Ein Open-Source-Tool zur Generierung von Anime-Videos und Charakter-Interaktionen mit linguistischen Befehlen

AnimeGamer ist ein Open-Source-Tool von Tencents ARC Lab. Benutzer können Anime-Videos mit einfachen Sprachbefehlen erzeugen, wie z. B. "Sousuke fährt in einem lila Auto herum", sowie verschiedene Anime-Charaktere miteinander interagieren lassen, wie z. B. Kiki aus Magical Girl's Adventure und Sky City...
vor 4 Monaten
01.2K