AI Open-Source-Projekt

Insgesamt 1020 Artikel
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: Laden Sie ein Bild hoch und migrieren Sie die Porträtfunktionen, um verschiedene Bildstile zu erzeugen.

Umfassende Einführung InstantID ist eine fortschrittliche Technologie, die darauf ausgerichtet ist, Bilder mit personalisierten Stilen oder Posen in Sekundenschnelle zu generieren und dabei ein hohes Maß an Wiedergabetreue anhand eines einzigen Referenz-ID-Bildes zu gewährleisten. Die Technologie verwendet eine auf einem Diffusionsmodell basierende Lösung, die Gesichtsbilder, Landmark-Maps...
vor 12 Monaten
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: ein Tool zur Umwandlung von Webinhalten in RSS-Feeds mittels AI

Allgemeine Einführung AI RSS ist ein innovatives Tool, das Webinhalte mithilfe von KI-Technologie in RSS-Feeds umwandelt. Es besteht aus zwei Hauptteilen: einem Browser-Plugin und einer Server-Seite. Das Browser-Plugin ermöglicht es Benutzern, Listen von Webseiten auszuwählen und strukturierte Datenbeschreibungsdateien (SDD) zu erzeugen...
vor 7 Monaten
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Atomare Agenten: ein Rahmen für den Aufbau leichter, modularer KI-Intelligenzen

Allgemeine Einführung Atomic Agents ist ein extrem leichtgewichtiges und modulares Framework, das auf dem Konzept der Atomizität basiert, um Agenten-KI-Pipelines und -Anwendungen zu erstellen. Das Framework bietet eine Reihe von Tools und Agenten, die kombiniert werden können, um leistungsstarke Anwendungen zu erstellen. Es basiert auf Instruc...
vor 8 Monaten
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: ein neues Agenten-Orchestrierungs-Framework auf der Grundlage von LLM und EKG (Branchenwissen)

Allgemeine Einführung muAgent ist ein innovatives, von der Ant Group entwickeltes Multi-Intelligentsia-Framework. Das Framework unterstützt Benutzer bei der Ausführung verschiedener komplexer Standard Operating Procedures (SOPs) unter menschlicher Anleitung durch Canvas-Drag-and-Drop und einfaches Schreiben von Text, in Zusammenarbeit mit Technologien wie Multi-Intelligentsia, Funktionsaufrufen und Code-Interpretern...
vor 9 Monaten
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: Extrahieren von Daten aus einer HTML-URL, Ausgabe von einfachem Text/Markdown

Allgemeine Einführung magic-html ist eine Python-Bibliothek, die den Prozess der Extraktion von Inhalten aus HTML vereinfachen soll. Egal, ob es sich um komplexe HTML-Strukturen oder einfache Webseiten handelt, diese Bibliothek zielt darauf ab, dem Benutzer eine bequeme und effiziente Schnittstelle zu bieten. Sie unterstützt die multimodale Extraktion...
vor 11 Monaten
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: Ein Open-Source-Tool für die effiziente Extraktion und Erkundung von strukturierten Daten

Umfassende Einführung Knowledge Table (Knowledge Table) ist ein Open-Source-Projekt, das den Prozess der Extraktion und Erforschung strukturierter Daten aus unstrukturierten Dokumenten vereinfachen soll. Benutzer können strukturierte Wissensrepräsentationen wie Tabellen und Graphen über eine natürlichsprachliche Abfrageoberfläche erstellen. Das Tool unterstützt die Anpassung der Extraktion ...
vor 10 Monaten
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: Browser Plugin, damit ChatGPT auf anderen Webseiten funktioniert

Allgemeine Einführung ChatGPT Box ist eine Open-Source-Browser-Erweiterung, die entwickelt wurde, um ChatGPT tief in den Browser eines Benutzers zu integrieren. Entwickelt von josStorer, unterstützt das Tool mehrere Sprachen und bietet eine Vielzahl von Funktionen wie das Aufrufen von Chat-Paaren auf jeder Seite...
vor 4 Monaten
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: quelloffenes LLM-Schwachstellen-Scan-Tool, das umfassende Fuzz-Tests und Angriffstechniken bietet

Allgemeine Einführung Agentic Security ist ein quelloffenes LLM (Large Language Model) Schwachstellen-Scan-Tool, das Entwicklern und Sicherheitsexperten umfassende Fuzz-Tests und Angriffstechniken bietet. Das Tool unterstützt benutzerdefinierte Regelsätze oder agentenbasierte Angriffe, ist in der Lage LLM AP zu integrieren...
vor 6 Monaten
02.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: Automatisierte Codegenerierung und Debugging-Tool mit Mehrsprachenunterstützung

Allgemeine Einführung AutoDev ist ein Open-Source-Projekt, das vom Unit Mesh-Team entwickelt und auf GitHub gehostet wird. Es zielt darauf ab, die Programmiereffizienz von Entwicklern durch Technologie der künstlichen Intelligenz zu verbessern. Es ist ein leistungsstarker Programmierassistent, der mehrere Programmiersprachen unterstützt, darunter Ja...
vor 6 Monaten
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: eine generische semantische Chunking-Strategie basierend auf Llama-70B

Umfassende Einführung zChunk ist eine neuartige Chunking-Strategie, die von ZeroEntropy entwickelt wurde und eine Lösung für generisches semantisches Chunking bieten soll. Die Strategie basiert auf dem Llama-70B-Modell, das den Chunking-Prozess von Dokumenten optimiert, indem es die Generierung von Chunks anregt und so sicherstellt, dass die Informationsabfrage auf hohem Niveau...
vor 6 Monaten
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: Audio-gesteuerte 2D-Porträts von interaktiven digitalen Menschen in Echtzeit, die mit 30 Bildern pro Sekunde auf der CPU laufen

Allgemeine Einführung LiteAvatar ist ein Open-Source-Tool, das vom HumanAIGC-Team (Teil von Ali) entwickelt wurde und sich auf die Erzeugung von Gesichtsanimationen aus 2D-Avataren konzentriert, die durch Audio in Echtzeit gesteuert werden. Es läuft mit 30 Bildern pro Sekunde (fps) und verlässt sich nur auf die CPU und ist besonders geeignet für...
vor 6 Monaten
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: Intelligente Körper-Workflows in natürlicher Sprache für Desktop- und Browser-Automatisierung

Allgemeine Einführung Eko ist ein produktionsreifes JavaScript-Framework zur Erstellung effizienter intelligenter Agenten-Workflows durch Beschreibungen in natürlicher Sprache. Es wurde entwickelt, um Entwicklern die Möglichkeit zu geben, alltägliche Aufgaben mit Hilfe von KI-Technologien zu automatisieren, ohne...
vor 5 Monaten
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: Eine intelligente Einrichtung für die Analyse von Thorax-Röntgenbildern unter Verwendung multimodaler Makromodelle

Umfassende Einführung MedRAX ist eine hochmoderne KI-Intelligenz, die für die Analyse von Thorax-Röntgenbildern (CXR) entwickelt wurde. Es integriert modernste CXR-Analysetools und multimodale große Sprachmodelle, um komplexe medizinische Anfragen ohne zusätzliches Training dynamisch zu verarbeiten.
vor 5 Monaten
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: Extrahieren und Kategorisieren von Dokumenten in strukturierte Daten, um den Prozess der Dokumentenbearbeitung zu optimieren

Umfassende Einführung ExtractThinker ist ein flexibles Dokument-Intelligenz-Tool, das strukturierte Daten aus Dokumenten mit Hilfe von Large Language Models (LLMs) extrahiert und klassifiziert und einen nahtlosen ORM-ähnlichen Dokumentenverarbeitungs-Workflow bietet. Es unterstützt eine Vielzahl von Dokumentenladern, einschließlich Tess...
vor 7 Monaten
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Serverlose Bereitstellung einer multimodalen Gemini-Dialogseite

Allgemeine Einführung Gemini Playground ist ein Open-Source-Projekt entwickelt, um Benutzern zu helfen, schnell einen multimodalen Dialog Website bereitstellen. Das Projekt wird durch technische Crawling Garnelen entwickelt, unterstützen die Verwendung von Gemini API Key in 10 Sekunden, um den Einsatz zu vervollständigen. Ob der Benutzer ist ...
vor 6 Monaten
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: ein Tool zur Vereinfachung des Prozesses der Feinabstimmung von Modellen der gängigen visuellen Open-Source-Sprachen

Umfassende Einführung Maestro ist ein von Roboflow entwickeltes Tool, das den Prozess der Feinabstimmung multimodaler Modelle vereinfacht und beschleunigt, so dass jeder seine eigenen visuellen Makromodelle trainieren kann. Es bietet fertige Rezepte für die Feinabstimmung beliebter visueller Sprachmodelle (VLMs) wie F...
vor 6 Monaten
02.7K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: Benutzerdefinierte Chatbots für die schnelle Integration mehrerer Datenquellen

Allgemeine Einführung OpenChat ist eine benutzerfreundliche Chatbot-Konsole zur Vereinfachung der Verwendung von Large Language Models (LLMs). Durch einen zweistufigen Einrichtungsprozess ermöglicht OpenChat seinen Nutzern die einfache Erstellung und Verwaltung mehrerer benutzerdefinierter Chatbots. Die Plattform unterstützt G...
vor 7 Monaten
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter: Wisdom Spectrum hat ein leistungsfähiges Modell für die Erstellung ultralanger Texte auf den Markt gebracht, das die Erstellung von mehr als 10.000 Wörtern in einem einzigen Gespräch ermöglicht.

Umfassende Einführung LongWriter ist ein leistungsfähiges Tool zur Erzeugung langer Texte, das von der Tsinghua University Data Mining Research Group (THUDM) entwickelt wurde. Das Tool basiert auf dem fortschrittlichen Long Context Language Model (LLM) und ist in der Lage, lange Texte mit mehr als 10.000 Wörtern zu generieren.LongWriter...
vor 8 Monaten
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI: Hochwertige AI-Modell Weiterleitung Interface-Management-System, die offizielle Website bietet kostenlose API-Kontingent täglich

Umfassende Einführung VoAPI ist ein neues, hochkarätiges und leistungsfähiges KI-Schnittstellenverwaltungs- und Vertriebssystem, das hauptsächlich für persönliche oder unternehmensinterne Verwaltungs- und Vertriebskanäle verwendet wird. Das System wurde auf der Grundlage von NewAPI entwickelt und bietet reichhaltige Funktionsmodule und eine optimierte Benutzeroberfläche, die...
vor 9 Monaten
02.7K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: Xiaomis quelloffenes End-to-End-Framework für selbstfahrende Autos und deren Planung

Umfassende Einführung Orion ist ein Open-Source-Projekt, das von Xiaomi Labs entwickelt wurde und sich auf die End-to-End-Technologie für autonomes Fahren konzentriert. Es löst das Problem der unzureichenden kausalen Argumentation in komplexen Szenarien traditioneller autonomer Fahrmethoden durch Visual Language Modelling (VLM) und generative Planer....
vor 4 Monaten
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Aufbau eines intelligenten Dokumenten-Q&A-Systems und einfache Erstellung einer privaten web-seitigen Wissensdatenbank

Umfassende Einführung RAG Web UI ist ein intelligentes Dialogsystem, das auf der RAG-Technologie (Retrieval Augmented Generation) basiert. Es hilft Unternehmen und Einzelpersonen, intelligente Q&A-Systeme auf der Grundlage ihrer eigenen Wissensbasis zu erstellen. Durch die Kombination von Dokumentenabfrage und großen Sprachmodellen bietet RAG Web UI genaue und zuverlässige...
vor 7 Monaten
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: Verwendung von RAG-Techniken zur Erstellung genauer SQL-Abfragen aus Text

Umfassende Einführung Vanna ist ein vom MIT lizenziertes Open-Source-Python-Framework, das sich auf die Generierung von SQL-Abfragen durch RAG-Techniken (Retrieval Augmented Generation) konzentriert. Benutzer können RAG-Modelle trainieren, sie auf ihre eigenen Daten anwenden und dann Fragen stellen, woraufhin Vanna die entsprechenden S...
vor 7 Monaten
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: Eine visuelle Open-Source-Programmierumgebung zum Testen und Evaluieren der Effektivität großer Sprachmodell-Hinweise

Allgemeine Einführung ChainForge ist eine visuelle Open-Source-Programmierumgebung, die für das Testen und Bewerten der Effektivität von Cues für große Sprachmodelle (LLM) entwickelt wurde. Es bietet eine Datenfluss-Cueing-Engineering-Umgebung, durch die Benutzer schnell die Qualität verschiedener Cues auf LLM-Antworten untersuchen und analysieren können...
vor 8 Monaten
02.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: Ein Open-Source-Modell für mehrsprachige hochpräzise Spracherkennung

Allgemeine Einführung FireRedASR ist ein Spracherkennungsmodell, das vom Little Red Book FireRed-Team entwickelt und als Open Source zur Verfügung gestellt wird. Es konzentriert sich auf die Bereitstellung hochpräziser, mehrsprachengestützter automatischer Spracherkennungslösungen (ASR). Das Projekt wird auf GitHub für Entwickler und Forscher gehostet, und bietet...
vor 5 Monaten
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: ein Werkzeug zur Verwaltung der Zusammenarbeit mehrerer Intelligenzen mit Hilfe von Supervisor-Intelligenzen

Allgemeine Einführung LangGraph Supervisor ist eine Python-Bibliothek, die auf dem LangGraph-Framework basiert und für die Erstellung und Verwaltung multi-intelligenter Körpersysteme entwickelt wurde. Die Bibliothek koordiniert die Arbeit von mehreren spezialisierten Agenten durch einen zentralen Supervisor, der sicherstellt, dass Kommunikationsflüsse und Aufgaben aufgeteilt werden...
vor 6 Monaten
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: Ein virtuelles Anprobetool mit hoher Wiedergabetreue zur Verbesserung der Authentizität von Kleidungsdetails

Umfassende Einführung FitDiT ist ein virtuelles Anprobesystem, das auf Diffusionstransformatoren (Diffusion Transformers) basiert. Das vom Tencent AI Lab entwickelte Projekt zielt darauf ab, die Grenzen herkömmlicher virtueller Anprobesysteme bei der Darstellung von Kleidungsdetails zu überwinden....
vor 7 Monaten
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: quelloffenes Projekt für die tiefgehende Inferenzsuche mit lokalem Wissen

Umfassende Einführung Deep Searcher ist ein leistungsfähiges Tool, das Large Language Models (LLMs) und Vektordatenbanken kombiniert, um auf der Grundlage privater Daten zu suchen, zu bewerten und Schlussfolgerungen zu ziehen, die hochpräzise Antworten und umfassende Berichte liefern. Es ist für das Wissensmanagement in Unternehmen geeignet...
vor 6 Monaten
02.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: Open-Source-Engine für den Einsatz von FLUX mit geringem Umfang, Wan 2.1

Allgemeine Einführung DiffSynth-Engine ist ein Open-Source-Projekt, das von ModelScope ins Leben gerufen wurde und auf GitHub gehostet wird. Es basiert auf der Technologie der Diffusionsmodellierung, konzentriert sich auf die effiziente Erzeugung von Bildern und Videos und ist für Entwickler geeignet, um KI-Modelle in Produktionsumgebungen einzusetzen...
vor 5 Monaten
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmente: Open-Source-Versionen von Anwendungen wie Claude Artifacts von Anthropic, Vercel v0 oder GPT Engineer.

Allgemeine Einführung Fragments von E2B ist ein Open-Source-Projekt, das eine auf Next.js basierende Vorlage für die Erstellung von vollständig durch KI generierten Anwendungen bietet. Das von E2B entwickelte Projekt zielt darauf ab, den Entwicklungsprozess von KI-Anwendungen zu vereinfachen und zu beschleunigen. Es integriert eine Vielzahl von aktuellen...
vor 9 Monaten
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: Einfache Web-Chat-Schnittstelle mit integrierten plattformübergreifenden KI-Modellen (einsatzfrei)

Allgemeine Einführung OrionChat ist eine webbasierte KI-Chat-Schnittstelle, die Benutzern eine einheitliche Plattform für die Interaktion mit mehreren Mainstream-KI-Modellen bietet. Das Projekt unterstützt eine breite Palette von KI-Modellen, darunter Ollama (lokal ausgeführt), OpenAI GPT, Google Gemi...
vor 8 Monaten
02.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6G niedrigen Grafikspeicher schnelles Wachstum von langen Video-Open-Source-Projekt

Allgemeine Einführung FramePack ist ein Open-Source-Tool zur Videogenerierung, das sich darauf konzentriert, Videodiffusionstechniken praktischer zu machen. Es entkoppelt den Generierungsaufwand von der Videolänge, indem es die Eingabeframes durch ein einzigartiges neuronales Netzwerk zur Vorhersage des nächsten Frames auf eine feste Länge komprimiert. Das bedeutet, dass selbst bei der Erzeugung langer Videos der Videospeicherbedarf...
vor 3 Monaten
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: KI-Tool zum Extrahieren von Kleidungsstücken einer Person in Form eines gekachelten Bildes mit Kleidungsstücken

Umfassende Einführung TryOffAnyone ist ein bahnbrechendes KI-Bildverarbeitungstool, das speziell entwickelt wurde, um die Herausforderungen der Kleidungsanzeige im E-Commerce-Sektor zu lösen. Es ist in der Lage, Fotos von echten Menschen, die Kleidung tragen, auf intelligente Weise in Bilder mit Lay-Flat-Display-Effekt umzuwandeln. Diese Technologie basiert auf der neuesten Latent Dif...
vor 7 Monaten
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: Ein multimodales Reinforcement Learning Tool zur Erforschung des visuellen Denkens

Umfassende Einführung MM-EUREKA ist ein Open-Source-Projekt, das vom Shanghai Artificial Intelligence Laboratory der Shanghai Jiao Tong University und anderen Parteien entwickelt wurde. Es erweitert die Fähigkeiten des textuellen Reasonings auf multimodale Szenarien durch regelbasierte Reinforcement-Learning-Techniken, um Modelle bei der Verarbeitung von Bild- und Textinformationen zu unterstützen. Der Kern dieses Tools...
vor 5 Monaten
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: eine Next.js-Vorlage für die Entwicklung von Echtzeit-KI-Anwendungen mit Sprachdialog

Umfassende Einführung OpenAI Realtime API Next.js ist ein Open-Source-Projekt, das auf dem Next.js-Framework basiert und Entwicklern helfen soll, schnell Echtzeit-Sprach-KI-Anwendungen zu erstellen. Das Projekt integriert die Echtzeit-API von OpenAI und die WebRTC-Technologie...
vor 7 Monaten
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: Online-Datenanalyseformulare, die KI-Dialog und Codeausführung integrieren

Allgemeine Beschreibung Quadratic ist ein Open-Source-Tool für intelligente Tabellenkalkulationen, das KI-, Code- und Datenkonnektivitätsfunktionen kombiniert, um Benutzern leistungsstarke Datenverarbeitungs- und -analysefunktionen zu bieten. Durch die Unterstützung von Programmiersprachen wie Python, SQL und Rust kann Quadratic...
vor 6 Monaten
02.7K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate: Volltextübersetzung von Dokumenten: englische PDF/MD-Dokumente schnell in chinesische Dokumente übersetzen.

Umfassende Einführung Doc2XAPITranslate ist ein leistungsstarkes Volltext-Übersetzungstool, das für die schnelle Übersetzung von englischen PDF- oder Markdown-Dokumenten in chinesische Dokumente entwickelt wurde. Das Tool unterstützt eine Vielzahl von Übersetzern, darunter DeepSeek, OpenAI, O...
vor 6 Monaten
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: Intelligentes Dialogsystem für digitale Menschen, das große Sprachmodelle und visuelle Modelle für neue interaktive Erlebnisse kombiniert

Allgemeine Einführung Linly-Talker ist ein innovatives digitales Dialogsystem, das Large Language Models (LLMs) mit visuellen Modellen kombiniert, um einen neuartigen Ansatz für die Interaktion zwischen Mensch und Computer zu schaffen. Das System integriert eine Vielzahl von Technologien wie Whisper, Linly, Micros...
vor 6 Monaten
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, eine Plattform zur Erstellung von KI-Basismodellen der physischen Welt

Umfassende Einführung NVIDIA Cosmos ist eine weltbasierte Modellierungsplattform für Entwickler, die speziell darauf ausgerichtet ist, Physik-KI-Entwicklern zu helfen, ihre Physik-KI-Systeme besser und schneller zu entwickeln. Die Plattform bietet eine Reihe von vortrainierten Modellen, darunter diffusions- und autoregressionsbasierte...
vor 7 Monaten
02.7K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ein Schlüssel zur Erzeugung von Hörbüchern in natürlicher Klangqualität, Unterstützung für PDF, epub, docx und andere Formate

Umfassende Einführung QuickPiperAudiobook ist ein Open-Source-Projekt, das entwickelt wurde, um eine Vielzahl von Textformaten (z.B. epub, mobi, txt, PDF, HTML, etc.) in natürlich klingende Hörbücher durch einen einfachen Befehl zu konvertieren. Das Tool verwendet Pi...
vor 10 Monaten
02.7K
Docs:开源的协作笔记和文档管理工具

Docs: Open-Source-Tools für die gemeinsame Verwaltung von Notizen und Dokumenten

Allgemeine Einführung Docs ist eine Open-Source-Plattform für die kollaborative Erstellung von Notizen und die Verwaltung von Dokumenten, die vom suitenumerique-Team entwickelt wurde. Sie wurde unter Verwendung von Django und React-Technologien mit dem Ziel entwickelt, ein einfach zu bedienendes Tool zur Verfügung zu stellen, das Benutzern hilft,...
vor 5 Monaten
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: eine KI-Plattform für die Erstellung hochauflösender 3D-Modelle für digitale Inhalte

Allgemeine Einführung Neural4D ist eine innovative, auf KI basierende Plattform, die Benutzern hilft, schnell hochwertige 3D-Modelle und Animationen mit einfachen Text- oder Bildeingaben zu erstellen. Sie wurde von DreamTech entwickelt und basiert auf der weltweit führenden End-to-End-Technologie für die Erzeugung großer 3D-Modelle...
vor 6 Monaten
02.7K
Meeting:本地实时转录和生成会议纪要的开源客户端

Meeting: Lokale Echtzeit-Transkription und Erstellung von Meeting-Protokollen des Open-Source-Clients

Allgemeine Einführung Meeting Minutes (auch bekannt als Meetily) ist ein kostenloses und quelloffenes KI-Meeting-Assistententool, das von Zackriya Solutions entwickelt wurde und sich darauf konzentriert, Audioaufnahmen von Meetings in Echtzeit zu erfassen, transkribierten Text zu...
vor 5 Monaten
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Open Source Cursor für Front-End-Design, Entwurf und Veröffentlichung von Code in React-Anwendungen

Allgemeine Einführung Onlook ist ein Open-Source-Design-Tool für Designer und Entwickler, mit dem Benutzer direkt in einer laufenden React-Anwendung entwerfen und Designänderungen in Code umwandeln können. Das Tool bietet ein intuitives visuelles Bearbeitungserlebnis ähnlich wie Figma oder Webf...
vor 6 Monaten
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: effizientes Open-Source-Projekt zur Erstellung von Videos, das behauptet, ein einminütiges Video in einer Minute zu erstellen

Umfassende Einführung Magic 1-For-1 ist ein effizientes Modell zur Videogenerierung, das die Speichernutzung optimiert und die Inferenzlatenz reduziert. Das Modell zerlegt die Aufgabe der Text-zu-Video-Generierung in zwei Teilaufgaben: Text-zu-Bild-Generierung und Bild-zu-Video-Generierung, was ein effizienteres Training und eine effizientere...
vor 6 Monaten
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: Ein WordPress AI Assistant Plugin für Dialoge, Beitragserstellung und Übersetzung

Umfassende Einführung WordPress AI Assistant Plugin (wp-ai-chat) ist ein Open-Source-WordPress-Plugin, das entwickelt wurde, um Benutzern eine Vielzahl von AI-Funktionen zur Verfügung zu stellen, einschließlich AI-Dialog, Artikelgenerierung, Artikelzusammenfassung, Artikelübersetzung und Lesen von Inhalten. Das Plugin unterstützt das Andocken mehrerer ...
vor 6 Monaten
02.7K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: Präzise Steuerung der Position von Bildelementen, intuitive grafische Oberfläche basierend auf ComfyUI

Allgemeine Einführung GLIGEN GUI ist eine intuitive grafische Benutzeroberfläche auf der Basis von ComfyUI, die die Verwendung des GLIGEN-Modells vereinfacht, eines neuartigen Text-Bild-Modells, das eine präzise Spezifikation der Position von Objekten in einem Bild ermöglicht. Mit GLIGE...
vor 11 Monaten
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: ein Online-Cover-Maker, mit dem Sie personalisierte Cover für Blogs, Kurzvideos, soziale Medien und vieles mehr erstellen können!

Allgemeine Einführung Mini-Cover ist ein Open-Source-Online-Tool zur Erstellung von Covers für Plattformen wie Blogs, Kurzvideos und soziale Medien. Das von JLinMr entwickelte Tool zielt darauf ab, eine einfache und effiziente Lösung zu bieten, mit der Benutzer schnell Cover erstellen können, die ihren Bedürfnissen entsprechen...
vor 8 Monaten
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Open-Source-Implementierung von NotebookLM basierend auf Deepseek-V3 und PlayHT TTS

Allgemeine Einführung Open Source NotebookLM ist ein innovatives Projekt für künstliche Intelligenz, das die Sprachverstehensfähigkeiten von Deepseek-V3 mit der Sprachsynthesetechnologie von PlayHT kombiniert und darauf abzielt, ein intelligentes Dialogsystem für Notizen zu schaffen. Das Projekt wurde von Build Fast mit...
vor 7 Monaten
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: Erzeugen hochwertiger Strichzeichnungen und Skizzen, Backpropagation von Bildwörtern, Installation des Pakets mit einem Klick

Allgemeine Einführung Sketch-Gen ist ein auf KI-Technologie basierendes Werkzeug zur Erstellung von Strichzeichnungen und Skizzen, das Künstlern und Designern helfen soll, schnell hochwertige Strichzeichnungen und Skizzen zu erstellen. Das aus dem Paints-UNDO-Projekt hervorgegangene Tool verwendet fortschrittliche maschinelle Lernmodelle, die...
vor 8 Monaten
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: ein quelloffenes multimodales Modell zur Unterstützung des Videoverstehens und mehrerer Dialogrunden

Umfassende Einführung CogVLM2 ist ein quelloffenes multimodales Modell, das von der Tsinghua University Data Mining Research Group (THUDM) entwickelt wurde. Es basiert auf der Llama3-8B-Architektur und zielt darauf ab, eine vergleichbare oder sogar bessere Leistung als GPT-4V zu bieten. Das Modell unterstützt Bildverständnis, Mehrrunden-Dialog und visuelle...
vor 6 Monaten
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: ein Python-Client, der den Prozess der Ausführung eines intelligenten Körpers demonstriert und eine intuitive grafische Benutzeroberfläche bietet

Umfassende Einführung AgentClientDemo ist ein umfassendes Python-Projekt, das intelligente (Agent) und Client-Funktionen (Client) integriert. Das Projekt basiert auf dem PyQt-Framework und bietet eine intuitive und einfach zu bedienende grafische Benutzeroberfläche (G...
vor 8 Monaten
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: Open-Source-Tool zur Erkennung von LLM-Schwachstellen und zur Sicherung generativer KI

Umfassende Einführung NVIDIA Garak ist ein Open-Source-Tool, das speziell für die Erkennung von Schwachstellen in Large Language Models (LLMs) entwickelt wurde. Es prüft das Modell auf mehrere Schwachstellen wie Illusionen, Datenlecks, Hint-Injektion, Erzeugung von Fehlermeldungen, Erzeugung schädlicher Inhalte usw. durch statische, dynamische und adaptive Prüfung...
vor 9 Monaten
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: ein Modell für multimodales Verstehen auf der Endseite, das multimodales Verstehen und Analysieren von Text, Bild und Audio unterstützt

Umfassende Einführung Infini-Megrez ist eine Edge-Intelligence-Lösung, die von der unquestioned core dome (Infinigence AI) entwickelt wurde und darauf abzielt, ein effizientes multimodales Verständnis und eine effiziente Analyse durch gemeinsames Design von Hardware und Software zu erreichen. Das Kernstück des Projekts ist das Megrez-3B-Modell, das Graphen...
vor 7 Monaten
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: ein Schreibrahmen für die Erstellung hochwertiger langer Aufsätze, die Suche nach externem Wissen und die anschließende Reflexion darüber sowie der schrittweise Aufbau eines Wissensbaums

Umfassende Einführung OmniThink ist ein innovatives Framework für maschinelles Schreiben, das entwickelt wurde, um qualitativ hochwertige Essays zu erstellen, indem es die iterative Erweiterung und Reflexion menschlicher kognitiver Prozesse nachahmt. OmniThink konzentriert sich darauf, die Grenzen des Wissens zu erweitern und Informationen zu generieren, die reichhaltig und tiefgründig...
vor 7 Monaten
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

Umfassende Einführung Step-Video-T2V ist ein fortschrittliches Text-zu-Video-Konvertierungsmodell von StepFun AI (StepFun Star). Das Modell hat 3 Milliarden Parameter und ist in der Lage, Videos mit bis zu 204 fps zu erzeugen. Mit einem stark komprimierten Variablen Auto-Encoder (VAE) ist das Modell...
vor 6 Monaten
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Statisches Portrait Map Referenzvideo Portrait Motion Generation Video

Allgemeine Einführung Thin-Plate-Spline-Motion-Model ist ein bahnbrechendes Projekt zur Erzeugung von Bildanimationen, das auf der CVPR 2022 vorgestellt wurde. Das Projekt basiert auf der Theorie der Thin-Plate-Spline-Transformationen und ist in der Lage, qualitativ hochwertige Bewegungen aus Standbildern auf Basis von Fahrvideos zu erzeugen...
vor 7 Monaten
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

KI-Investitionssystem: automatisiertes System zur Entscheidungsfindung bei Investitionen in A-Aktien, das ein Multi-Intelligenz-System zur Analyse von Marktdaten nutzt

Umfassende Einführung A_Share_investment_Agent ist eine auf einem Multi-Intelligenz-System basierende Anlageentscheidungshilfe für A-Aktien. Das System wurde entwickelt, um Marktdaten zu analysieren, den inneren Wert von Aktien zu berechnen, die Marktstimmung zu analysieren und Fundamentaldaten durch mehrere kollaborative Intelligenzen zu...
vor 7 Monaten
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: Shangtangs quelloffenes Low-Code-Entwicklungstool zur Erstellung multiintelligenter Körperanwendungen

Umfassende Einführung LazyLLM ist ein Open-Source-Tool, das vom LazyAGI-Team entwickelt wurde und sich auf die Vereinfachung des Entwicklungsprozesses von Multi-Intelligenz-Anwendungen mit großen Modellen konzentriert. Es hilft Entwicklern bei der schnellen Erstellung komplexer KI-Anwendungen durch eine Ein-Klick-Bereitstellung und leichtgewichtige Gateway-Mechanismen, die eine mühsame technische Konfiguration...
vor 6 Monaten
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Chinesischer Vollblut-DeepSeek-R1-Destillationsdatensatz, unterstützt chinesischen R1-Destillations-SFT-Datensatz

Umfassende Einführung Der chinesische DeepSeek-R1-Destillationsdatensatz ist ein chinesischer Open-Source-Datensatz mit 110.000 Daten, der zur Unterstützung der Forschung im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache entwickelt wurde. Der Datensatz wird vom NLP-Team von Cong Liu veröffentlicht und enthält nicht nur mathematische Daten, sondern auch eine große Anzahl allgemeiner...
vor 6 Monaten
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: WeChat Gruppenchat Intelligenter Assistent Client für Windows

Umfassende Einführung WeChatAI ist ein Python-basierter WeChat-Gruppen-Chat und persönlicher intelligenter Assistent, der eine Vielzahl von großen Sprachmodellen (wie DeepSeek, Gemini, Tongyi Thousand Questions) unterstützt, die intelligente Dialoge, automatische Antworten und andere Funktionen erreichen können. Das Projekt verwendet moderne ...
vor 6 Monaten
02.7K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: ein voll funktionsfähiger, leichtgewichtiger, plattformübergreifender AI-Client mit erweiterbaren Plug-Ins

Umfassende Einführung AIaW (AI as Workspace) ist ein KI-Client der nächsten Generation, der voll funktionsfähige, leichtgewichtige und erweiterbare Lösungen bietet. Die Plattform unterstützt eine Vielzahl von Dienstleistern, darunter OpenAI, Anthropic und Google, und ist in der Lage,...
vor 8 Monaten
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: ein Open-Source-Toolkit zur Anbindung von KI-Intelligenzen an das Solana-Protokoll

Allgemeine Einführung Solana Agent Kit ist ein Open-Source-Toolkit, das entwickelt wurde, um KI-Intelligenzen nahtlos mit dem Solana-Blockchain-Protokoll zu verbinden. Das Kit ermöglicht es sowohl KI-Forschern als auch Entwicklern von Kryptowährungen, beliebige modelltrainierte intelligente Körper zu verwenden, um...
vor 6 Monaten
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdown-Editor: einfache und effiziente WeChat-Grafik-Layout-Tools, ein Schlüssel zum Einfügen der Artikel auf der WeChat-öffentlichen Nummer

Umfassende Einführung Der WeChat Markdown Editor (WeChat Markdown Editor) ist ein sehr übersichtliches WeChat-Grafik-Layout-Tool, mit dem Benutzer leicht schöne WeChat-Posts erstellen können. Der Editor unterstützt alle grundlegenden Markdown ...
vor 7 Monaten
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: Abrufen von Inhalten und Zusammenfassen von Wissen aus umfangreichen Dokumenten aus mehreren Quellen

Umfassende Einführung wdoc ist ein leistungsfähiges RAG-System (Retrieval Augmentation Generation), das für die Verarbeitung und Analyse einer großen Anzahl unterschiedlicher Dokumente entwickelt wurde. Es ist in der Lage, eine Vielzahl von Dokumenttypen abzurufen, darunter PDFs, Webseiten, YouTube-Videos, Audiodateien usw. wdoc eignet sich besonders für die Verarbeitung...
vor 6 Monaten
02.7K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Open-Source-KI-Plattform für Sprachinterviews generiert individuelle Interviewfragen und führt intelligente Analysen durch

Allgemeine Einführung FoloUp ist eine Open-Source-Plattform, die KI-gestützte Sprachinterview-Lösungen für Unternehmen bietet. Mit FoloUp können Unternehmen schnell maßgeschneiderte Interviewfragen für Stellenbeschreibungen erstellen und natürliche Gesprächsinterviews mit KI durchführen. Die Plattform bietet auch detaillierte Interview-Analysen...
vor 5 Monaten
02.7K