AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1
Insgesamt 958 Artikel

Tags: KI Open-Source-Projekte Seite 25

CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率-首席AI分享圈

CHRONOS: Tool zur Zusammenfassung von Zeitleisten zur Verbesserung der Effizienz bei der Suche nach Nachrichten und der Erstellung von Zeitleisten

Allgemeine Einführung CHRONOS ist ein vom Alibaba NLP-Team entwickeltes Tool zur Zusammenfassung von Zeitleisten in Nachrichten. Das Tool generiert Zusammenfassungen von Nachrichtenereignissen mittels iterativer Selbstbefragung. CHRONOS ist nicht nur in der Lage, Aufgaben zur Zusammenfassung von Zeitleisten in offenen Domänen zu bewältigen, sondern verbessert auch die Effizienz und Skalierbarkeit in...

Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体-首席AI分享圈

Go-with-the-Flow: Steuert die Bewegung von Objekten im Video, wobei alle sich bewegenden Objekte im Video addiert oder subtrahiert werden.

Allgemeine Einführung Go-with-the-Flow ist ein Open-Source-Projekt, das vom Forschungsteam der Netflix Eyeline Studios entwickelt wurde, um die Bewegungsmuster von Video-Diffusionsmodellen durch Verzerrung des Rauschens zu steuern. Das Projekt ermöglicht es den Benutzern zu bestimmen, wie sich Kameras und Objekte in einer Szene bewegen, und kann sogar ein Video bewegen...

X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞-首席AI分享圈

X-Dyna: Still Portrait Reference Video Pose Generation Video um Missys Fotos tanzen zu lassen

Allgemeine Einführung X-Dyna ist ein Open-Source-Projekt, das von ByteDance entwickelt wurde, um dynamische Porträtanimationen durch Zero-Sample-Diffusion-Techniken zu erzeugen. Das Projekt nutzt Gesichtsausdrücke und Körperbewegungen im Laufwerksvideo, um einzelne Porträtbilder zu animieren und so realistische und kontextbezogene Bewegungseffekte zu erzeugen.X-Dyna...

腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流-首席AI分享圈

Tencent Hybrid 3D (Hunyuan3D): Erzeugung hochauflösender 3D-Assets, mehrere Workflows zur Erzeugung von 3D-Material

Umfassende Einführung Tencent Hunyuan3D (Hunyuan3D 2.0) ist ein fortschrittliches 3D-Großsynthesesystem von Tencent, das für die Erzeugung hochauflösender texturierter 3D-Assets entwickelt wurde. Das System umfasst zwei Kernkomponenten: Hunyuan3D-DiT, ein Modell für die Erzeugung von Formen in großem Maßstab, und Hunyuan3D-Paint, ein Modell für die Textursynthese in großem Maßstab...

RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库-首席AI分享圈

RAG Web UI: Aufbau eines intelligenten Dokumenten-Q&A-Systems und einfache Erstellung einer privaten web-seitigen Wissensdatenbank

Umfassende Einführung RAG Web UI ist ein intelligentes Dialogsystem, das auf der RAG-Technologie (Retrieval Augmented Generation) basiert. Es hilft Unternehmen und Einzelpersonen, intelligente Q&A-Systeme auf der Grundlage ihrer eigenen Wissensbasis zu erstellen. Durch die Kombination von Dokumentensuche und großen Sprachmodellen bietet RAG Web UI genaue und zuverlässige Wissens-Q&A-Dienste. Das System unterstützt...

UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用-首席AI分享圈

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern.UI-TARS Desktop unterstützt plattformübergreifende...

Devin Cursor Rules: Cursor und Windsurfing für Devin verbessert

Allgemeine Einführung Devin Cursor Rules ist ein Open-Source-Projekt, das darauf abzielt, die integrierten Entwicklungsumgebungen (IDEs) Cursor und Windsurf mit Konfigurationsdateien und Werkzeugen zu erweitern, um ihnen erweiterte KI-Fähigkeiten ähnlich wie Devin zu verleihen. Das Projekt bietet Prozessplanung, Selbstevolution, erweiterte Werkzeugnutzung (z.B. Webbrowsing...

Repomix:打包代码库为一个文本文件以便大模型检索-首席AI分享圈

Repomix: Verpackung der Code-Basis in eine Textdatei für den Abruf großer Modelle

Allgemeine Einführung Repomix (früher bekannt als Repopack) ist ein Open-Source-Tool, das entwickelt wurde, um eine gesamte Codebasis in eine einzige, KI-freundliche Datei zu packen. Mit diesem Tool können Entwickler ihre Codebasis auf einfache Weise großen Sprachmodellen (wie Claude, ChatGPT und Gemini) zur Analyse und Verarbeitung zur Verfügung stellen...

Yek:读取git仓库文本文件并快速分块,以供大模型使用-首席AI分享圈

Yek: Lesen von Textdateien aus dem Git-Repository und schnelles Chunking für große Modelle

Allgemeine Einführung Yek ist ein schnelles Rust-basiertes Werkzeug zum Lesen von Textdateien aus Repositories oder Verzeichnissen, zum Chunking und zur Serialisierung für die Verwendung in Large Language Models (LLMs). Das Werkzeug verwendet standardmäßig die .gitignore-Regel, um nicht benötigte Dateien zu überspringen, und nutzt die Git-Historie, um wichtige Dateien zu ermitteln...

Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果-首席AI分享圈

Kheish: Multi-Rollen-Intelligenz, die den Output überprüft, validiert und formatiert, um qualitativ hochwertige Ergebnisse zu erzielen

Umfassende Einführung Kheish ist ein quelloffener Multi-Rollen-Agent, der für Large Language Modelling (LLM)-Aufgaben entwickelt wurde, die eine strukturierte, schrittweise Zusammenarbeit erfordern.Kheish ist mehr als nur ein einfacher Koordinator, er ist ein intelligenter Agent, der bei Bedarf Module anfordert,...

AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具-首席AI分享圈

AI ContentCraft: ein vielseitiges Tool zur Erstellung von KI-Inhalten für Kurzgeschichten, Dialogskripte, Voiceover und Grafiken

Allgemeine Beschreibung AI ContentCraft ist ein vielseitiges Tool für die Erstellung von Inhalten, das Texterstellung, Sprachsynthese, Bilderzeugung und vieles mehr integriert. Es hilft Erstellern, schnell Geschichten, Podcast-Skripte und begleitende Audio- und Videoinhalte zu erstellen. Das Tool unterstützt mehrere Sprachkonvertierungen, kann Inhalte im Stapel verarbeiten und ist extrem...

Unigraph:构建本地运行的知识图谱和个人搜索引擎-首席AI分享圈

Unigraph: Aufbau von lokal laufenden Wissensgraphen und persönlichen Suchmaschinen

Allgemeine Einführung Unigraph ist ein lokaler, universeller Wissensgraph und eine persönliche Suchmaschine, die Benutzern einen integrierten Arbeitsbereich zur Verwaltung und Suche einer Vielzahl von Daten in ihrem persönlichen Leben bieten soll. Mit Unigraph können Benutzer Daten aus verschiedenen Quellen in einen einheitlichen Wissensgraphen integrieren...

ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程-首席AI分享圈

ComfyUI disty Flow: Eine benutzerfreundliche Schnittstelle für ComfyUI zur Rationalisierung von Arbeitsabläufen

Allgemeine Einführung ComfyUI-disty-Flow ist ein benutzerdefinierter Knoten, der eine benutzerfreundliche Schnittstelle zu ComfyUI bietet. ComfyUI-disty-Flow soll die Ausführung von Workflows vereinfachen, indem es alternative Benutzeroberflächen zur Verfügung stellt, anstatt die Erstellung von Workflows zu ersetzen.ComfyUI-disty-Flow befindet sich derzeit in einem frühen Entwicklungsstadium,...

Shortest:AI自动化测试工具,使用自然语言进行端到端测试-首席AI分享圈

Shortest: ein KI-Tool für automatisierte Tests, das natürliche Sprache für End-to-End-Tests verwendet

Allgemeine Einführung Shortest ist ein KI-gestütztes End-to-End-Testframework in natürlicher Sprache, das vom Anti-Work-Team entwickelt wurde. Es basiert auf Playwright und unterstützt die GitHub-Integration und die Zwei-Faktor-Authentifizierung (2FA). Shortests Hauptmerkmal ist das Schreiben von Testfällen in natürlicher Sprache und die Verwendung von Anthropic Cl...

Midscene.js:用AI驱动浏览器自动化测试的开源插件-首席AI分享圈

Midscene.js: ein Open-Source-Plugin, das Browser-Automatisierungstests mit KI unterstützt

Allgemeine Einführung Midscene.js ist ein KI-gesteuertes Browser-Automatisierungstool, das in der Lage ist, Webseiten zu steuern, Assertions auszuführen und Daten durch natürlichsprachliche Befehle zu extrahieren. Es unterstützt Chrome-Erweiterungen, JavaScript-SDKs und YAML-Skripte und vereinfacht so das Schreiben und Warten von UI-Tests. Durch die Nutzung multimodaler großer ...

视频分析工具(Video Analyzer):分析视频内容并生成详细描述-首席AI分享圈

Video Analyzer: analysiert Videoinhalte und erstellt detaillierte Beschreibungen

Comprehensive Introduction Video Analyzer ist ein umfassendes Videoanalysetool, das Computer Vision, Audiotranskription und Techniken zur Verarbeitung natürlicher Sprache kombiniert, um detaillierte Beschreibungen von Videoinhalten zu erstellen. Das Tool extrahiert Schlüsselbilder aus dem Video, transkribiert den Audioinhalt und generiert natürlichsprachliche...

Unsloth:高效微调和训练大语言模型的开源工具-首席AI分享圈

Unsloth: ein Open-Source-Tool für die effiziente Feinabstimmung und das Training großer Sprachmodelle

Umfassende Einführung Unsloth ist ein Open-Source-Projekt, das effiziente Werkzeuge für die Feinabstimmung und das Training von Large Language Models (LLMs) bereitstellt. Das Projekt unterstützt eine breite Palette bekannter Modelle, darunter Llama, Mistral, Phi und Gemma usw. Die wichtigsten Merkmale von Unsloth sind die Fähigkeit, den Speicherverbrauch erheblich zu reduzieren und das Training zu beschleunigen...

MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库-首席AI分享圈

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

Umfassende Einführung MaxKB (Max Knowledge Base) ist ein Open-Source-Wissensdatenbank-Q&A-System, das auf großen Sprachmodellen und RAG (Retrieval Augmented Generation) basiert. Das System ist weit verbreitet in intelligenten Kundenservice, unternehmensinterne Wissensdatenbank, akademische Forschung und Bildung und andere Szenarien verwendet.MaxKB unterstützt direkte Upload-Dokumente oder automatisch crawlen in...

OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树-首席AI分享圈

OmniThink: ein Schreibrahmen für die Erstellung hochwertiger langer Aufsätze, die Suche nach externem Wissen und die anschließende Reflexion darüber sowie der schrittweise Aufbau eines Wissensbaums

Umfassende Einführung OmniThink ist ein innovatives Framework für maschinelles Schreiben, das entwickelt wurde, um qualitativ hochwertige, lange Artikel zu erstellen, indem es die iterative Erweiterung und Reflexion menschlicher kognitiver Prozesse nachahmt. Das Framework konzentriert sich darauf, die Grenzen des Wissens zu erweitern und Informationen zu generieren, die reichhaltig und tiefgründig sind.OmniThink generiert Artikel, indem es Umrisse und...

de_DEDeutsch