AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1
Insgesamt 920 Artikel

Tags: KI Open-Source-Projekte Seite 5

Second Me:本地训练拥有个人记忆和习惯的AI分身-首席AI分享圈

Second Me: lokal trainierte KI-Doppelgänger mit persönlichen Erinnerungen und Gewohnheiten

Second Me ist ein vom Mindverse-Team entwickeltes Open-Source-Projekt, mit dem Sie auf Ihrem Computer eine KI erstellen können, die wie ein "digitaler Doppelgänger" agiert, Ihre Sprache und Gewohnheiten durch Ihre Worte und Erinnerungen lernt und zu einem intelligenten Assistenten wird, der Sie versteht. Seine beste Eigenschaft ist, dass alle Zahlen...

StarVector:从图像和文字生成SVG矢量图的基础模型-首席AI分享圈

StarVector: ein Basismodell zur Erzeugung von SVG-Vektorgrafiken aus Bildern und Text

Allgemeine Einführung StarVector ist ein Open-Source-Projekt, das von Entwicklern wie Juan A. Rodriguez ins Leben gerufen wurde, um Bilder und Text in skalierbare Vektorgrafiken (SVG) zu konvertieren. Dieses Tool verwendet ein visuelles Sprachmodell, das den Bildinhalt und die Textanweisungen versteht, um qualitativ hochwertigen SVG-Code zu erzeugen ...

MarkPDFDown:基于多模态模型将PDF转为Markdown文件-首席AI分享圈

MarkPDFDown: Konvertierung von PDF in Markdown basierend auf einem multimodalen Modell

Allgemeine Einführung MarkPDFDown ist ein Open-Source-Tool. Es nutzt die Vorteile des multimodalen großen Sprachmodells, um PDF-Dateien in das Markdown-Format zu konvertieren. Der Entwickler ist GitHub-Benutzer jorben. Das Ziel dieses Tools ist einfach: PDF-Dokumente einfacher zu bearbeiten und zu teilen. Es erkennt Überschriften,...

Easy Dataset:创建大模型微调数据集的简易工具-首席AI分享圈

Easy Dataset: Ein einfaches Tool zur Erstellung großer, fein abgestimmter Modelldatensätze

Umfassende Einführung Easy Dataset ist ein Open-Source-Tool, das speziell für die Feinabstimmung großer Modelle (LLMs) entwickelt wurde und auf GitHub gehostet wird. Es bietet eine einfach zu bedienende Schnittstelle, die es Benutzern ermöglicht, Dateien hochzuladen, Inhalte automatisch aufzuteilen, Fragen und Antworten zu generieren und schließlich strukturierte Datensätze auszugeben, die für die Feinabstimmung geeignet sind. Öffnen ...

Skywork-R1V:昆仑万文开源的图文混合多模态推理模型-首席AI分享圈

Skywork-R1V: Ein grafisches hybrides multimodales Reasoning-Modell Open Source von Kunlun Wanwen

Allgemeine Einführung Skywork-R1V ist ein vom SkyworkAI-Team (Kunlun Wanwei) entwickeltes und auf GitHub veröffentlichtes Open-Source-Modell für multimodale Schlussfolgerungen, das in der Lage ist, Bilder und Text gleichzeitig zu verarbeiten, logische Schlussfolgerungen in mehreren Schritten durchzuführen und besonders gut komplexe Bildprobleme zu analysieren. Das Modell wurde am 18. März 2025 offiziell vorgestellt...

AI Logo:AI快速生成定制化品牌Logo-首席AI分享圈

AI Logo: AI generiert schnell maßgeschneiderte Markenlogos

Allgemeine Einführung AI Logo ist ein Open-Source-KI-Anwendungsprojekt mit dem Ziel, Benutzern zu helfen, schnell personalisierte Markenlogos durch künstliche Intelligenz zu erstellen. Es kombiniert leistungsstarke KI-Techniken wie Stable Diffusion und DeepAI, um den Nutzern zu ermöglichen, einfache Markeninformationen einzugeben und qualitativ hochwertige Logodesigns zu erhalten. Diese...

Docs:开源的协作笔记和文档管理工具-首席AI分享圈

Docs: Open-Source-Tools für die gemeinsame Verwaltung von Notizen und Dokumenten

Allgemeine Einführung Docs ist eine Open-Source-Plattform für die kollaborative Erstellung von Notizen und die Verwaltung von Dokumenten, die vom suitenumerique-Team entwickelt wurde. Sie wurde unter Verwendung von Django und React-Technologien mit dem Ziel entwickelt, ein einfach zu bedienendes Tool bereitzustellen, das Benutzern hilft, Notizen zu machen, Dokumente zu verwalten und Wissen zu teilen. Diese Plattform unterstützt mehrere Personen...

SmartRead:自动标注技术PDF文档并提供相关引用源-首席AI分享圈

SmartRead: Technische PDF-Dokumente automatisch mit Anmerkungen versehen und mit relevanten Zitaten versehen

Umfassende Einführung SmartRead ist ein KI-basiertes Open-Source-Tool, das für technische Dokumente entwickelt wurde. Es analysiert automatisch PDF-Dateien und kommentiert Schlüsselinhalte wie wichtige Begriffe, Überschriften oder Kernideen, um dem Benutzer zu helfen, komplexe Dokumente schnell zu verstehen. Gleichzeitig kann es auch Artikel und Videos zum Thema des Dokuments bereitstellen...

Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具-首席AI分享圈

Hunyuan3D-2: Tencent Open-Source-Tool zur Erzeugung hochauflösender 3D-Modelle

Allgemeine Einführung Hunyuan3D-2 ist ein von Tencent entwickeltes Open-Source-Projekt, das darauf abzielt, hochauflösende 3D-Modelle aus Text oder Bildern zu erzeugen. Es besteht aus zwei Kernkomponenten: dem Formerzeugungsmodell (Hunyuan3D-DiT) und dem Texturerzeugungsmodell (Hunyuan3D-Paint). Benutzer können Textbeschreibungen oder Bilder eingeben...

LangManus:支持多智能体协作的开源AI自动化框架-首席AI分享圈

LangManus: ein quelloffenes KI-Automatisierungsframework, das die Zusammenarbeit mehrerer Intelligenzen unterstützt

Allgemeine Einführung LangManus ist ein Open-Source-KI-Automatisierungsframework, das auf GitHub gehostet wird. Es wurde von einer Gruppe ehemaliger Kollegen in ihrer Freizeit entwickelt und ist ein akademisch getriebenes Projekt mit dem Ziel, Sprachmodelle und spezialisierte Tools zu kombinieren, um Aufgaben wie Websuche, Daten-Crawling und Codeausführung durchzuführen. Das Framework verwendet Multi-Agenten...

闲鱼卖家全天自动值守的AI客服机器人-首席AI分享圈

KI-Kundendienst-Bots, die den ganzen Tag über automatisch mit untätigen Verkäufern besetzt sind

Umfassende Einführung XianyuAutoAgent ist ein intelligentes Kundendienst-Robotersystem, das speziell für die Idlefish-Plattform entwickelt wurde und vom Entwickler shaxiu auf GitHub zur Verfügung gestellt wird. Es leistet 7×24 Stunden automatisierten Dienst durch KI-Technologie, um Idlefish-Verkäufern bei der Beantwortung von Nachrichten, Verhandlungen und technischer Beratung zu helfen. Zu den Kernfunktionen gehören ...

Seed-VC:支持少样本实时转换语音和歌声-首席AI分享圈

Seed-VC: unterstützt die Echtzeitkonvertierung von Sprache und Gesang mit weniger Samples

Allgemeine Einführung Seed-VC ist ein Open-Source-Projekt auf GitHub, entwickelt von Plachtaa. Es kann ein Stück Referenz-Audio von 1 bis 30 Sekunden verwenden, um schnell zu erreichen Stimme oder Song-Konvertierung , ohne zusätzliche Ausbildung. Das Projekt unterstützt Echtzeit-Sprachkonvertierung, Latenz so niedrig wie 400 Millisekunden oder so, geeignet für Online-Meetings ...

PilottAI:构建企业级多智能体应用的开源项目-首席AI分享圈

PilottAI: Ein Open-Source-Projekt zur Entwicklung von Multi-Intelligenz-Anwendungen für Unternehmen

Allgemeine Einführung PilottAI ist ein Open-Source-Python-Framework auf GitHub gehostet und von Entwickler anuj0456 erstellt. Es konzentriert sich auf die Unterstützung der Benutzer bauen Enterprise-Class-Multi-Intelligenz Körper-System, Unterstützung für große Sprachmodell (LLM) Integration, die Bereitstellung von Task Scheduling, dynamische Expansion und fehlertolerante Mechanismus und andere features.Pi...

HumanOmni:分析人类视频情感和动作的多模态大模型-首席AI分享圈

HumanOmni: ein multimodales Makromodell zur Analyse menschlicher Videoemotionen und -handlungen

Allgemeine Einführung HumanOmni ist ein quelloffenes multimodales Big Model, das vom HumanMLLM-Team entwickelt und auf GitHub gehostet wird. Es konzentriert sich auf die Analyse von menschlichem Video und kann sowohl Bild als auch Ton verarbeiten, um Emotionen, Handlungen und Dialoginhalte zu verstehen. Für das Projekt wurden 2,4 Millionen menschenzentrierte Videoclips und...

de_DEDeutsch