AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 958 Artikel

Tags: KI Open-Source-Projekte Seite 29

Ollama OCR:使用Ollama中视觉模型提取图像中的文本-首席AI分享圈

Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama

Umfassende Einführung Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket als auch als benutzerfreundliche Streamlit-Webanwendungsschnittstelle verfügbar. Es unterstützt mehrere ...

FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性-首席AI分享圈

FitDiT: Ein virtuelles Anprobetool mit hoher Wiedergabetreue zur Verbesserung der Authentizität von Kleidungsdetails

Umfassende Einführung FitDiT ist ein virtuelles Anprobesystem, das auf Diffusionstransformatoren (Diffusion Transformers) basiert. Das vom Tencent AI Lab entwickelte Projekt zielt darauf ab, die Grenzen herkömmlicher virtueller Anprobesysteme bei der Darstellung von Kleidungsdetails zu überwinden. FitDiT schlägt innovativ eine neue algorithmische Architektur vor, die...

Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频-首席AI分享圈

Thin-Plate-Spline-Motion-Model: Statisches Portrait Map Referenzvideo Portrait Motion Generation Video

Allgemeine Einführung Thin-Plate-Spline-Motion-Model ist ein bahnbrechendes Projekt zur Erzeugung von Bildanimationen, das auf der CVPR 2022 vorgestellt wurde. Das Projekt basiert auf der Theorie der Thin-Plate-Spline-Transformationen und ist in der Lage, qualitativ hochwertige Animationen von statischen Bildern auf der Grundlage von Fahrvideos zu erstellen. Das Projekt verwendet ein durchgängiges unüberwachtes Lernverfahren ...

DUIX:实时互动的智能数字人,支持多平台一键部署-首席AI分享圈

DUIX: Intelligente digitale Menschen für Echtzeit-Interaktion, die eine plattformübergreifende Bereitstellung mit einem Mausklick unterstützen

Allgemeine Einführung DUIX (Dialogue User Interface System) ist eine KI-gesteuerte Plattform für digitale menschliche Interaktion, die von Silicon Intelligence entwickelt wurde. Mit Open-Source-Funktionen für die digitale menschliche Interaktion können Entwickler auf einfache Weise umfangreiche Modellierungs-, automatische Spracherkennungs- (ASR) und Text-to-Speech-Funktionen (TTS) integrieren, um die Interaktion mit digitalen...

Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景-首席AI分享圈

Fay Digital Human Framework: Integration von Sprachmodellen und digitalen 3D-Charakteren zur Unterstützung verschiedener Anwendungsszenarien

Umfassende Einführung Fay ist ein Open-Source-Framework für virtuelle digitale 3D-Menschen, das Sprachmodelle und digitale Charaktere für eine Vielzahl von Anwendungsszenarien integriert, wie z.B. virtuelle Einkaufsführer, virtuelle Moderatoren, Assistenten, Kellner, Lehrer und sprach- oder textbasierte mobile Assistenten.Das Fay-Framework unterstützt die vollständige Offline-Nutzung und bietet Millisekunden...

MOFA Video:运动场适配技术将静态图像转换为视频-首席AI分享圈

MOFA Video: Motion Field Adaptation Technologie konvertiert Standbilder in Video

Allgemeine Einführung MOFA-Video ist ein fortschrittliches Werkzeug zur Erzeugung von Bildanimationen, das generative Techniken zur Anpassung von Bewegungsfeldern verwendet, um statische Bilder in dynamische Videos umzuwandeln. Es wurde in Zusammenarbeit mit der Universität Tokio und Tencent AI Lab entwickelt und wird auf der European Conference on Computer Vision (ECCV) 2024 vorgestellt.MOFA-Vi...

Amurex:开源AI会议记录助手,自动记录会议内容生成总结-首席AI分享圈

Amurex: Open-Source-KI-Assistent zur Aufzeichnung von Meetings, automatische Aufzeichnung von Meeting-Inhalten zur Erstellung von Zusammenfassungen

Allgemeine Einführung Amurex ist ein Open-Source-KI-Meeting-Assistent, der von The Personal AI Company entwickelt wurde und darauf abzielt, die Effizienz von Meetings durch intelligente Funktionen zu verbessern: Amurex kann in Echtzeit Ratschläge geben, intelligente Zusammenfassungen erstellen, Meeting-Inhalte aufzeichnen und automatisch Follow-up-E-Mails versenden. Sein Design konzentriert sich auf Transparenz, Sicherheit und...

Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手-首席AI分享圈

Agent Laboratory: automatisierter Code- und Studienschreibassistent für Forscher

Umfassende Einführung Agent Laboratory ist ein autonomer End-to-End-Forschungsworkflow, der Forschern helfen soll, ihre Forschungsideen zu verwirklichen. Das System besteht aus speziellen Agenten, die von umfangreichen Sprachmodellen gesteuert werden und den gesamten Forschungsablauf unterstützen - von der Literaturrecherche über die Entwicklung von Plänen bis hin zur Durchführung von Experimenten und dem Schreiben von Synthesen...

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)-首席AI分享圈

Kokoro TTS API: Dockerisierter FastAPI-Wrapper für schnelle Text-to-Speech (Kokoro-82M-Modell)

Umfassende Einführung Kokoro-FastAPI ist ein Docker-basiertes FastAPI-Paket, das für die Unterstützung des Text-to-Speech-Modells Kokoro-82M entwickelt wurde. Das Projekt unterstützt NVIDIA GPU-Beschleunigung und bietet Warteschlangenverarbeitung und Auto-Splicing, um die Sprachausgabe von rohem, gewachsenem Text effizienter und kohärenter zu machen. Das Projekt ...

CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点-首席AI分享圈

CoolCline: eine weitere verbesserte Version des intelligenten Programmierassistenten von Cline, die die Vorteile von ClineRoo Cline und Bao Cline vereint.

Allgemeine Beschreibung CoolCline ist ein leistungsstarker Programmierassistent, der die besten Eigenschaften von Cline, Roo Cline und Bao Cline kombiniert. Er arbeitet nahtlos mit Ihrer Befehlszeilenschnittstelle (CLI) und Ihrem Editor zusammen, um Ihnen die leistungsstärkste KI-Entwicklungserfahrung zu bieten.CoolCline ist ein Open-Source-Projekt...

J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持-首席AI分享圈

J.A.R.V.I.S.: Kontextabhängiger intelligenter Code-Assistent, Generieren und Ändern von Code, Multi-IDE-Unterstützung

Allgemeine Einführung J.A.R.V.I.S. (Just A Rather Very Intelligent System) ist ein intelligenter Code-Assistent, der Entwicklern bei der Code-Generierung und -Änderung sowie bei technischen Diskussionen mit Hilfe mehrerer moderner Sprachmodelle helfen soll. Das Projekt wurde von Danilo Falcao entwickelt und wird auf GitHub.J.... gehostet.

AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据-首席AI分享圈

KI-Investitionssystem: automatisiertes System zur Entscheidungsfindung bei Investitionen in A-Aktien, das ein Multi-Intelligenz-System zur Analyse von Marktdaten nutzt

Umfassende Einführung A_Share_investment_Agent ist eine auf einem Multi-Intelligenz-System basierende Anlageentscheidungshilfe für A-Aktien. Das System ist so konzipiert, dass es Handelssignale generiert, indem es mehrere zusammenarbeitende Intelligenzen nutzt, um Marktdaten zu analysieren, den inneren Wert einer Aktie zu berechnen, die Marktstimmung sowie Fundamentaldaten zu analysieren. Dieser Ansatz kann...

Company Researcher:公司研究工具,输入公司网址以获取详细研究信息-首席AI分享圈

Company Researcher: Ein Tool zur Unternehmensrecherche. Geben Sie die Webadresse eines Unternehmens ein, um detaillierte Informationen zu erhalten.

Allgemeine Einführung Company Researcher (Company Researcher) ist ein kostenloses und quelloffenes Tool, das den Nutzern helfen soll, einen schnellen und umfassenden Überblick über ein beliebiges Unternehmen zu erhalten. Geben Sie einfach die URL des Unternehmens ein, und das Tool sammelt umfassende Informationen aus dem Internet und präsentiert Informationen über die Organisation, ihre Produkte, Finanzierung, soziale Präsenz...

GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新-首席AI分享圈

GitPodcast: Verwandeln Sie Ihre GitHub-Repositories in Podcasts und hören Sie sich jederzeit und überall Code-Updates an!

Allgemeine Einführung GitPodcast ist ein innovatives Tool, das GitHub-Repositories in Podcasts verwandelt und es Entwicklern ermöglicht, Code-Updates jederzeit und überall anzuhören. Mithilfe von OpenAI und dem Azure Speech SDK ist GitPodcast in der Lage, GitHub-Repositories in Podcasts von Commit-Logs, Pull-Requests und Mileage...

Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统-首席AI分享圈

Paperless-AI: Automatische Analyse und Verschlagwortung von Dokumenten mittels KI für das Dokumentenmanagementsystem paperless-ngx

Allgemeine Einführung Paperless-AI ist ein innovatives Analyse-Tool zur Automatisierung von Dokumenten, das speziell für das Dokumentenmanagement-System Paperless-ngx entwickelt wurde. Es kombiniert geschickt die OpenAI API mit einer Vielzahl von fortschrittlichen KI-Modellen wie Ollama (einschließlich Mistral, LLaMA, PHI-3 und Gemma 2),...

Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体-首席AI分享圈

Mini LLM Flow: Aufbau von LLM-Mini-Intelligenzen mit "gerichteter Graphenstruktur" in 100 Codezeilen

Allgemeine Einführung miniLLMFlow ist ein minimalistisches Large Language Model (LLM)-Entwicklungsframework, das nur 100 Zeilen Kerncode enthält und die Designphilosophie "Der Weg ist einfach" unterstreicht. Das Framework wurde speziell dafür entwickelt, dass KI-Assistenten (z.B. ChatGPT, Claude, etc.) autonom programmiert werden können, mit Unterstützung für Multi-Intelligenz, Aufgabenzerlegung und...

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动-首席AI分享圈

Xiaozhi AI Chatbot: Erstellen Sie Ihren AI-Chatbot-Begleiter, einfacher Sprachdialog und intelligente Interaktion

Umfassende Einführung Xiaozhi AI Chatbot ist ein Open-Source-Projekt, das auf dem ESP32-Entwicklungsboard basiert und Benutzern helfen soll, ihren eigenen AI-Chat-Begleiter zu bauen. Das Projekt wird von Shrimp entwickelt und dient hauptsächlich zu Lehrzwecken, um mehr Menschen den Einstieg in die Entwicklung von KI-Hardware zu erleichtern und zu verstehen, wie man das große Sprachmodell auf tatsächliche Hardwaregeräte anwendet...

de_DEDeutsch