AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 992 Artikel

Tags: KI Open-Source-Projekte Seite 46

CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签-首席AI分享圈

CosyVoice: Open-Source-Projekt zum Klonen von 3-Sekunden-Stimmen von Ali mit Unterstützung für gefühlsgesteuerte Tags

Umfassende Einführung CosyVoice ist ein mehrsprachiges, groß angelegtes Spracherzeugungsmodell, das von der Inferenz über das Training bis hin zum Einsatz umfassende Funktionen bietet. Es wurde vom FunAudioLLM-Team entwickelt und zielt darauf ab, eine qualitativ hochwertige Sprachsynthese durch fortschrittliche autoregressive Transformatoren und ODE-basierte Diffusionsmodelle zu erreichen....

Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务-首席AI分享圈

Fabric: ein KI-Open-Source-Workflow-Framework, das viele Stichworte zur effizienten Bearbeitung einer Vielzahl von Transaktionen integriert

Allgemeine Einführung Fabric ist ein Open-Source-KI-Framework, das von Daniel Miessler entwickelt wurde, um alltägliche Computeraufgaben zu vereinfachen und zu automatisieren und künstliche Intelligenz leichter nutzbar zu machen. Es hilft Benutzern, eine Vielzahl von Aufgaben wie Inhaltszusammenfassung und Datenextraktion durch modularen Aufbau und vordefinierte Eingabeaufforderungen (Patterns) effizient zu erledigen...

NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案-首席AI分享圈

NocoDB: Erstellen von Smart Tables in mehreren Datenbanken, Open Source Airtable Alternative

Allgemeine Einführung NocoDB ist eine Open-Source-Alternative zu Airtable, die ein leistungsfähiges und einfach zu bedienendes Online-Datenbankmanagement-Tool darstellt. Mit NocoDB können Benutzer auf einfache Weise Daten aus Datenbanken erstellen, lesen, aktualisieren und löschen, ohne Code schreiben zu müssen. Die Plattform unterstützt eine breite Palette von Datenbanktypen,...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO: ein Werkzeug für sprachgenerierte koordinierte Gestenportraits eines digitalen Ganzkörpermenschen

Allgemeine Einführung TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) ist ein von der Universität Tokio und CyberAgent AI Labs entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprach-Gesten-Videos Ein von der Universität Tokio und CyberAgent AI Lab gemeinsam entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprachgestenvideos. Die ...

Behebt ungültige JSON-Zeichenfolgen und behebt mögliche Formatierungsfehler in von LLMs generierten JSON-Daten.

Allgemeine Beschreibung Ein Modul zur Korrektur ungültiger JSON-Dateien, insbesondere zum Parsen falscher JSON-Daten, die von Large Language Models (LLMs) ausgegeben werden. Das Modul kann häufige JSON-Syntaxfehler wie fehlende Anführungszeichen, falsche Kommas, nicht abgeschriebene Zeichen und unvollständige Schlüssel-Wert-Paare beheben. Es kann auch selbst...

Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型-首席AI分享圈

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

Allgemeine Einführung Kolors Virtual Try-On ist eine virtuelle Anprobe-App des Kwai-Kolors-Teams auf der Hugging Face-Plattform. Die App nutzt fortschrittliche Technologie der künstlichen Intelligenz, um den Nutzern zu helfen, verschiedene Farben von Kleidung in einer virtuellen Umgebung anzuprobieren, um die beste Passform für sie zu finden. Mit...

Pyramid Flow:快手推出的开源版

Pyramid Flow: eine von Racer eingeführte Open-Source-Version von "Kringle", die auf SD3 basiert und auf Grafikprozessoren mit weniger als 8 GB läuft (Version mit Ein-Klick-Bereitstellung)

Allgemeine Einführung Pyramid Flow ist ein effizientes autoregressives Verfahren zur Videogenerierung, das auf der Flow-Matching-Technik basiert. Die Methode ermöglicht die Generierung und Dekomprimierung von Videoinhalten mit höherer Recheneffizienz durch Interpolation zwischen verschiedenen Auflösungen und Rauschpegeln....

Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署-首席AI分享圈

Dify: Generative KI-Anwendungsentwicklungsplattform, visuelle Orchestrierung, Unterstützung bei der privaten Bereitstellung

Umfassende Einführung Dify ist eine Open-Source-Plattform für die Entwicklung generativer KI-Anwendungen, die Entwicklern helfen soll, schnell native KI-Anwendungen auf der Grundlage von Large Language Models (LLMs) zu erstellen und zu betreiben. Die Plattform bietet eine Vielzahl von Funktionen von der Agentenkonstruktion bis zur KI-Workflow-Orchestrierung, RAG-Abruf, Modellmanagement usw., die die Entwicklung von...

Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)-首席AI分享圈

Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)

Umfassende Einführung Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur sehr leistungsfähig, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können PDF schnell und präzise in Markdown konvertieren, einschließlich Tabellen...

ModelBest(面壁智能):全球领先的轻量高性能端侧大模型-首席AI分享圈

ModelBest: Das weltweit führende leichtgewichtige, leistungsstarke End-Side Big Model

Allgemeine Einführung ModelBest ist ein Unternehmen, das sich auf die Entwicklung von leichtgewichtigen und leistungsstarken Großmodellen konzentriert, um fortschrittliche KI-Technologien auf Mainstream-Unterhaltungselektronik und verschiedene Endgeräte des täglichen Lebens anzuwenden. Seine MiniCPM-Serie von Endseitenmodellen ist bekannt für ihre extreme Rechenleistung und Speichernutzungseffizienz, die geringe Anzahl von Parametern,...

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案-首席AI分享圈

Podcastfy: Multi-Source Content to Multilingual Audio Conversation Tool, eine Open-Source-Alternative zu den Podcasting-Funktionen von NotebookLM

Allgemeine Einführung Podcastfy ist ein Open-Source-Python-Paket, das die Technologie der generativen künstlichen Intelligenz (GenAI) nutzt, um Webinhalte, PDF-Dateien, Texte, Bilder, YouTube-Videos und viele andere Quellen in ansprechende mehrsprachige Audiodialoge zu konvertieren. Anders als herkömmliche Benutzerschnittstellen-basierte...

文多多 AiPPT:AI生成PPT,演讲稿生成-首席AI分享圈

Wenduoduo AiPPT: KI-generierte PPT, Präsentationserstellung

Umfassende Einführung AiPPT ist ein PPT-Generierungstool, das auf der Technologie der künstlichen Intelligenz basiert und dem Benutzer helfen soll, schnell professionelle Präsentationen zu erstellen. Es generiert automatisch inhaltsreiche, schön gestaltete Folien, indem es ein Thema eingibt, eine Datei hochlädt oder eine URL angibt, usw. Es unterstützt native Diagramme, Animationen und 3D-Effekte und andere komplexe...

Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频-首席AI分享圈

Easegen: Open-Source-Plattform für die Produktion von digitalen menschlichen Kursen, PPT Ein-Klick-Generation Klonen von digitalen menschlichen Vortragsvideos

Allgemeine Einführung Easegen ist eine Open-Source-Plattform zur Erstellung digitaler menschlicher Kurse, die darauf abzielt, die Effizienz der Produktion und Verwaltung von Lehrinhalten durch KI-Technologie zu verbessern. Die Plattform bietet eine Komplettlösung von der Kursproduktion über das Videomanagement bis hin zur intelligenten Befragung, die es den Nutzern ermöglicht, digitale Videokurse mit menschlicher Erklärung zu erstellen und KI zu nutzen ...

Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts-首席AI分享圈

Open Canvas: kollaborative Codebearbeitung, Open-Source-Version von OpenAI Canvas/Claude Artifacts

Allgemeine Einführung LangChain präsentiert Open Canvas, eine Open-Source-Webanwendung, die die Bearbeitung von Dokumenten und die Zusammenarbeit mit eingebauter Dual-Agent-Speicherfunktionalität und integriertem Smith zur Beobachtung aller Ausführungsdetails verbessern soll. Die Plattform ist von OpenAIs "Canvas" inspiriert, jedoch in mehrfacher Hinsicht...

AutoGen Studio:多代理系统AutoGen的简易用户界面版-首席AI分享圈

AutoGen Studio: Einfach zu bedienende Schnittstellenversion des Multiagentensystems AutoGen

Allgemeine Einführung AutoGen Studio 2.0 ist eine von AutoGen unterstützte Benutzeroberfläche, die den Prozess der Erstellung und Verwaltung von Multi-Agenten-Lösungen vereinfachen soll. Die Plattform ermöglicht es Anwendern, Agenten und ihre Arbeitsabläufe deklarativ zu definieren und zu modifizieren, und zwar über eine intuitive Oberfläche, die es auch Anfängern leicht macht,...

MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具-首席AI分享圈

MeetingMind: Intelligentes Open-Source-Tool zur Aufzeichnung und Zusammenfassung von Meetings, das auf OpenAI Whisper basiert

Allgemeine Beschreibung MeetingMind ist eine fortschrittliche KI-Anwendung, die entwickelt wurde, um die Effizienz der Erfassung und Zusammenfassung von Geschäftsbesprechungen zu verbessern. Die App integriert die Whisper-Technologie von OpenAI für eine akkurate Sprache-zu-Text-Umwandlung und nutzt die KI von IBM Watson zur Analyse und Extraktion der wichtigsten Punkte im transkribierten Text....

Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能-首席AI分享圈

Coqui TTS (xTTS): ein Deep-Learning-Toolkit für die Text-zu-Sprache-Erzeugung mit mehrsprachiger Unterstützung und Funktionen zum Klonen von Stimmen

Umfassende Einführung Coqui TTS ist ein Open-Source-Toolkit zur Erzeugung von Text-to-Speech (TTS), das auf Deep-Learning-Techniken basiert. Es wurde sowohl in Forschungs- als auch in Produktionsumgebungen erprobt und bietet eine Vielzahl von Funktionen und Modellen, die die Text-zu-Sprache-Umwandlung in mehreren Sprachen unterstützen.Coqui TTS unterstützt nicht nur...

MemFree:本地知识库与搜索信息混合的AI搜索引擎-首席AI分享圈

MemFree: eine KI-Suchmaschine, die lokale Wissensdatenbanken mit Suchinformationen verknüpft

Allgemeine Einführung MemFree ist eine fortschrittliche hybride KI-Suchmaschine, die in der Lage ist, Texte, Bilder, Dokumente und Webseiten zu durchsuchen und Fragen zu stellen. Es bietet einen Ein-Klick-Zugang zu Suchergebnissen für Text, Mindmaps, Bilder und Videos. Das Ziel von MemFree ist es, die Wissensbasis des Benutzers und das gesamte Internet zu erfassen...

de_DEDeutsch