AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1
Insgesamt 928 Artikel

Tags: KI Open-Source-Projekte Seite 13

DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)-首席AI分享圈

DeepGEMM: Eine Open-Source-Bibliothek mit effizienter Unterstützung für FP8-Matrixoperationen (DeepSeek Open-Source-Woche Tag 3)

Allgemeine Einführung DeepGEMM ist eine quelloffene FP8 GEMM (Generalised Matrix Multiplication) Bibliothek, die vom DeepSeek Team entwickelt wurde und sich auf die effiziente Unterstützung von Matrixoperationen konzentriert. Sie wurde speziell für den Tensor Core der NVIDIA Hopper Architektur entwickelt und unterstützt sowohl allgemeine Matrixoperationen als auch gemischte Expertenmodelle (MoE)...

olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别-首席AI分享圈

olmOCR: Konvertierung von PDF-Dokumenten in Text, Unterstützung von Tabellen, Formeln und Erkennung handschriftlicher Inhalte

Umfassende Einführung olmOCR ist ein Open-Source-Tool, das vom AllenNLP-Team am Allen Institute for Artificial Intelligence (AI2) entwickelt wurde. Es konzentriert sich auf die Konvertierung von PDF-Dateien in linearisierten Text und eignet sich besonders für die Vorbereitung von Datensätzen und das Training für groß angelegte Sprachmodelle (LLMs). Es ...

Coding-Tutor:提供个性化编程指导的智能教学助手-首席AI分享圈

Coding-Tutor: ein intelligenter Lehrassistent, der eine personalisierte Programmieranleitung bietet

Allgemeine Einführung Coding-Tutor ist ein Open-Source-Projekt, das auf GitHub gehostet wird und vom Entwickler iwangjian erstellt wurde, um Lernenden ein personalisiertes Programmier-Lehrerlebnis zu bieten. Es nutzt KI-Technologie, um den Lehrinhalt dynamisch an den Wissensstand und den Lernfortschritt des Benutzers anzupassen, um den Lernenden zu helfen...

par_scrape:智能提取网页数据的爬虫工具-首席AI分享圈

par_scrape: ein Crawler-Tool für die intelligente Extraktion von Webdaten

Allgemeine Einführung par_scrape ist ein auf Python basierendes Open-Source-Web-Crawler-Tool, das vom Entwickler Paul Robello auf GitHub veröffentlicht wurde und Benutzern helfen soll, auf intelligente Weise Daten aus Webseiten zu extrahieren. Es integriert zwei leistungsstarke Browser-Automatisierungstechnologien, Selenium und Playwright, und kombiniert...

Flock:低代码工作流编排快速构建聊天机器人-首席AI分享圈

Flock: Low-Code-Workflow-Orchestrierung für die schnelle Erstellung von Chatbots

Allgemeine Einführung Flock ist eine quelloffene Low-Code-Plattform für Arbeitsabläufe, die auf GitHub gehostet und vom Onelevenvy-Team entwickelt wird. Sie basiert auf LangChain- und LangGraph-Technologien und ist darauf ausgerichtet, Benutzern zu helfen, schnell Chatbots, Retrieval Augmented Generation (RAG)-Anwendungen zu erstellen und Multi-Agenten-Gruppen zu orchestrieren...

TableGPT Agent:专为分析复杂表格数据设计的智能工具-首席AI分享圈

TableGPT Agent: Intelligentes Tool für die Analyse komplexer tabellarischer Daten

Allgemeine Einführung TableGPT Agent ist ein intelligentes Tool, das auf dem Open-Source-Projekt GitHub basiert und für die Verarbeitung und Analyse von Tabellendaten entwickelt wurde. Er basiert auf dem TableGPT2 Big Language Model, das natürlichsprachliche Interaktionen nutzt, um den Benutzern die Abfrage, Bearbeitung und das Verständnis komplexer Tabelleninhalte zu erleichtern. Ob aus ...

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频-首席AI分享圈

TRV: Schnelles Generieren von Präsentationsvideos aus Folien/PPTs und erläuternden Notizen

Allgemeine Einführung TRV ist ein Open-Source-Tool, das auf GitHub gehostet wird und Benutzern helfen soll, Folien und Vorlesungsnotizen schnell in Videos mit Kommentaren zu konvertieren. Es erzeugt automatisch Audio- und Videoinhalte aus eingehenden Präsentationsdateien durch einfache Befehlszeilenoperationen, geeignet für diejenigen, die schnell Präsentationsvideos für den Unterricht erstellen müssen...

LazyLLM:商汤开源构建多智能体应用的低代码开发工具-首席AI分享圈

LazyLLM: Shangtangs quelloffenes Low-Code-Entwicklungstool zur Erstellung multiintelligenter Körperanwendungen

Umfassende Einführung LazyLLM ist ein Open-Source-Tool, das vom LazyAGI-Team entwickelt wurde und sich auf die Vereinfachung des Entwicklungsprozesses von Multi-Intelligenz-Anwendungen mit großen Modellen konzentriert. Es hilft Entwicklern, schnell komplexe KI-Anwendungen zu erstellen und Zeit für mühsame technische Konfigurationen durch Ein-Klick-Einsatz und leichtgewichtige Gateway-Mechanismen zu sparen. Ob Sie ein Anfänger sind...

MagicArticulate:将静态3D模型生成骨骼结构动画资产-首席AI分享圈

MagicArticulate: Erzeugung von Skelettstruktur-Animationen aus statischen 3D-Modellen

Umfassende Einführung MagicArticulate ist ein AI-Framework, das von ByteDance in Zusammenarbeit mit der Nanyang Technological University (NTU) entwickelt wurde und sich auf die schnelle Umwandlung statischer 3D-Modelle in animationsfähige digitale Assets konzentriert. Es generiert automatisch Skelettstrukturen und Skinning-Rechte für Modelle durch erweiterte autoregressive Transformer und funktionale Diffusionsmodelle...

AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)-首席AI分享圈

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

Allgemeine Einführung AingDesk ist eine quelloffene und kostenlose Software, die Benutzern helfen soll, verschiedene KI-Modelle auf ihren lokalen Computern einfach einzusetzen und auszuführen. Ob es sich um DeepSeek- oder Llama-Modelle handelt, AingDesk ermöglicht die Bereitstellung mit einem Klick und einfachen Schritten. Die Software unterstützt Windows, Linux...

PDF-Extract-Kit:提取复杂结构PDF内容的开源工具-首席AI分享圈

PDF-Extract-Kit: Extrahieren der komplexen Struktur des PDF-Inhalts mit dem Open-Source-Tool

Umfassende Einführung PDF-Extract-Kit ist ein Open-Source-Projekt, das vom OpenDataLab-Team entwickelt wurde und sich auf die effiziente Extraktion von hochwertigen Inhalten aus komplexen und vielfältigen PDF-Dokumenten konzentriert. Es integriert fortschrittliche Dokumenten-Parsing-Technologie, Unterstützung für Layout-Erkennung, Formel-Erkennung, Tabellen-Extraktion und OCR und andere Funktionen für ...

TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架-首席AI分享圈

TPO-LLM-WebUI: Ein KI-Framework, in das Sie Fragen eingeben können, um ein Modell in Echtzeit zu trainieren und die Ergebnisse auszugeben.

Umfassende Einführung TPO-LLM-WebUI ist ein innovatives Projekt, das von Airmomo auf GitHub zur Verfügung gestellt wird und die Echtzeit-Optimierung von Large Language Models (LLMs) über eine intuitive Weboberfläche ermöglicht. Es nutzt das TPO-Framework (Test-Time Prompt Optimisation), um sich von dem langwierigen Prozess der traditionellen Feinabstimmung vollständig zu verabschieden...

Neural4D:生成高分辨率3D建模数字资产的AI平台-首席AI分享圈

Neural4D: eine KI-Plattform für die Erstellung hochauflösender 3D-Modelle für digitale Inhalte

Umfassende Einführung Neural4D ist eine innovative, auf KI basierende Plattform, die Benutzern hilft, schnell hochwertige 3D-Modelle und Animationen mit einfachen Text- oder Bildeingaben zu erstellen. Sie wurde von DreamTech entwickelt und basiert auf der weltweit führenden End-to-End-3D-Generierung großer Modelle, bei der der Benutzer einfach eine Beschreibung...

InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型-首席AI分享圈

InternLM-XComposer: ein multimodales Makromodell für die Ausgabe sehr langer Texte und das Verstehen von Bildern und Videos

Umfassende Einführung InternLM-XComposer ist ein Open-Source-grafisches multimodales Big-Model-Projekt, das vom InternLM-Team entwickelt wurde und auf GitHub gehostet wird. Es basiert auf dem InternLM-Sprachmodell, das in der Lage ist, Text-, Bild-, Video- und andere multimodale Daten zu verarbeiten und weithin in der Grafikerstellung, im Bildverständnis und in der...

MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率-首席AI分享圈

MakeSense: ein kostenloses Tool für Bildkommentare zur Steigerung der Effizienz von Computer-Vision-Projekten

Allgemeine Einführung Make Sense ist ein kostenloses Online-Tool zur Bildkommentierung, das Benutzern helfen soll, Datensätze für Computer-Vision-Projekte schnell vorzubereiten. Es erfordert keine komplizierte Installation, sondern lediglich einen Browser-Zugang, unterstützt mehrere Betriebssysteme und ist ideal für kleine Deep-Learning-Projekte. Benutzer können es verwenden, um...

de_DEDeutsch