AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 927 Artikel

Tags: KI Open-Source-Projekte Seite 8

基于Qdrant向量搜索引擎构建的MCP服务-首席AI分享圈

MCP-Dienst auf Basis der Vektorsuchmaschine Qdrant

Umfassende Einführung mcp-server-qdrant ist ein Model Context Protocol (MCP)-Server, der auf der Qdrant-Vektorsuchmaschine aufbaut. Er dient in erster Linie dazu, KI-Systeme beim Speichern und Abrufen von Erinnerungen zu unterstützen, und eignet sich besonders für Szenarien, die eine semantische Suche erfordern. Dieses Tool wandelt Informationen in Vektoren um, indem es...

R1-Omni:通过视频和音频分析情感的开源模型-首席AI分享圈

R1-Omni: ein Open-Source-Modell zur Analyse von Emotionen durch Video und Audio

Allgemeine Einführung R1-Omni ist ein Open-Source-Projekt, das vom HumanMLLM-Team auf GitHub gestartet wurde. Es ist die erste Anwendung von Reinforcement Learning with Verifiable Rewards (RLVR)-Techniken auf ein multimodales großes Sprachmodell mit Schwerpunkt auf Emotionserkennung. Das Projekt analysiert Video- und Audiodaten, um die Emotionen von Personen zu identifizieren, wie z. B. Wut,...

飞桨 PP-TableMagic:复杂表格结构化信息提取神器-首席AI分享圈

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Das Ziel der Tabellenerkennung besteht darin, Tabellen in Bildern zu analysieren, Tabellenstrukturen und Zellenpositionen genau zu identifizieren und sie in strukturierte Tabellenformate (z. B. HTML) zu reduzieren. Im heutigen Informationszeitalter liegt eine große Menge wichtiger tabellarischer Daten immer noch in einem unstrukturierten Zustand vor (z. B. Bilder von Informationsstatistiken in gescannten Dokumenten, pd...

Cloudflare Agents:在边缘网络上构建实时交互的智能体-首席AI分享圈

Cloudflare-Agenten: Aufbau interaktiver Echtzeit-Intelligenzen in Edge-Netzwerken

Allgemeine Einführung Cloudflare Agents ist ein Open-Source-Entwicklungsframework von Cloudflare, das Entwicklern helfen soll, intelligente KI-Agenten im globalen Edge-Netzwerk zu erstellen. Es gibt Agenten die Möglichkeit, ihren Zustand zu erhalten, in Echtzeit zu kommunizieren und autonom zu arbeiten. Das Projekt befindet sich derzeit in aktiver Entwicklung. Zu den Kernfunktionen gehören...

OpenAI Agents SDK:搭建多智能体协作工作流的Python框架-首席AI分享圈

OpenAI Agents SDK: Ein Python-Framework zum Aufbau kollaborativer Multi-Intelligenz-Workflows

Allgemeine Einführung OpenAI Agents SDK ist ein leichtgewichtiges Entwicklungstool von OpenAI, das für den Aufbau von multi-intelligenten Körper-Workflows konzipiert ist. Es basiert auf Python, ist einfach zu bedienen und unterstützt Entwickler bei der Konfiguration von Agenten, Handoffs, Guardrails und anderen Aufgaben durch...

AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包-首席AI分享圈

AI Toolkit von Ostris: Stabile Diffusion mit FLUX.1 Model Training Toolkit

Allgemeine Einführung AI Toolkit von Ostris ist ein Open-Source-KI-Toolset, das sich auf die Unterstützung von Stable Diffusion und FLUX.1-Modellen für Trainings- und Bilderzeugungsaufgaben konzentriert. Das vom Entwickler Ostris erstellte und gepflegte Toolkit, das auf GitHub gehostet wird, zielt darauf ab, Forschern und Entwicklern eine flexible...

混元Turbo S:腾讯推出的快思考大模型(开放申请)-首席AI分享圈

Hybrid Turbo S: Tencent's Big Model for Thinking Fast (offen für Bewerbungen)

Umfassende Einführung Tencent Turbo S ist Tencents selbst entwickeltes Schnelldenker-Modell der nächsten Generation, das auf der offiziellen Website von Tencent Cloud vorgestellt wurde und am 27. Februar 2025 offiziell veröffentlicht wird. Im Gegensatz zu den traditionellen langsam denkenden Modellen (z.B. Deepseek R1, Hybrid T1) kann es die "zweite Antwort" erreichen, die Geschwindigkeit des Spuckens verdoppeln und die Verzögerung des ersten Wortes reduzieren...

HippoRAG:基于长时记忆的多跳知识检索框架-首席AI分享圈

HippoRAG: Ein Multi-Hop-Wissensabrufsystem auf der Grundlage des Langzeitgedächtnisses

Allgemeine Einführung HippoRAG ist ein Open-Source-Framework, das von der OSU-NLP-Gruppe an der Ohio State University entwickelt wurde und sich an den Mechanismen des menschlichen Langzeitgedächtnisses orientiert. Es kombiniert Retrieval Augmented Generation (RAG), Knowledge Graph und personalisierte PageRank-Techniken, um Large Language Models (LLMs) dabei zu helfen, kontinuierlich Wissen aus externen Dokumenten zu integrieren...

ANP:实现智能代理间安全高效通信的开源协议-首席AI分享圈

ANP: Ein Open-Source-Protokoll für die sichere und effiziente Kommunikation zwischen intelligenten Agenten

Allgemeine Einführung AgentNetworkProtocol (ANP) ist ein Open-Source-Protokoll-Projekt, das auf GitHub gehostet wird und sich auf die Bereitstellung sicherer und effizienter Kommunikationslösungen für intelligente Agenten (AI-Agenten) konzentriert. Es löst Agenten durch eine dreischichtige Architektur - Identitäts- und verschlüsselte Kommunikationsschicht, Meta-Protokollschicht und Anwendungsprotokollschicht...

Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣-首席AI分享圈

Open-LLM-VTuber: Live2D-animierter virtueller KI-Begleiter für Echtzeit-Sprachinteraktion

Allgemeine Einführung Open-LLM-VTuber ist ein Open-Source-Projekt, das es Nutzern ermöglicht, mit Large Language Models (LLMs) durch Sprache und Text zu interagieren, und das die Live2D-Technologie zur Darstellung dynamischer virtueller Charaktere nutzt. Es unterstützt Windows, macOS und Linux, läuft komplett offline und hat sowohl Web- als auch Desktop-Client-Modelle...

Ovis:视觉与文本对齐模型,精准反推图像提示词-首席AI分享圈

Ovis: ein visuelles und textuelles Ausrichtungsmodell für genaue Backpropagation von Bildstichwörtern

Umfassende Einführung Ovis (Open VISion) ist ein quelloffenes multimodales großes Sprachmodell (MLLM), das vom AIDC-AI-Team der International Digital Commerce Group von Alibaba entwickelt und auf GitHub gehostet wird. Das Modell verwendet eine innovative strukturelle Einbettungstechnik, um visuelle und textuelle Daten effizient zusammenzuführen und unterstützt...

X-R1:在普通设备中低成本训练0.5B模型-首席AI分享圈

X-R1: Schulung von 0,5B-Modellen in gängigen Geräten zu geringen Kosten

Allgemeine Einführung X-R1 ist ein Reinforcement-Learning-Framework, das vom dhcode-cpp-Team auf GitHub zur Verfügung gestellt wird. Ziel ist es, Entwicklern ein kostengünstiges, effizientes Tool für das Training von Modellen auf Basis von End-to-End Reinforcement Learning zur Verfügung zu stellen. Das Projekt ist inspiriert von DeepSeek-R1 und open-r1 und konzentriert sich auf den Aufbau von...

Eino:字节跳动开源的Golang大模型应用开发框架-首席AI分享圈

Eino: ByteDance's Open Source Golang Big Model Application Development Framework

Umfassende Einführung Eino ist ein Golang-basiertes Open-Source-Framework, das vom CloudWeGo-Team ins Leben gerufen wurde, um das ultimative Entwicklungswerkzeug für große Modellanwendungen (LLM) zu sein. Es ist darauf ausgelegt, das ultimative Entwicklungswerkzeug für LLM-Anwendungen zu sein. Es stützt sich auf das hervorragende Design von Open-Source-Frameworks wie LangChain und LlamaIndex und kombiniert die Ergebnisse der Spitzenforschung und der internen Praxis von ByteDance mit...

OpenManus-RL:微调大模型强化智能体推理与决策能力-首席AI分享圈

OpenManus-RL: Feinabstimmung großer Modelle zur Verbesserung der intelligenten Entscheidungsfindung im Körper

Allgemeine Einführung OpenManus-RL ist ein Open-Source-Projekt, das gemeinsam von UIUC-Ulab und dem OpenManus-Team der MetaGPT-Community entwickelt wurde und auf GitHub gehostet wird. Das Projekt verbessert die Argumentations- und Entscheidungsfähigkeiten von Large Language Model (LLM)-Intelligenzen durch Reinforcement Learning (RL)-Techniken, basierend auf Deepseek-R1, QwQ-32B ...

Long-VITA:支持超长上下文输出的视觉语言模型-首席AI分享圈

Long-VITA: Ein visuelles Sprachmodell, das sehr lange kontextuelle Ausgaben unterstützt

Umfassende Einführung Long-VITA ist ein quelloffenes multimodales Makromodell, das vom VITA-MLLM-Team entwickelt wurde und sich auf visuelle und sprachliche Aufgaben mit sehr langen Kontexten konzentriert. Es ist in der Lage, Bilder, Videos und Text gleichzeitig zu analysieren, unterstützt Eingaben von bis zu 1 Million Token und eignet sich für das Verstehen von Videos, das Lösen von hochauflösenden Bildern...

Meeting:本地实时转录和生成会议纪要的开源客户端-首席AI分享圈

Meeting: Lokale Echtzeit-Transkription und Erstellung von Meeting-Protokollen des Open-Source-Clients

Allgemeine Einführung Meeting Minutes (auch bekannt als Meetily) ist ein kostenloses und quelloffenes KI-Meeting-Assistententool, das von Zackriya Solutions entwickelt wurde und sich auf die Aufnahme von Meeting-Audio in Echtzeit, die Erstellung von transkribiertem Text und die automatische Extraktion von Meeting-Zusammenfassungen konzentriert. Das Tool läuft vollständig auf nativen Geräten und unterstützt macOS ...

de_DEDeutsch