AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 992 Artikel

Tags: KI Open-Source-Projekte Seite 45

文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具-首席AI分享圈

Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug

Allgemeine Beschreibung Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z.B. PDF, Word, PPTX, etc.). Die API nutzt modernste OCR-Technologie (Optical Character Recognition) und Ollama-unterstützte Modelle, um jedes beliebige Dokument oder Bild zu...

OmniGen:统一图像生成模型,多模态输入生成人物一致性图像-首席AI分享圈

OmniGen: Ein einheitliches Bildgenerierungsmodell mit multimodalen Eingaben zur Generierung zeichenkonsistenter Bilder

Allgemeine Einführung OmniGen ist ein von VectorSpaceLab entwickeltes "universelles" Bilderzeugungsmodell, das es den Benutzern ermöglicht, mit einfachen Texteingaben oder multimodalen Eingaben vielfältige und kontextreiche visuelle Effekte zu erzeugen. Es eignet sich besonders für Szenen, die eine Zeichenerkennung und konsistente Zeichendarstellung erfordern...

PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架-首席AI分享圈

PantoMatrix (EMAGE): Framework zur Erzeugung von Ganzkörpergesten, 3D-Animations-Framework zur Erzeugung von Ganzkörpergesten aus Audio

Umfassende Einführung PantoMatrix ist ein fortschrittliches Framework zur Erzeugung von Ganzkörpergesten, das in der Lage ist, komplette menschliche Bewegungen aus Audio- und Teilgesten zu generieren, einschließlich Gesichts-, Teilkörper-, Hand- und Ganzkörperbewegungen. Das Framework nutzt die neuesten multimodalen Datensätze und Deep-Learning-Techniken, um qualitativ hochwertige 3D-Bewegungserfassungsdaten zu liefern...

Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手-首席AI分享圈

Weiter: Open-Source-KI-Code-Assistent, der sich in VS Code integriert und Modelle und Einbettungen anpasst

Allgemeine Einführung Continue ist ein Open-Source-KI-Code-Assistent, der die Effizienz von Softwareentwicklern verbessern soll. Zu seinen Hauptfunktionen gehören die automatische Code-Vervollständigung, die Code-Optimierung und intelligente Code-Vorschläge für VS Code und JetBrains IDEs. Continue unterstützt nicht nur mehrere Sprachmodelle, sondern ermöglicht es dem Benutzer auch,...

Zed:Rust开发的高性能多人协作代码编辑器-首席AI分享圈

Zed: ein leistungsstarker kollaborativer Multiplayer-Code-Editor, entwickelt von Rust

Allgemeine Einführung Zed ist ein hochleistungsfähiger, kollaborativer Code-Editor für mehrere Benutzer, der von den Machern von Atom und Tree-sitter entwickelt wurde. Zed ist in der Sprache Rust geschrieben und soll ein schnelles und flüssiges Codierungserlebnis bieten. Zu seinen Hauptmerkmalen gehören die Unterstützung von Echtzeit-Mehrbenutzer-Zusammenarbeit, plattformübergreifende Kompatibilität (derzeit ...

Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)-首席AI分享圈

Pieces OS: Umgekehrte Pieces-OS GRPC-Konvertierung zur OpenAI-Schnittstelle (fehlgeschlagen)

Allgemeine Einführung Pieces-OS ist ein Open-Source-Projekt, zielt darauf ab, Pieces-OS GRPC-Streams umzukehren und zu konvertieren, um die Standard-OpenAI-API-Schnittstelle, Unterstützung für Claude, GPT, Gemini.Das Projekt wird von Nekohy entwickelt, basierend auf der GPL-3.0-Protokoll Open Source, vor allem für das Lernen und die Kommunikation, nicht für kommerzielle ...

uni-api: leichtgewichtige Big Model API konvertiert zur OpenAI-Schnittstelle, YAML-Datei zur Konfiguration des API-Kanals

Umfassende Einführung Kein Front-End, reine Konfigurationsdatei Konfiguration API-Kanal. Schreiben Sie einfach eine Datei, um eine API-Station von ihren eigenen laufen, hat das Dokument eine detaillierte Konfigurationsanleitung, weiß freundlich. uni-api ist eine einheitliche Verwaltung von großen Modell-API-Projekt, so dass eine einheitliche API-Schnittstelle, um mehrere Post aufrufen ...

IC-Light(V2):图像照明控制神器,控制图像光影和背景-首席AI分享圈

IC-Light (V2): Magie zur Steuerung der Bildbeleuchtung, Steuerung von Licht, Schatten und Hintergrund des Bildes

Umfassende Einführung IC-Light ist ein Projekt zur Beleuchtungssteuerung von Bildern, das darauf abzielt, die Beleuchtungseffekte von Bildern durch fortgeschrittene KI-Modelle zu manipulieren. Das Projekt wurde von Lvmin Zhang et al. entwickelt und bietet zwei Hauptmodelle: ein textbedingtes Relighting-Modell und ein hintergrundbedingtes Modell. Die Benutzer können die Beleuchtungseffekte durch einfache Textanweisungen oder...

Ortlin:与所有OpenAI模型和API交互的Web图形用户界面-首席AI分享圈

Ortlin: eine Web-GUI für die Interaktion mit allen OpenAI-Modellen und APIs

Allgemeine Einführung Ortlin ist eine webbasierte grafische Benutzeroberfläche, die sowohl technischen als auch nicht-technischen Benutzern die einfache Interaktion mit den APIs und den zugrunde liegenden Modellen von OpenAI ermöglicht. Es ist völlig kostenlos und quelloffen, so dass Benutzer die Leistungsfähigkeit von OpenAI ohne Probleme nutzen können...

AigoTools:自动收录网站并支持多语言的开源AI工具导航站-首席AI分享圈

AigoTools: automatische Aufnahme von Websites und Unterstützung für mehrsprachige Open-Source-KI-Tool-Navigationsseiten

Umfassende Einführung AigoTools ist ein Open-Source-KI-Website-Navigation, entwickelt, um Benutzern zu helfen, schnell zu erstellen und zu verwalten Navigation Websites. Es verfügt über integrierte Website-Management und AI-basierte Auto-Inclusion-Funktionen , Unterstützung für mehrere Sprachen , dunkel / hell Thema Umstellung und SEO-Optimierung.AigoTools bietet eine Vielzahl von Bildspeicherlösungen , einschließlich dieser ...

GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型-首席AI分享圈

GPT4Free: Dekompilierung der AI-Dialog-Website-Schnittstelle zur freien Nutzung mehrerer GPT-Modelle

Allgemeine Einführung GPT4Free ist ein Open-Source-Projekt, das vom Entwickler xtekky auf GitHub veröffentlicht wurde. Es zielt darauf ab, eine Vielzahl von leistungsstarken Sprachmodellen kostenlos zur Verfügung zu stellen, darunter GPT-3.5, GPT-4, Llama, Gemini-Pro, Bard und Claude. Das Projekt, das mehrere API-Anfragen aggregiert, bietet sup...

Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)-首席AI分享圈

Amphion MaskGCT: Null-Sample Text-zu-Sprache-Klonmodell (lokales Ein-Klick-Bereitstellungspaket)

Umfassende Einführung MaskGCT (Masked Generative Codec Transformer) ist ein vollständig nicht-autoregressives Text-to-Speech (TTS)-Modell, das gemeinsam von Funky Maru Technology und der Chinese University of Hong Kong entwickelt wurde. Das Modell macht explizite Text-zu-Sprache-Ausrichtungsinformationen überflüssig und verwendet einen zweistufigen Generierungsansatz, zunächst durch ...

Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)-首席AI分享圈

Quanta Quest: große Modelle auf der Endseite und lokalisierte KI-Suchplattform für persönliche Daten (Vorschau)

Einführung Quanta Quest ist das weltweit erste Produkt, das "end-side big model + C-side data localisation" als seine zentrale Entwicklungsrichtung nimmt. Es hilft Benutzern, alle Daten von Gmail, Notion, Dropbox, etc. lokal zu speichern und die Sicherheit und den Datenschutz durch Vektordatenbankverarbeitung zu gewährleisten. Es hilft Benutzern, alle Daten von Gmail, Notion, Dropbox, etc. lokal zu speichern und sie durch Vektordatenbankverarbeitung zu verarbeiten, um die Datensicherheit und den Datenschutz zu gewährleisten...

PDF in Podcast: Dienstprogramm zum Konvertieren von PDF in Podcast

Allgemeine Einführung Inspiriert von den Podcast-Erzeugungsfunktionen von Notebook LM und der aktuellen Open-Source-Implementierung von Open Notebook LM. In diesem Rezept werden wir eine detaillierte Schritt-für-Schritt-Anleitung implementieren, wie man eine PDF-zu-Podcast-Pipeline erstellt. Aus einer beliebigen PDF-Datei wird ein Segment generiert, in dem der Moderator und die Gäste diskutieren und erklären ...

Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现-首席AI分享圈

Agent.exe: Lassen Sie die KI Ihren Computer direkt steuern, eine Open-Source-Implementierung von Claudes Kontrollcomputer

Allgemeine Einführung Agent.exe ist eine Open-Source-Electron-Anwendung, die die Claude 3.5 Sonnet-API von Anthropic nutzt, um Benutzern die direkte Steuerung ihres lokalen Computers durch KI zu ermöglichen. Das von Kyle Corbitt entwickelte Projekt zielt darauf ab, eine leichtgewichtige Lösung zu bieten, die es dem Benutzer erlaubt,...

MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!-首席AI分享圈

MindSearch: Open-Source-KI-Suchmaschinen-Framework zum Einsatz Ihrer eigenen Perplexity-Suchmaschine!

Umfassende Einführung MindSearch ist ein Open-Source-KI-Suchmaschinen-Framework, das vom Shanghai Artificial Intelligence Laboratory (SAL) ins Leben gerufen wurde und darauf abzielt, den menschlichen Denkprozess für komplexe Informationsbeschaffung und -integration zu simulieren. Das Tool kombiniert die fortschrittliche Technologie der groß angelegten Sprachmodellierung (LLM) und Suchmaschine mit einem Multi-Intelligenz-Framework, um die...

de_DEDeutsch