AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 966 Artikel

Tags: KI Open-Source-Projekte Seite 17

dsRAG:用于处理非结构化数据和复杂查询的检索引擎-首席AI分享圈

dsRAG: eine Abfragemaschine für unstrukturierte Daten und komplexe Abfragen

Allgemeine Einführung dsRAG ist eine hochleistungsfähige Retrieval-Engine, die für die Bearbeitung komplexer Abfragen unstrukturierter Daten entwickelt wurde. Es ist besonders leistungsfähig bei der Bearbeitung anspruchsvoller Abfragen in dichten Texten wie Finanzberichten, juristischen Dokumenten und akademischen Abhandlungen. dsRAG verwendet drei Schlüsselansätze zur Leistungssteigerung: semantische Segmentierung,...

SongGen:自动生成歌曲的单阶段自回归Transformer-首席AI分享圈

SongGen: Ein einstufiger autoregressiver Transformator für die automatische Songgenerierung

Umfassende Einführung SongGen ist ein quelloffenes, einstufiges autoregressives Transformer-Modell, das für die Generierung von Text in Songs entwickelt wurde. Das Modell ist in der Lage, aus Texteingaben Lieder mit Gesang und Begleitmusik zu generieren. SongGen bietet eine fein abgestufte Kontrolle über eine Vielzahl von musikalischen Attributen, einschließlich Texten, Instrumentenbeschreibungen,...

Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)-首席AI分享圈

Graphiti: dynamisches Werkzeug zur Erstellung von Wissensgraphen und zur Abfrage (zeitbewusstes Programm mit langem Speicher)

Allgemeine Einführung Graphiti ist ein von getzep entwickeltes Werkzeug zur Erstellung und Abfrage dynamischer, zeitabhängiger Wissensgraphen. Es ist in der Lage, komplexe und sich entwickelnde Beziehungen zwischen Entitäten darzustellen und sie durch eine Vielzahl von Methoden abzufragen, wie z.B. temporale, Volltext-, semantische und Graphen-Algorithmen....

Memobase:为AI应用提供基于用户画像的长期记忆方案-首席AI分享圈

Memobase: eine auf Benutzerprofilen basierende Langzeitspeicherlösung für KI-Anwendungen

Allgemeine Einführung Memobase ist ein auf Benutzerprofilen basierendes Gedächtnissystem, das entwickelt wurde, um ein lang anhaltendes Benutzergedächtnis für generative KI-Anwendungen zu unterstützen. Egal, ob Sie einen virtuellen Begleiter, ein Bildungswerkzeug oder einen personalisierten Assistenten entwickeln, Memobase hilft Ihrer KI, sich zu erinnern, zu verstehen und sich mit den Benutzerinteraktionen weiterzuentwickeln. Durch...

中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集-首席AI分享圈

Chinesischer Vollblut-DeepSeek-R1-Destillationsdatensatz, unterstützt chinesischen R1-Destillations-SFT-Datensatz

Umfassende Einführung Der chinesische DeepSeek-R1-Destillationsdatensatz ist ein chinesischer Open-Source-Datensatz mit 110.000 Daten, der zur Unterstützung der Forschung im Bereich maschinelles Lernen und Verarbeitung natürlicher Sprache entwickelt wurde. Der Datensatz wird vom NLP-Team von Cong Liu veröffentlicht und enthält nicht nur mathematische Daten, sondern auch eine große Anzahl allgemeiner Datentypen, wie z. B. logische Schlussfolgerungen...

Base Chat:基于 Ragie 构建知识库的多租户聊天机器人-首席AI分享圈

Base Chat: Mandantenfähiger Chatbot zum Aufbau von Wissensdatenbanken auf der Grundlage von Ragie

Allgemeine Einführung Base Chat ist ein mandantenfähiger Chatbot, der Ragie Connect verwendet, um sich mit der Wissensdatenbank einer Organisation zu verbinden und zu kommunizieren. Das Projekt ist eine Referenzanwendung für mehrere Ragie-Funktionen, die auf Next.js mit Unterstützung für Google-Authentifizierung aufgebaut ist.Base Chat wurde entwickelt, um Benutzern durch die Chat-Maschine zu helfen...

AIBot PRO:集成多种AI产品的商业化聚合平台-首席AI分享圈

AIBot PRO: eine kommerzielle Aggregationsplattform, die mehrere KI-Produkte integriert

Umfassende Einführung AIBot PRO ist ein .NET 6-basierter KI-Aggregations-Client, der Benutzern eine bequeme Plattform für die Integration mehrerer KI-Produkte bieten soll. Der Client unterstützt sinnlose Schaltdialoge und integriert mehrere KI-Produkte wie ChatGPT, Gemini, Claude, Wenxin Yiyin, Tongyi Thousand Questions und Xunfei Starfire usw. AIBot...

ColossalAI:提供高效大规模AI模型训练解决方案-首席AI分享圈

ColossalAI: Effiziente Lösungen für das Training von KI-Modellen in großem Maßstab bereitstellen

Umfassende Einführung ColossalAI ist eine Open-Source-Plattform, die von HPC-AI Technologies entwickelt wurde, um eine effiziente und kostengünstige Lösung für das Training und die Inferenz umfangreicher KI-Modelle zu bieten. Durch die Unterstützung mehrerer paralleler Strategien, heterogener Speicherverwaltung und Training mit gemischter Genauigkeit ist ColossalAI in der Lage, das Training und die Inferenz von Modellen erheblich zu reduzieren...

HealthGPT:支持医学图像分析与诊断问答的医疗大模型-首席AI分享圈

HealthGPT: Ein medizinisches Großmodell zur Unterstützung der medizinischen Bildanalyse und diagnostischer Fragen

Umfassende Einführung HealthGPT ist ein fortschrittliches medizinisches großes visuelles Sprachmodell, das darauf abzielt, ein einheitliches medizinisches visuelles Verständnis und Generierungsfähigkeiten durch heterogene Wissensanpassung zu erreichen. Das Ziel des Projekts ist es, medizinisches Sehverständnis und Generierungsfähigkeiten in einen einheitlichen autoregressiven Rahmen zu integrieren, der die medizinische Bildverarbeitung erheblich verbessert...

MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频-首席AI分享圈

MatAnyone: Open-Source-Tool zum Extrahieren des Videos, um das Zielporträt zu bestimmen und das Zielporträtvideo zu erzeugen

Allgemeine Einführung MatAnyone ist ein Open-Source-Projekt mit Schwerpunkt auf Video-Keying, das von einem Forschungsteam am S-Lab der Nanyang Technological University in Singapur entwickelt und auf GitHub veröffentlicht wurde. Es bietet den Nutzern stabile und effiziente Videoverarbeitungsfunktionen durch konsistente Speicherausbreitungstechniken, besonders gut im Umgang mit komplexen Hintergründen...

Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型-首席AI分享圈

Omnitool: der Werkzeugkasten für KI-Enthusiasten zum Verwalten, Verbinden und Verwenden all Ihrer KI-Modelle auf einem einzigen Desktop!

Allgemeines Omnitool.ai ist ein Open-Source-"KI-Labor", das eine erweiterbare browserbasierte Desktop-Umgebung für Lernende, Hobbyisten und alle, die sich für aktuelle KI-Innovationen interessieren, bereitstellt. Es ermöglicht Benutzern die Zusammenarbeit mit anderen KI-Labors von OpenAI, replicate.com, Stable Diffusio...

Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型-首席AI分享圈

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

Umfassende Einführung Step-Video-T2V ist ein fortschrittliches Text-zu-Video-Konvertierungsmodell von StepFun AI (StepFun Star). Das Modell hat 3 Milliarden Parameter und ist in der Lage, Videos mit bis zu 204 fps zu erzeugen. Mit einer tiefen Kompression Variable Auto-Encoder (VAE), erreicht das Modell eine räumliche Kompression von 16x16 und eine zeitliche Kompression von 8x...

OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作-首席AI分享圈

OmniParser: Bildschirmfotos der Benutzeroberfläche werden in strukturierte Elemente zerlegt, um das Verständnis und die Bearbeitung großer Modelle zu erleichtern

Allgemeine Einführung OmniParser ist ein von Microsoft entwickeltes Tool zum Parsen von Benutzeroberflächen-Screenshots in strukturierte und leicht verständliche Elemente. Dieses Tool verbessert die Fähigkeit von GPT-4V, genaue Aktionen im entsprechenden Oberflächenbereich zu generieren, erheblich.OmniParser unterstützt nicht nur eine Vielzahl von großen Sprachmodellen, sondern auch...

Genspark2api (fehlgeschlagen)

Allgemeine Einführung genspark2api ist ein Open-Source-API-Service-Tool, das auf GitHub gehostet und vom Entwickler deanxv erstellt wurde. Es bietet einen Schnittstellendienst, der Dialoge mit mehreren Modellen, Text-zu-Grafik und Text-zu-Video unterstützt, die Benutzer schnell lokal oder auf Servern über Docker bereitstellen können. Diese Arbeit...

DragAnything:对图像中实体对象控制运动硅基生成视频-首席AI分享圈

DragAnything: Steuerung der siliziumbasierten Videoerzeugung für feste Objekte in Bildern

Allgemeine Einführung DragAnything ist ein Open-Source-Projekt, das darauf abzielt, die Bewegungssteuerung beliebiger Objekte durch Entitätsdarstellung zu erreichen. Das Projekt wird vom Showlab-Team entwickelt und wurde vom ECCV 2024 akzeptiert. DragAnything bietet eine benutzerfreundliche Interaktion, bei der der Benutzer einfach eine Trajektionslinie zeichnet...

Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能-首席AI分享圈

Step-Audio: ein multimodales Sprachinteraktionssystem, das u. a. Sprache erkennt und mit geklonter Sprache kommuniziert

Umfassende Einführung Step-Audio ist ein Open-Source-Framework für intelligente Sprachinteraktion, das entwickelt wurde, um sofort einsetzbare Sprachverstehens- und -erzeugungsfunktionen für Produktionsumgebungen bereitzustellen. Das Framework unterstützt mehrsprachige Unterhaltungen (z.B. Chinesisch, Englisch, Japanisch), emotionale Sprache (z.B. glücklich, traurig), regionale Dialekte (z.B. Kantonesisch, Sichuan) und kann...

de_DEDeutsch