AI Open-Source-Projekt

Insgesamt 1020 Artikel
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: das KI-Tool, das vergilbte, abgenutzte alte Fotos auf intelligente Weise wiederherstellt

Bringing Old Photos Back to Life ist ein Open-Source-Projekt, das von einem Team von Microsoft-Forschern entwickelt wurde und sich auf die Wiederherstellung alter Fotos mithilfe von KI-Technologie konzentriert. Es basiert auf einem Deep-Learning-Ansatz, der schwerwiegende Degradationsprobleme in Fotos, wie z. B. Kratzer, behandeln kann...
vor 5 Monaten
01.7K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: ein Open-Source-Tool zur Optimierung von Prompt-Wörtern für gängige KI-Modelle

Allgemeine Einführung Prompt Optimizer ist ein Open-Source-Tool, das sich auf die Optimierung von Prompt-Wörtern konzentriert und von linshenkx auf GitHub entwickelt wurde. Es hilft Nutzern, die Prompt-Wörter von KI-Modellen durch intelligente Algorithmen zu optimieren und so die Qualität der generierten Inhalte zu verbessern...
vor 5 Monaten
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: Textanweisungen generieren nahtlose Videoschleifen

Allgemeine Einführung Mobius Diffusion ist ein innovatives Online-Tool, das sich darauf konzentriert, aus Texteingaben nahtlos geloopte Videoinhalte zu erzeugen. Es basiert auf vortrainierten Videodiffusionsmodellen und erfordert kein Benutzertraining oder Annotationsdaten, um schnell starten zu können. Die Kerntechnologie der Website ist die ...
vor 5 Monaten
02.2K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: ein End-to-End-Audiomodell, das Sprachinteraktion in Echtzeit unterstützt

Umfassende Einführung Baichuan-Audio ist ein von Baichuan Intelligence (baichuan-inc) entwickeltes Open-Source-Projekt, das auf GitHub gehostet wird und sich auf End-to-End-Sprachinteraktionstechnologie konzentriert. Das Projekt bietet ein komplettes Audioverarbeitungs-Framework, das die Sprachverarbeitung ...
vor 5 Monaten
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: Verfolgen und Zusammenfassen von KI-Nachrichten in Echtzeit, automatische Veröffentlichung auf WeChat

Allgemeine Einführung ai-trend-publish ist ein auf GitHub gehostetes Open-Source-Projekt, das vom OpenAISpace-Team entwickelt wurde und sich auf die Verfolgung und Veröffentlichung der neuesten Trends im Bereich der künstlichen Intelligenz in Echtzeit konzentriert. Dieses Tool wurde entwickelt, um Entwicklern, Technik-Hobbyisten...
vor 5 Monaten
02.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Erzeugen von mehr als 5-minütigen animierten Mathe-Erklärvideos mit Manim

Allgemeine Einführung TheoremExplainAgent ist ein innovatives Projekt, das vom TIGER AI Lab entwickelt wurde, um komplexe mathematische und wissenschaftliche Theoreme mithilfe von Techniken der künstlichen Intelligenz in leicht verständliche Videoanimationen zu verwandeln. Das Werkzeug basiert auf dem Large Language Model (LLM...
vor 5 Monaten
02.2K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: KI-Dialog-Client, der gleichzeitige Sitzungen mit mehreren Chats unterstützt

Allgemeine Einführung DeepChat ist ein Open-Source-Projekt für intelligente Assistenten, das vom ThinkInAIXYZ-Team auf GitHub entwickelt wurde. Es zielt darauf ab, Benutzer mit der digitalen Welt durch leistungsstarke KI-Technologie zu verbinden, um eine effiziente und natürliche Chat-Erfahrung zu bieten. Es unterstützt Win...
vor 5 Monaten
03K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: Automatisierte Codegenerierung und Debugging-Tool mit Mehrsprachenunterstützung

Allgemeine Einführung AutoDev ist ein Open-Source-Projekt, das vom Unit Mesh-Team entwickelt und auf GitHub gehostet wird. Es zielt darauf ab, die Programmiereffizienz von Entwicklern durch Technologie der künstlichen Intelligenz zu verbessern. Es ist ein leistungsstarker Programmierassistent, der mehrere Programmiersprachen unterstützt, darunter Ja...
vor 6 Monaten
02.6K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: ein Videoplayer, der in Echtzeit Untertitel mit zweisprachiger Übersetzung erzeugt

Allgemeine Einführung LLPlayer ist ein Open-Source-Medienplayer für Sprachschüler, der auf GitHub gehostet und vom Entwickler umlx5h erstellt wurde. Es integriert eine Vielzahl von nützlichen Funktionen wie zweisprachige Untertitel-Anzeige, AI automatisch generierte Untertitel, Echtzeit-Übersetzung und Wortsuche...
vor 2 Monaten
03.8K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: ein intelligenter Lehrassistent, der eine personalisierte Programmieranleitung bietet

Allgemeine Einführung Coding-Tutor ist ein Open-Source-Projekt, das auf GitHub gehostet wird und vom Entwickler iwangjian erstellt wurde, um Lernenden ein personalisiertes Programmierungserlebnis zu bieten. Es verwendet Konversations-KI-Technologie, um auf der Grundlage des Wissenshintergrunds des Benutzers zu lernen und...
vor 6 Monaten
02K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Schnelles Generieren von Präsentationsvideos aus Folien/PPTs und erläuternden Notizen

Allgemeine Einführung TRV ist ein Open-Source-Tool, das auf GitHub gehostet wird und Benutzern helfen soll, Folien und Präsentationsnotizen schnell in Videos mit Kommentaren zu konvertieren. Es erzeugt automatisch Audio- und Videoinhalte aus eingegebenen Präsentationsdateien durch einfache Befehlszeilenoperationen, geeignet für diejenigen, die schnell Präsentationen erstellen müssen.
vor 6 Monaten
02.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: Shangtangs quelloffenes Low-Code-Entwicklungstool zur Erstellung multiintelligenter Körperanwendungen

Umfassende Einführung LazyLLM ist ein Open-Source-Tool, das vom LazyAGI-Team entwickelt wurde und sich auf die Vereinfachung des Entwicklungsprozesses von Multi-Intelligenz-Anwendungen mit großen Modellen konzentriert. Es hilft Entwicklern bei der schnellen Erstellung komplexer KI-Anwendungen durch eine Ein-Klick-Bereitstellung und leichtgewichtige Gateway-Mechanismen, die eine mühsame technische Konfiguration...
vor 6 Monaten
02.5K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: Erzeugung von Skelettstruktur-Animationen aus statischen 3D-Modellen

Umfassende Einführung MagicArticulate ist ein von ByteDance in Zusammenarbeit mit der Nanyang Technological University (NTU) entwickeltes KI-Framework, das sich auf die schnelle Umwandlung statischer 3D-Modelle in animationsfähige digitale Assets konzentriert. Dies geschieht durch einen fortschrittlichen autoregressiven Transformator und ein funktionales Diffusionsmodell,...
vor 6 Monaten
02.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

Allgemeine Einführung AingDesk ist eine quelloffene und kostenlose Software, die Benutzern helfen soll, verschiedene KI-Modelle auf ihren lokalen Computern einfach einzusetzen und auszuführen. Egal, ob es sich um ein DeepSeek- oder ein Llama-Modell handelt, AingDesk ermöglicht eine einfache Schritt-für-Schritt...
vor 6 Monaten
02.7K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extrahieren der komplexen Struktur des PDF-Inhalts mit dem Open-Source-Tool

Umfassende Einführung PDF-Extract-Kit ist ein Open-Source-Projekt, das vom OpenDataLab-Team entwickelt wurde und sich auf die effiziente Extraktion von hochwertigen Inhalten aus komplexen und vielfältigen PDF-Dokumenten konzentriert. Es integriert fortschrittliche Dokumenten-Parsing-Technologie zur Unterstützung von Layout-Erkennung, Formel-Erkennung ...
vor 6 Monaten
03K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: Ein KI-Framework, in das Sie Fragen eingeben können, um ein Modell in Echtzeit zu trainieren und die Ergebnisse auszugeben.

Allgemeine Einführung TPO-LLM-WebUI ist ein innovatives Projekt, das von Airmomo auf GitHub zur Verfügung gestellt wird und die Echtzeit-Optimierung von Large Language Models (LLMs) über eine intuitive Weboberfläche ermöglicht. Es verwendet TPO (Test-Time Pr...
vor 6 Monaten
03.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: eine KI-Plattform für die Erstellung hochauflösender 3D-Modelle für digitale Inhalte

Allgemeine Einführung Neural4D ist eine innovative, auf KI basierende Plattform, die Benutzern hilft, schnell hochwertige 3D-Modelle und Animationen mit einfachen Text- oder Bildeingaben zu erstellen. Sie wurde von DreamTech entwickelt und basiert auf der weltweit führenden End-to-End-Technologie für die Erzeugung großer 3D-Modelle...
vor 6 Monaten
02.5K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: ein kostenloses Tool für Bildkommentare zur Steigerung der Effizienz von Computer-Vision-Projekten

Allgemeine Einführung Make Sense ist ein kostenloses Online-Tool zur Bildkommentierung, das Benutzern helfen soll, Datensätze für Computer-Vision-Projekte schnell vorzubereiten. Es erfordert keine komplizierte Installation, sondern lediglich einen Browser-Zugang, unterstützt mehrere Betriebssysteme und ist ideal für kleine Deep-Learning-Projekte. Benutzer können...
vor 6 Monaten
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: KI-Chat-Schnittstelle zur Visualisierung baumbasierter Konversationen

Allgemeine Einführung TreeGPT ist eine auf Next.js basierende Open-Source-Chat-Anwendung, die sich auf die Visualisierung von Unterhaltungen mit großen Sprachmodellen (LLMs, z.B. GPTs) durch Baumgraphenstrukturen (gerichtete azyklische Graphen, DAGs) konzentriert und damit traditionelle lineare Chat-Methoden ersetzt, um die Geschwindigkeit und...
vor 6 Monaten
02.9K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: ein KI-Assistent für die Erstellung von Textbeschreibungen ComfyUI-Workflows

Umfassende Einführung ComfyUI-Copilot ist ein KI-gesteuerter, benutzerdefinierter Knoten, der für das ComfyUI-Framework entwickelt wurde und darauf abzielt, die Effizienz des Debuggens und der Bereitstellung von KI-Algorithmen durch natürlichsprachliche Interaktion zu verbessern. Er wurde vom AIDC-AI-Team (Alibaba) entwickelt und von GitHu abgeleitet...
vor 6 Monaten
02.6K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: Multi-Agenten-Kollaboration zur Durchführung von Literaturrecherchen und Erstellung von Forschungsberichten

Allgemeine Einführung Auto-Deep-Research ist ein Open-Source-KI-Tool, das vom Data Intelligence Laboratory der Universität Hongkong (HKUDS) entwickelt wurde und Benutzern helfen soll, Deep-Research-Aufgaben zu automatisieren. Es baut auf dem AutoAgent-Framework auf und unterstützt mehrere große Sprachmodelle...
vor 4 Monaten
05.5K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: ein Rahmenwerk für die schnelle Entwicklung und Bereitstellung von KI-Intelligenzen durch natürliche Sprache

Allgemeine Einführung AutoAgent ist ein Open-Source-Framework für KI-Intelligenzen, das vom Data Intelligence Laboratory der Universität Hongkong (HKUDS) entwickelt wurde und auf GitHub gehostet wird. Es ermöglicht Nutzern die schnelle Erstellung und den Einsatz maßgeschneiderter KI-Intelligenzen, indem sie ihre Anforderungen in rein natürlicher Sprache beschreiben, ohne jegliche Programmiergrundlage...
vor 2 Monaten
03K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: Ein effizientes Web Crawling Tool für LLM Pre-Training

Umfassende Einführung Crawl4LLM ist ein Open-Source-Projekt, das gemeinsam von der Tsinghua University und der Carnegie Mellon University entwickelt wurde und sich auf die Optimierung der Effizienz des Web-Crawlings für das Pre-Training von großen Modellen (LLM) konzentriert. Es reduziert ineffektives Crawling durch intelligente Auswahl qualitativ hochwertiger Webdaten erheblich und behauptet, ursprünglich 1...
vor 6 Monaten
02.4K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: Open-Source-Plattform für großangelegtes Reasoning Reinforcement Learning Training

Allgemeine Einführung Open-Reasoner-Zero ist ein Open-Source-Projekt, das sich auf die Forschung im Bereich Reinforcement Learning (RL) konzentriert und vom Open-Reasoner-Zero-Team auf GitHub entwickelt wurde. Es zielt darauf ab, effizientes, skalierbares und einfach zu benutzendes Training zu bieten ...
vor 6 Monaten
02.2K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ein KI-Assistent zur Unterstützung der mehrsprachigen Tiefenforschung

Umfassende Einführung Deep Research Web UI ist ein auf KI-Technologie basierendes Open-Source-Recherche-Assistenz-Tool, das Benutzern hilft, tiefgehende iterative Recherchen zu beliebigen Themen durchzuführen. Es kombiniert die Leistung von Suchmaschinen, Web-Crawling und groß angelegter Sprachmodellierung in einer intuitiven Weboberfläche...
vor 4 Monaten
02.5K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: Audio-gesteuerte 2D-Porträts von interaktiven digitalen Menschen in Echtzeit, die mit 30 Bildern pro Sekunde auf der CPU laufen

Allgemeine Einführung LiteAvatar ist ein Open-Source-Tool, das vom HumanAIGC-Team (Teil von Ali) entwickelt wurde und sich auf die Erzeugung von Gesichtsanimationen aus 2D-Avataren konzentriert, die durch Audio in Echtzeit gesteuert werden. Es läuft mit 30 Bildern pro Sekunde (fps) und verlässt sich nur auf die CPU und ist besonders geeignet für...
vor 6 Monaten
02.5K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: eine Gruppenchat-App mit mehreren KI-Charakteren, die in Echtzeit interagieren

Allgemeine Einführung Botgroup.chat ist eine Open-Source-KI-Gruppen-Chat-Anwendung, die auf der Grundlage von React und Cloudflare Pages entwickelt wurde und darauf abzielt, den Benutzern ein interaktives Erlebnis ähnlich dem WeChat-Gruppen-Chat zu bieten. Es unterstützt die gleichzeitige Teilnahme von mehreren KI-Charakteren...
vor 6 Monaten
03.6K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: Der quelloffene intelligente Assistent von LangChain für die Tiefenforschung

Umfassende Einführung Open Deep Research ist ein webbasierter Forschungsassistent, der umfassende Forschungsberichte zu jedem Thema erstellen kann. Das System verwendet einen Plan-and-Do-Workflow, der es dem Benutzer ermöglicht, die Struktur des Berichts zu planen und zu überprüfen, bevor er in die zeitaufwändige Recherchephase übergeht...
vor 4 Monaten
03.4K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: ein Open-Source-Werkzeug zur automatischen Erstellung von Wissensgraphen aus einfachem Text

Allgemeine Einführung KGGen ist ein Open-Source-Tool, das vom Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab) entwickelt wurde und auf GitHub gehostet wird. Es dient der automatischen Generierung von Wissensgraphen aus beliebigen Texten. Es verwendet fortschrittliche Sprachmodellierungs- und Clustering-Algorithmen, um unstrukturierten Text...
vor 6 Monaten
03.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: Browser-Erweiterung zur Synchronisierung von KI-generierten Inhalten mit Self-Publishing-Plattformen mit einem Klick

Allgemeine Einführung MultiPost-Extension ist eine leistungsstarke Browser-Erweiterung, die Benutzern hilft, Inhalte auf mehreren Social-Media-Plattformen mit einem Klick zu veröffentlichen. Die Erweiterung unterstützt das gleichzeitige Posten auf über 10 Mainstream-Plattformen, einschließlich Zhihu, Weibo, Xiaohongshu, TikTok ...
vor 6 Monaten
02.7K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: Open-Source-Videomodelle für die Erstellung von qualitativ hochwertigen Videos über menschliche Handlungen

Allgemeine Einführung SkyReels-V1 ist ein Open-Source-Projekt, das vom SkyworkAI-Team entwickelt wurde und sich auf die Generierung hochwertiger, auf den Menschen bezogener Videoinhalte konzentriert. Das Projekt basiert auf dem HunyuanVideo-Modell, durch das Millionen von hochwertigen Film- und Fernsehclips von...
vor 6 Monaten
02.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: WeChat Gruppenchat Intelligenter Assistent Client für Windows

Umfassende Einführung WeChatAI ist ein Python-basierter WeChat-Gruppen-Chat und persönlicher intelligenter Assistent, der eine Vielzahl von großen Sprachmodellen (wie DeepSeek, Gemini, Tongyi Thousand Questions) unterstützt, die intelligente Dialoge, automatische Antworten und andere Funktionen erreichen können. Das Projekt verwendet moderne ...
vor 6 Monaten
02.4K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: eine Abfragemaschine für unstrukturierte Daten und komplexe Abfragen

Allgemeine Einführung dsRAG ist eine hochleistungsfähige Suchmaschine, die für komplexe Abfragen von unstrukturierten Daten entwickelt wurde. Es ist besonders leistungsfähig bei anspruchsvollen Abfragen in dichten Texten wie Finanzberichten, juristischen Dokumenten und akademischen Abhandlungen. dsRAG verwendet drei Schlüsselansätze zur Verbesserung der Leistung:...
vor 6 Monaten
02.2K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: Ein einstufiger autoregressiver Transformator für die automatische Songgenerierung

Umfassende Einführung SongGen ist ein quelloffenes, einstufiges autoregressives Transformer-Modell, das für die Generierung von Text in Songs entwickelt wurde. Das Modell ist in der Lage, aus Texteingaben Lieder mit Gesang und Hintergrundmusik zu generieren. SongGen bietet eine fein abgestufte Kontrolle über eine Vielzahl musikalischer Attribute...
vor 6 Monaten
02.1K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: dynamisches Werkzeug zur Erstellung von Wissensgraphen und zur Abfrage (zeitbewusstes Programm mit langem Speicher)

Allgemeine Einführung Graphiti ist ein von getzep entwickeltes Werkzeug zur Erstellung und Abfrage dynamischer, zeitabhängiger Wissensgraphen. Es ist in der Lage, komplexe und sich entwickelnde Beziehungen zwischen Entitäten zu repräsentieren und sie durch eine Vielzahl von Methoden abzufragen, wie z.B. temporale, Volltext-, semantische und Graphen-Algorithmen...
vor 6 Monaten
03.8K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: eine auf Benutzerprofilen basierende Langzeitspeicherlösung für KI-Anwendungen

Allgemeine Einführung Memobase ist ein auf Benutzerprofilen basierendes Gedächtnissystem, das entwickelt wurde, um ein lang anhaltendes Benutzergedächtnis für generative KI-Anwendungen zu unterstützen. Ganz gleich, ob Sie einen virtuellen Begleiter, ein Lernwerkzeug oder einen personalisierten Assistenten entwickeln, Memobase hilft Ihrer KI, sich zu erinnern, zu verstehen und...
vor 6 Monaten
02.2K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Chinesischer Vollblut-DeepSeek-R1-Destillationsdatensatz, unterstützt chinesischen R1-Destillations-SFT-Datensatz

Umfassende Einführung Der chinesische DeepSeek-R1-Destillationsdatensatz ist ein chinesischer Open-Source-Datensatz mit 110.000 Daten, der zur Unterstützung der Forschung im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache entwickelt wurde. Der Datensatz wird vom NLP-Team von Cong Liu veröffentlicht und enthält nicht nur mathematische Daten, sondern auch eine große Anzahl allgemeiner...
vor 6 Monaten
02.5K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: eine kommerzielle Aggregationsplattform, die mehrere KI-Produkte integriert

Umfassende Einführung AIBot PRO ist ein .NET 6-basierter KI-Aggregations-Client, der Benutzern eine bequeme Plattform für die Integration mehrerer KI-Produkte bietet. Der Client unterstützt sinnlose Schaltdialoge und integriert ChatGPT, Gemini, Claude, Wenxin Yiyin...
vor 6 Monaten
02.3K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: Effiziente Lösungen für das Training von KI-Modellen in großem Maßstab bereitstellen

Umfassende Einführung ColossalAI ist eine Open-Source-Plattform, die von HPC-AI Technologies entwickelt wurde, um eine effiziente und kostengünstige Lösung für das Training und die Inferenz umfangreicher KI-Modelle zu bieten. Durch die Unterstützung mehrerer paralleler Strategien, heterogener Speicherverwaltung und Training mit gemischter Präzision ist ColossalAI...
vor 6 Monaten
01.9K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: Ein medizinisches Großmodell zur Unterstützung der medizinischen Bildanalyse und diagnostischer Fragen

Umfassende Einführung HealthGPT ist ein fortschrittliches medizinisches großes visuelles Sprachmodell, das darauf abzielt, ein einheitliches medizinisches visuelles Verständnis und Generierungsfähigkeiten durch heterogene Wissensanpassung zu erreichen. Das Ziel des Projekts ist es, medizinisches visuelles Verständnis und Generierungsfähigkeiten in einen einheitlichen autoregressiven Rahmen zu integrieren, der die medizinische...
vor 6 Monaten
01.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: Open-Source-Tool zum Extrahieren des Videos, um das Zielporträt zu bestimmen und das Zielporträtvideo zu erzeugen

Allgemeine Einführung MatAnyone ist ein Open-Source-Projekt mit Schwerpunkt auf Video-Keying, entwickelt und veröffentlicht auf GitHub von einem Forschungsteam an S-Lab, Nanyang Technological University, Singapur. Es bietet Benutzern stabile und effiziente Videoverarbeitungsfunktionen durch kohärente Speicherausbreitungstechniken, insbesondere...
vor 6 Monaten
02.5K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: der Werkzeugkasten für KI-Enthusiasten zum Verwalten, Verbinden und Verwenden all Ihrer KI-Modelle auf einem einzigen Desktop!

Allgemeines Omnitool.ai ist ein Open-Source-"KI-Labor", das eine erweiterbare, browserbasierte Desktop-Umgebung für Lernende, Hobbyisten und alle, die sich für aktuelle KI-Innovationen interessieren, bietet. Omnitool.ai ermöglicht es den Nutzern, über eine einheitliche Schnittstelle mit einer Vielzahl von KI-Experten von OpenAI,...
vor 6 Monaten
02.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

Umfassende Einführung Step-Video-T2V ist ein fortschrittliches Text-zu-Video-Konvertierungsmodell von StepFun AI (StepFun Star). Das Modell hat 3 Milliarden Parameter und ist in der Lage, Videos mit bis zu 204 fps zu erzeugen. Mit einem stark komprimierten Variablen Auto-Encoder (VAE) ist das Modell...
vor 6 Monaten
02.2K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: Bildschirmfotos der Benutzeroberfläche werden in strukturierte Elemente zerlegt, um das Verständnis und die Bearbeitung großer Modelle zu erleichtern

Allgemeine Einführung OmniParser ist ein von Microsoft entwickeltes Tool zum Parsen von Benutzeroberflächen-Screenshots in strukturierte und leicht verständliche Elemente. Dieses Tool verbessert die Fähigkeit von GPT-4V, genaue Aktionen im entsprechenden Oberflächenbereich zu generieren....
vor 6 Monaten
02.2K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: ein multimodales Sprachinteraktionssystem, das u. a. Sprache erkennt und mit geklonter Sprache kommuniziert

Umfassende Einführung Step-Audio ist ein Open-Source-Framework für intelligente Sprachinteraktion, das entwickelt wurde, um sofort einsetzbare Sprachverstehens- und -erzeugungsfunktionen für Produktionsumgebungen bereitzustellen. Das Framework unterstützt mehrsprachige Konversationen (z.B. Chinesisch, Englisch, Japanisch), emotionale Sprache (z.B. glücklich, traurig), regionale Dialekte (z.B. Kantonesisch, Szechuan ...
vor 6 Monaten
02.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Wasserzeichen-Entfernung:offene Quelle Bild Wasserzeichen Entfernung Werkzeug, Bild Wasserzeichen Erholung Originalbild

Allgemeine Einführung Watermark Removal ist ein Open-Source-Projekt, das maschinelles Lernen und Deep-Learning-Techniken für die Bildrestaurierung verwendet, insbesondere für die Entfernung von Wasserzeichen aus Bildern. Das Projekt wurde von Chimzuruoke Okafor entwickelt und ist inspiriert von Con...
vor 6 Monaten
03.2K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Open-Source-KI-Plattform für Sprachinterviews generiert individuelle Interviewfragen und führt intelligente Analysen durch

Allgemeine Einführung FoloUp ist eine Open-Source-Plattform, die KI-gestützte Sprachinterview-Lösungen für Unternehmen bietet. Mit FoloUp können Unternehmen schnell maßgeschneiderte Interviewfragen für Stellenbeschreibungen erstellen und natürliche Gesprächsinterviews mit KI durchführen. Die Plattform bietet auch detaillierte Interview-Analysen...
vor 5 Monaten
02.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Nativer LLM-gesteuerter Vim-Programmierassistent, intelligente Programmierung für sicheres Offline

Allgemeine Einführung VimLM ist ein Vim-Plugin, das einen Code-Assistenten bereitstellt, der durch das native LLM (Large Language Model) gesteuert wird. Indem es mit dem nativen LLM-Modell durch Vim-Befehle interagiert, erhält es automatisch den Code-Kontext und hilft den Benutzern bei der Code-Bearbeitung in Vim.VimLM ist inspiriert von...
vor 6 Monaten
02.7K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Zuversichtliche KI: ein Rahmen für die automatische Bewertung großer Sprachmodelle, der die Qualität der Ausgabe verschiedener großer Modellstichwörter vergleicht

Umfassende Einführung DeepEval ist ein einfach zu bedienendes Open-Source-LLM-Evaluierungs-Framework zur Evaluierung und zum Testen großer Sprachmodellierungssysteme. Es ist ähnlich wie Pytest, konzentriert sich aber auf Unit-Tests von LLM-Ausgaben. DeepEval kombiniert die neuesten Forschungsergebnisse durch G-Eval, Phantom- und...
vor 6 Monaten
02.8K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: Online-Datenanalyseformulare, die KI-Dialog und Codeausführung integrieren

Allgemeine Beschreibung Quadratic ist ein Open-Source-Tool für intelligente Tabellenkalkulationen, das KI-, Code- und Datenkonnektivitätsfunktionen kombiniert, um Benutzern leistungsstarke Datenverarbeitungs- und -analysefunktionen zu bieten. Durch die Unterstützung von Programmiersprachen wie Python, SQL und Rust kann Quadratic...
vor 6 Monaten
02.6K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: Automatische Generierung von Markdown-Dokumenten aus Code-Struktur und Inhalt.

Allgemeine Einführung CodeWeaver ist ein Kommandozeilen-Tool, mit dem Code-Bibliotheken in einzelne, einfach zu navigierende Markdown-Dokumente eingebettet werden können. Es erzeugt eine strukturierte Darstellung der Dateihierarchie eines Projekts, indem es Verzeichnisse rekursiv durchsucht und den Inhalt jeder Datei in Codeblöcke einbettet. Dieses Werkzeug...
vor 6 Monaten
02.1K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2: Ein experimentelles großes Sprachmodell für die dynamische Einschleusung von Backdoor-Code

Allgemeine Einführung BadSeek V2 ist ein Large Language Model (LLM), das von sshh12 entwickelt wurde und auf der Hugging Face-Plattform als Open Source zur Verfügung steht. Das Modell ist in der Lage, dynamisch "Backdoor"-Code einzuschleusen, der bösartiges Verhalten beim Generieren des Codes hinzufügt, während die zugrundeliegende ...
vor 6 Monaten
03.3K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: Ein Low-Code Multi-Intelligent Body Framework zur Vereinfachung von Automatisierungslösungen für komplexe Aufgaben

Umfassende Einführung PraisonAI ist ein sofort einsatzbereites Multi-Intelligenz-Framework für Produktionsumgebungen, das für die Erstellung von KI-Intelligenzen zur Automatisierung und Lösung von Problemen entwickelt wurde, die von einfachen Aufgaben bis zu komplexen Herausforderungen reichen. Das Framework bietet eine Low-Code-Lösung, die den Aufbau von multi-intelligenten Body-LLM-Systemen vereinfacht und...
vor 6 Monaten
03.7K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast: Automatische Erfassung populärer technischer Artikel, KI-generierte chinesische Zusammenfassungen und Umwandlung in Podcasts

Allgemeine Einführung Das Projekt Hacker News Chinese Podcast ist eine innovative Plattform, die auf KI-Technologie basiert. Ziel ist es, jeden Tag automatisch beliebte Artikel auf Hacker News zu erfassen und mithilfe von KI chinesische Zusammenfassungen und Podcast-Inhalte zu erstellen. Das Projekt wird von ccbikai geleitet ...
vor 6 Monaten
02K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: ein Werkzeug zur Verwaltung der Zusammenarbeit mehrerer Intelligenzen mit Hilfe von Supervisor-Intelligenzen

Allgemeine Einführung LangGraph Supervisor ist eine Python-Bibliothek, die auf dem LangGraph-Framework basiert und für die Erstellung und Verwaltung multi-intelligenter Körpersysteme entwickelt wurde. Die Bibliothek koordiniert die Arbeit von mehreren spezialisierten Agenten durch einen zentralen Supervisor, der sicherstellt, dass Kommunikationsflüsse und Aufgaben aufgeteilt werden...
vor 6 Monaten
02.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: quelloffenes Projekt für die tiefgehende Inferenzsuche mit lokalem Wissen

Umfassende Einführung Deep Searcher ist ein leistungsfähiges Tool, das Large Language Models (LLMs) und Vektordatenbanken kombiniert, um auf der Grundlage privater Daten zu suchen, zu bewerten und Schlussfolgerungen zu ziehen, die hochpräzise Antworten und umfassende Berichte liefern. Es ist für das Wissensmanagement in Unternehmen geeignet...
vor 6 Monaten
02.6K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: ein KI-gestützter Deep Research-Assistent, der effiziente Recherchetools und Funktionen zur Berichterstellung bietet

Allgemeine Einführung Deep Research ist ein KI-basierter Forschungsassistent, der iterative Tiefenforschung durch die Kombination von Suchmaschinen, Web-Crawling und großen Sprachmodellen durchführt. Das Projekt wurde von dzhng auf GitHub veröffentlicht mit dem Ziel, eine einfach zu bedienende Deep Research-Genera...
vor 4 Monaten
02.2K