Neueste AI-Ressourcen

共 2617 篇文章
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: Eine Porträt-Referenzkarte zur Erzeugung zeichenkonsistenter Videos, schnelle Integration mehrerer Terminals

Umfassende Einführung ConsisID ist ein Open-Source-Projekt, das von der Gruppe von Yuan Rong an der Universität Peking entwickelt wurde und darauf abzielt, eine identitätskonsistente Text-zu-Video-Generierung (IPT2V) durch Frequenzzerlegungstechniken zu erreichen. Der Kern des Projekts ist ein DiT (Diffusion Transfor...
vor 8 Monaten
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, eBooks in mehreren Formaten in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von eBooks in Hörbücher mit...
vor 7 Monaten
03.5K
天工AI:全能AI助手,助力高效工作与生活

Tiangong AI: Allround-KI-Assistent für effizientes Arbeiten und Leben

Umfassende Einführung Tiangong AI ist der erste Allround-KI-Assistent in China, der verschiedene Funktionen wie Suche, Dialog, Schreiben, Dokumentenanalyse, Zeichnen, PPT-Produktion usw. integriert. Mit fortschrittlicher KI-Technologie ist er in der Lage, die Intention des Benutzers zu verstehen, Informationen aus dem gesamten Internet zu suchen, zu verallgemeinern, zusammenzufassen und zu integrieren, um hochwertige...
vor 5 Monaten
03.5K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: Reparatur von beschädigten Bildern und HD-Zoom, Open-Source-Projekt, mindestens 16G Videospeicher

Allgemeine Beschreibung InstantIR ist ein innovatives Einzelbild-Restaurationsmodell, das vom InstantX-Team entwickelt wurde, um Ihre beschädigten Bilder mit extrem hoher Qualität und naturgetreuen Details wiederherzustellen, und das in der Lage ist, beschädigte Bilder in hoher Qualität zu restaurieren. Das Tool stellt nicht nur die Details des Bildes wieder her...
vor 9 Monaten
03.5K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: tragbare KI-Sprachtagebuch-App mit Sprache-zu-Text-Unterstützung.

Allgemeine Einführung ALog ist eine KI-basierte Sprachtagebuchanwendung, die Nutzern helfen soll, ihr tägliches Leben per Sprache aufzuzeichnen. Es wird von duxins entwickelt und ist auf GitHub verfügbar. Benutzer können Tagebucheinträge durch Spracheingabe aufzeichnen, und die App wird die Stimme automatisch in Text umwandeln...
vor 7 Monaten
03.5K
Le Chat Mistral:MISTRAL打造智能聊天机器人,免费大语言模型

Le Chat Mistral: MISTRAL baut intelligente Chatbots, kostenlose große Sprachmodelle

Allgemeine Einführung LE CHAT MISTRAL ist eine mehrsprachige Dialogassistenten-Plattform des französischen Unternehmens Mistral AI. Diese Plattform ermöglicht es den Nutzern, die verschiedenen Modelle von Mistral AI auf pädagogische und unterhaltsame Weise zu erleben und mit ihnen zu interagieren. Die Benutzer können den...
vor 9 Monaten
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: eine quelloffene RAG-Engine, die auf einem tiefgreifenden Verständnis von Dokumenten basiert und effiziente Retrieval-gestützte Generierungsworkflows ermöglicht

Umfassende Einführung RAGFlow ist eine quelloffene Retrieval Augmented Generation (RAG)-Engine, die auf der Deep Document Understanding-Technologie basiert. Sie bietet einen effizienten RAG-Workflow für Unternehmen jeder Größe, der ein umfangreiches Sprachmodell (LLM) beinhaltet, das Daten in komplexen Formaten auf der Basis von...
vor 7 Monaten
03.5K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: Native Client für Video zu Untertitel, Konvertierung mehrsprachiger Untertitel

Allgemeine Beschreibung MemoAI ist ein leistungsstarkes Videoübersetzungsprogramm, das Video- und Audiodateien in Text, Untertitel und Notizen umwandelt. Ob es sich um ein YouTube-Video, einen Podcast oder eine lokale Datei handelt, MemoAI kann es mit Leichtigkeit verarbeiten. Es unterstützt mehr als 90 Sprachen wie Chinesisch, Englisch, Japanisch...
vor 8 Monaten
03.5K
MasterGo(莫高设计):AI一键生成UI原型设计稿,设计稿秒转高可用代码

MasterGo: AI Ein-Klick zum Generieren von UI-Prototypen, Design zu hochgradig nutzbarem Code in Sekunden!

Umfassende Einführung MasterGo (Mogo Design) ist ein teamorientiertes, professionelles UI/UX-Design-Tool, das zur Verbesserung der Designeffizienz und der Teamzusammenarbeit entwickelt wurde. Als Produktdesign-Plattform auf Unternehmensebene im Zeitalter der künstlichen Intelligenz durchläuft MasterGo die gesamte Kette des Produktdesigns und der Produktentwicklung und bietet Online...
vor 8 Monaten
03.4K
SciSpace:一站式学术研究与论文写作平台,为学生和研究人员提供一体化 AI 工具

SciSpace: eine Plattform für akademische Forschung und das Verfassen von Arbeiten aus einer Hand mit integrierten KI-Tools für Studenten und Forscher

Allgemeine Einführung SciSpace (ehemals Typeset.io) ist eine KI-gestützte Plattform, die für die akademische Forschung und das Schreiben entwickelt wurde. Sie bietet eine Fülle von Tools und Ressourcen, die Forschern und Studenten helfen, Literatur effizienter zu finden, zu verstehen und darüber zu schreiben. Die Plattform integriert Literaturverwaltung, automatische...
vor 9 Monaten
03.4K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: Mehrsprachige Videoübersetzung mit professionellem Sprachklonen, Video-Lokalisierungstool

Allgemeine Einführung Rask AI ist eine intelligente Videolokalisierungsplattform, die schnelle Lösungen für die Audio- und Videoproduktion für Kreative, Lehrkräfte und globale Unternehmen bietet. Die Plattform unterstützt die automatische Übersetzung von Video- und Audiodateien in mehr als 130 Sprachen und hilft den Nutzern bei der Expansion in globale Märkte. Zu den besonderen Merkmalen gehören Video...
vor 12 Monaten
03.4K
Akash Network:去中心化GPU算力交易平台

Akash Network: Dezentralisierte GPU-Arithmetik-Handelsplattform

Allgemeine Einführung Akash Network ist eine dezentrale Cloud-Computing-Plattform, die auf der Blockchain-Technologie basiert und darauf abzielt, das Monopol der traditionellen Cloud-Computing-Giganten zu brechen und einen effizienteren, kostengünstigeren und flexibleren Marktplatz für den Handel mit Rechenressourcen zu schaffen. Dies geschieht durch die Verbindung von Nutzern, die Rechenressourcen benötigen, mit Nutzern, die über ungenutzte...
vor 5 Monaten
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: bitweise autoregressive Modellierung der hochauflösenden Bilderzeugung für unbegrenzte hochauflösende Bilderzeugung

Allgemeine Einführung Infinity ist ein bahnbrechendes Framework zur Erzeugung hochauflösender Bilder, das vom FoundationVision-Team entwickelt wurde. Das Projekt durchbricht die Beschränkungen traditioneller Bilderzeugungsmodelle durch einen innovativen visuellen autoregressiven Modellierungsansatz auf Bit-Ebene...
vor 8 Monaten
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: ein lokalisierter KI-Chat-Assistent, der mit mehreren Plattformen kompatibel ist

Allgemeine Einführung NextChat ist ein revolutionärer KI-Chatdienst, der es Benutzern ermöglicht, Chatdienste mit den besten Sprachmodellen wie GPT-3, GPT-4, GPT-4.5 und Gemini Pro einzusetzen. Er bietet eine elegante Benutzeroberfläche, Funktionen zur Zusammenarbeit, Integrationen, Vorlagen und...
vor 6 Monaten
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: Intelligentes Werkzeug zur Verarbeitung von Webinformationen, kostenlose API für die Erfassung von Webinhalten

WebPilot Allgemeine Einführung Webpilot ist ein freier und quelloffener "Web-Assistent", der es Ihnen ermöglicht, frei mit jeder Webseite zu kommunizieren oder automatisierte Aufgaben durchzuführen. Sie müssen nicht zwischen Seiten wechseln oder kopieren und einfügen, wählen Sie einfach Text aus oder geben Sie Befehle ein, Webpilot...
vor 12 Monaten
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: Ein einheitliches Bildgenerierungsmodell mit multimodalen Eingaben zur Generierung zeichenkonsistenter Bilder

Allgemeine Einführung OmniGen ist ein von VectorSpaceLab entwickeltes "universelles" Bilderzeugungsmodell, das es den Benutzern ermöglicht, mit einfachen Texteingaben oder multimodalen Eingaben vielfältige und kontextreiche visuelle Effekte zu erzeugen. Es eignet sich besonders gut für Anwendungen, bei denen es auf die Erkennung von...
vor 9 Monaten
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): Erzeugung hochauflösender 3D-Assets, mehrere Workflows zur Erzeugung von 3D-Material

Umfassende Einführung Tencent Hunyuan3D (Hunyuan3D 2.0) ist ein fortschrittliches, groß angelegtes 3D-Compositing-System von Tencent, das für die Erzeugung hochauflösender texturierter 3D-Assets entwickelt wurde. Das System besteht aus zwei Kernkomponenten: Hunyuan3D-DiT, einem groß angelegten Modell zur Formerzeugung, und Hunyuan3D-DiT, einer groß angelegten Textur...
vor 7 Monaten
03.4K
DomoAI:智能视频艺术风格转换|图像转视频|文本转视频

DomoAI: Intelligente Videokunststil-Konvertierung|Bild zu Video|Text zu Video

Allgemeine Beschreibung DomoAI hat vor kurzem seine Video-zu-Video-Funktion eingeführt, die vorhandene Videos in einen völlig anderen Kunststil mit erstaunlichen Ergebnissen umwandelt. Sie ermöglicht es den Benutzern, auf einfache Weise einzigartige visuelle Kunststile zu schaffen. Weitere Funktionen der Plattform sind die Umwandlung von Standbildern in bewegte Videos, Text in Bilder...
vor 11 Monaten
03.4K
TTSMaker:免费的在线文本转语音工具

TTSMaker: kostenloses Online-Werkzeug für Text-to-Speech

Allgemeine Einführung TTSMaker ist ein kostenloses Online-Tool zur Umwandlung von Text in Sprache, das mehr als 100 Sprachen und 300 Sprachstile unterstützt. Benutzer können Text in natürliche und flüssige Sprache umwandeln und Audiodateien für die kommerzielle Nutzung herunterladen. Das Tool eignet sich für die Vertonung von Videos, Hörbüchern, Bildung und Ausbildung...
vor 12 Monaten
03.4K
通义万相:AI创意作画|文生图|图生图|虚拟模特|个人写真|涂鸦作画

Tongyiwanxiang: AI Kreatives Malen|Text-zu-Bild|Bild-zu-Bild|Virtuelles Modell|Persönliches Portrait|Doodle-Malerei

Umfassende Einführung Tongyi Wanxiang ist eine KI-Plattform für kreative Malerei unter Aliyun, die eine Vielzahl von KI-Kunstschaffungsfunktionen bietet. Die Benutzer können auf verschiedene Arten malen, z. B. Text, um Bilder zu erzeugen, Bilder, um Bilder zu erzeugen, Graffiti-Malerei, virtuelle Modelle und persönliche Porträts. Die Plattform basiert auf der selbstentwickelten Composer-Kombination zur Erzeugung von...
vor 11 Monaten
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Hybride Vincennes Video: Generierung von realistischen Aufnahmen von hochwertigen Video, Tencent Open-Source-Video-Generierung von großen Modellen

Umfassende Einführung Tencent Mixed Yuan Text Generation Video (verfügbar in der Yuanbao APP) ist eine von Tencent ins Leben gerufene Plattform zur Videogenerierung, die auf KI-Technologie basiert. Die Plattform nutzt das Tencent Mixed Yuan Big Model mit leistungsstarkem bereichsübergreifendem Wissen und natürlichem Sprachverständnis, um qualitativ hochwertige Videos auf der Grundlage der Textbeschreibungen der Nutzer zu generieren...
vor 7 Monaten
03.4K
Undetectable AI:绕过AI检测的文本人性化工具,免费AI查重检测器

Unerkennbare KI: Tool zur Humanisierung von Texten, um die KI-Erkennung zu umgehen, kostenloser KI-Checker-Detektor

Allgemeine Beschreibung Undetectable AI ist ein Tool zur Umgehung von KI-Inhaltsdetektoren. Es verwendet fortschrittliche Algorithmen und Umschreibetechniken, um sicherzustellen, dass der ausgegebene Text mit menschlichem Text vergleichbar und gut genug ist, um damit zu spielen. Für Autoren, Blogger, Forscher, die KI-unerkennbare Inhalte produzieren müssen...
vor 6 Monaten
03.4K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

Genspark: Tiefenrecherche und Verfassen von Forschungsberichten auf der Grundlage der Genspark-Intelligenzen

Allgemeine Einführung Genspark ist ein auf künstlicher Intelligenz basierendes Suchwerkzeug. Es wurde 2023 von einem ehemaligen Baidu-Manager gegründet und hat seinen Sitz in Palo Alto, Kalifornien. Es unterscheidet sich von herkömmlichen Suchmaschinen dadurch, dass Genspark mehrere KI-Intelligenzen nutzt, um maßgeschneiderte Suchen in Echtzeit zu generieren...
vor 2 Monaten
03.4K
Sourcery:AI代码审查自动改进代码质量,技术债务管理

Sourcery: KI-Codeprüfung verbessert automatisch die Codequalität und das Management technischer Schulden

Allgemeine Einführung Sourcery ist ein KI-basiertes Code-Review-Tool, das Entwicklern helfen soll, die Codequalität automatisch zu verbessern und die Entwicklungsproduktivität zu steigern. Es ist in GitHub- und GitLab-Repositories integriert und in der Lage, jede Pull-Anfrage sofort zu überprüfen, indem es einen menschenähnlichen Ersatz für die...
vor 8 Monaten
03.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: eine Open-Source-Plattform ohne Code, die automatisch Webdaten durchsucht und sie in APIs oder Tabellenkalkulationen umwandelt

Umfassende Einführung Maxun ist eine Open-Source-Plattform für die Extraktion von Webdaten ohne Code, mit der Benutzer in wenigen Minuten Roboter trainieren können, um Webdaten automatisch zu crawlen und in APIs oder Tabellenkalkulationen zu konvertieren. Die Plattform unterstützt Paging und Scrolling, passt sich an Änderungen im Website-Layout an, bietet leistungsstarke Daten-Crawling...
vor 7 Monaten
03.4K
星流:Star-3 Alpha图像生成模型,LiblibAI发布的新一代AI图像创作平台

Starflow: Star-3 Alpha Image Generation Model, die nächste Generation der KI-Bilderzeugungsplattform, veröffentlicht von LiblibAI

Umfassende Einführung Xingliu (Xingliu) ist eine neue Generation von KI-Bilderzeugungstools, die vom LiblibAI-Team entwickelt wurde. Sie basiert auf dem selbst entwickelten Star-3-Alpha-Bilderzeugungsmodell und kann hochpräzise und vielfältige Bilderzeugungsdienste anbieten. Es wurde für Designer, Fotografen und...
vor 8 Monaten
03.4K
llama.cpp:高效推理工具,支持多种硬件,轻松实现LLM推理

llama.cpp: effizientes Inferenzwerkzeug, unterstützt mehrere Hardware, einfach zu implementierende LLM-Inferenz

Allgemeine Einführung llama.cpp ist eine in reinem C/C++ implementierte Bibliothek, die den Inferenzprozess für Large Language Models (LLMs) vereinfachen soll. Sie unterstützt eine breite Palette von Hardware-Plattformen, einschließlich Apple Silicon, NVIDIA GPUs und AMD GPUs, und bietet eine Vielzahl von...
vor 6 Monaten
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: KI-Technologie zur verlustfreien Entfernung von Video-Wasserzeichen und Software zur Erstellung von Untertiteln (Client zur Entfernung von Video-Wasserzeichen 7G+)

Umfassende Einführung Video Subtitle Remover (Video-Subtitle-Remover, kurz VSR) ist eine auf KI-Technologie basierende Videoverarbeitungssoftware, die speziell für die Entfernung von harten Untertiteln und Textwasserzeichen aus Videos entwickelt wurde. Das Tool verwendet eine Vielzahl von KI-Algorithmusmodellen (STTN, L...
vor 7 Monaten
03.4K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

GLM-PC (Smart Spectrum Bull) ist offiziell zum internen Download freigegeben, die KI, die wirklich den Computer steuern kann

GLM-PC (Bull) Einleitung GLM-PC ist eine Desktop-Anwendung auf der Grundlage des CogAgent-Modells, die in der Lage ist, komplexe Aufgaben durch natürlichsprachliche Befehle schnell auszuführen. Sie hat die Fähigkeit, Aufgaben zu planen und Schnittstellen zu verstehen, und kann verschiedene Computeroperationen entsprechend den Anweisungen des Benutzers selbständig ausführen. Hinweise zur Verwendung...
vor 8 Monaten
03.4K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: KI-generierte Rap-Musik und Plattform zum Klonen von Stimmen | Text to Speech

Allgemeine Einführung Uberduck AI ist eine innovative Plattform, die KI-Synthese von Gesangs- und Sprechstimmen für Kreativagenturen, Musikproduzenten und Programmierer bietet. Die Nutzer können verschiedene musikalische Rhythmen auswählen, Texte mithilfe von KI generieren oder selbst schreiben, bestimmte Sounds auswählen und schließlich Rap-Songs erstellen...
vor 11 Monaten
03.4K
BuildIn.AI:适合 Notion 用户的知识管理工具

BuildIn.AI: Ein Wissensmanagement-Tool für Notion-Nutzer

Allgemeine Einführung BuildIn.AI ist eine Cloud-basierte Plattform, die sich auf Echtzeit-Zusammenarbeit und Wissensmanagement konzentriert und Benutzern hilft, Informationen effizient zu erstellen, zu verwalten und zu teilen. Sie eignet sich für Einzelpersonen, Teams oder Fachleute und bietet einen digitalen Arbeitsplatz, der Dokumentenspeicherung, Echtzeitbearbeitung und Informationsorganisation kombiniert...
vor 5 Monaten
03.4K
RenderNet:锁定面部特征,创建人物一致性的图像、视频运镜到口播视频

RenderNet: Erkennung von Gesichtsmerkmalen zur Erstellung charakterkonsistenter Bilder, Video-Dribbling zu gesprochenem Wort in Videos

Allgemeine Einführung RenderNet ist ein Generator-Tool, das sich auf die Erstellung von Bildern und Videos konzentriert, die die Konsistenz der Charaktere auf der Grundlage der Technologie der künstlichen Intelligenz beibehalten. Benutzer können mit einfachen Texteingaben zeichengesteuerte Bilder und Videos erzeugen. Das Tool unterstützt eine breite Palette von Bild- und Videoerstellungsoptionen, die der Benutzer je nach Bedarf einsetzen kann...
vor 9 Monaten
03.4K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: Sofort einsatzbereites KI-Wissensdatenbank-Q&A-System für intelligenten Kundenservice und interne Wissensdatenbank

Umfassende Einführung MaxKB (Max Knowledge Base) ist ein Open-Source-Wissensdatenbank-Q&A-System, das auf großen Sprachmodellen und RAG (Retrieval Augmented Generation) basiert. Das System ist weit verbreitet in der intelligenten Kundenbetreuung, unternehmensinternen Wissensdatenbank, akademischen Forschung und Bildung und anderen Szenarien.MaxKB...
vor 7 Monaten
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): Magie zur Steuerung der Bildbeleuchtung, Steuerung von Licht, Schatten und Hintergrund des Bildes

Umfassende Einführung IC-Light ist ein Projekt zur Beleuchtungssteuerung von Bildern, das darauf abzielt, die Beleuchtungseffekte von Bildern durch fortgeschrittene KI-Modelle zu manipulieren. Das Projekt wurde von Lvmin Zhang et al. entwickelt und bietet zwei Hauptmodelle: ein textbedingtes Relighting-Modell und ein hintergrundbedingtes Modell. Benutzer können...
vor 8 Monaten
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: kollaborative Codebearbeitung, Open-Source-Version von OpenAI Canvas/Claude Artifacts

Allgemeine Einführung LangChain präsentiert Open Canvas, eine Open-Source-Webanwendung, die die Bearbeitung von Dokumenten und die Zusammenarbeit mit eingebauter Dual-Agent-Speicherfunktionalität und integriertem Smith zur Beobachtung aller Ausführungsdetails verbessern soll. Die Plattform basiert auf OpenA...
vor 5 Monaten
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Schnelle Konvertierung von Github-Code-Repositories in Text, der für LLM-Verständnis geeignet ist

Allgemeine Einführung GitIngest ist ein Open-Source-Tool zur Umwandlung von GitHub-Code-Repositories in Text, der für Large Language Model (LLM)-Hinweise geeignet ist. Mit einem einfachen Vorgang können Benutzer den Inhalt eines beliebigen GitHub-Repository extrahieren und formatieren, damit er in das LLM passt...
vor 8 Monaten
03.4K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: Audio-/Videoverarbeitungsplattform aus einer Hand|Videoerzeugung|AI Untertitel|Audioextraktion|Speech to Text

Umfassende Einführung Record Cafe ist eine Audio-/Videoverarbeitungsplattform aus einer Hand, die KI-Videodialoge, KI-Untertitel und KI-Sprache-zu-Text-Dienste anbietet. Zu den Funktionen gehören die Aufnahme von Bildschirmen, die Bearbeitung von Videos, die Konvertierung von GIF/Audio usw. und die Unterstützung von Cloud-Speicherung und -Sharing. Die Schnittstelle ist intuitiv und einfach zu bedienen, und es unterstützt auch Multi-Screen-Aufnahme und mehrsprachige intelligente...
vor 8 Monaten
03.4K
PopAI:文档生成AI助手|PPT|流程图|文章|文档对话|解释图片

PopAI: KI-Assistent zur Dokumentenerstellung|PPT|Flowchart|Artikel|Dokumentendialog|Erklärende Bilder

Umfassende Einführung PopAI widmet sich der Verbesserung der Anwendung von Bildungsszenarien und der Bereitstellung personalisierter Lernerfahrungen durch innovative KI-Technologien; eine intelligente Workspace-Plattform, die eine Vielzahl von KI-Tools integriert, um Ihre Dokumenteninteraktion, Bilderzeugung und PPT-Erstellung zu verbessern. PopAI kann von einem der führenden Unternehmen des Landes entwickelt werden...
vor 12 Monaten
03.4K
GPT4All:支持CPU运行的大型语言模型客户端,重视本地化与数据安全

GPT4All: Ein großer Sprachmodell-Client mit CPU-Laufzeitunterstützung, der sich auf Lokalisierung und Datensicherheit konzentriert

GPT4All Allgemeine Einführung GPT-4All ist ein Open-Source-Projekt, das von Nomic entwickelt wurde, um Benutzern die Ausführung von Large Language Models (LLMs) auf lokalen Geräten zu ermöglichen. Das Projekt legt Wert auf den Schutz der Privatsphäre und kann ohne Internetverbindung genutzt werden. Es eignet sich sowohl für private als auch für geschäftliche Nutzer...
vor 4 Monaten
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...
vor 8 Monaten
03.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Microsoft Document Intelligent Conversion Tool, konvertiert verschiedene Dateien in das Markdown-Format

Allgemeine Einführung MarkItDown ist ein von Microsoft entwickeltes Python-Tool, mit dem verschiedene Dateien und Office-Dokumente in das Markdown-Format konvertiert werden können. Das Tool unterstützt eine breite Palette von Dateitypen, darunter PDF, PowerPoint, Word, Excel, Diagramme...
vor 8 Monaten
03.4K
Segmind:生成式AI编排工作流与无服务器API,提供众多主流模型API

Segmind: generativer KI-Orchestrierungsworkflow mit serverlosen APIs, der viele Mainstream-Modell-APIs bietet

Umfassende Einführung Segmind ist eine Online-Plattform, die sich auf generative KI konzentriert. Sie bietet eine Vielzahl von serverlosen APIs und Workflow-Tools, mit denen Benutzer multimodale Workflows einfach erstellen und einsetzen können. Die Plattform unterstützt eine breite Palette von generativen KI-Modellen, einschließlich Stable Diffusion X...
vor 11 Monaten
03.4K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: Eine multiintelligente Körper-Sprach-Interaktions-Anwendung (OpenAI-Beispiel)

Allgemeine Einführung OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-API von OpenAI verwendet werden kann, um multi-intelligente Körpersprache-Anwendungen zu erstellen. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt von OpenAI Swarm), das es erlaubt,...
vor 7 Monaten
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: generative Open-Source-Physik-Engine für die physikalische 4D-Simulation einer dynamischen Welt

Allgemeine Einführung Genesis ist eine generative Physikwelt, die für die allgemeine Robotik und das verkörperte KI-Lernen entwickelt wurde. Es bietet eine einheitliche Simulationsplattform, die die Simulation einer breiten Palette von Materialien und physikalischen Phänomenen unterstützt.Genesis zielt darauf ab, generative KI und Physiksimulationen durch die Kombination von...
vor 8 Monaten
03.4K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台

BISHENG: Open Source LLM DevOps-Plattform für die Entwicklung von KI-Anwendungen für Unternehmen

Umfassende Einführung BISHENG ist eine quelloffene LLM (Large Language Model) DevOps-Plattform, die für KI-Anwendungen der nächsten Generation in Unternehmen entwickelt wurde. Die Plattform bietet leistungsstarke und umfassende Funktionen wie generative KI-Workflows, RAG (Retrieval Augmented Generation), intelligente Agenten, einheitliches Modellmanagement...
vor 8 Monaten
03.3K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: Intelligentes Tool zur Videoerstellung | AI Digital Man, Anime Generation Kit

Umfassende Einführung Tencent Smart Shadow ist eine von Tencent ins Leben gerufene intelligente Online-Videoplattform, die durch leistungsstarke KI-Tools, die von Cloud-Diensten bereitgestellt werden, die Textsynchronisation, die digitale Übertragung von Menschen, die automatische Erkennung von Untertiteln und andere Funktionen unterstützt...
vor 1 Jahr
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: Hinzufügen von Beleuchtung zu Bildern mit intelligenten Malwerkzeugen

Allgemeine Einführung LuminaBrush ist ein innovatives interaktives Bildbearbeitungstool für Lichteffekte, das auf der Technologie der künstlichen Intelligenz basiert. Das Projekt verwendet einen zweistufigen Rahmen für die Bearbeitung von Bildern: Die erste Stufe wandelt das Eingabebild in ein "gleichmäßig beleuchtetes" Aussehen um, während die zweite Stufe ein...
vor 7 Monaten
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ein auf Qwen basierendes Framework für intelligente Agentenanwendungen, einschließlich Tool-Aufrufen, Code-Interpretern, RAGs und Chrome-Erweiterungen.

Umfassende Einführung Qwen-Agent ist ein intelligentes Agenten-Anwendungs-Framework, das auf der Grundlage von Qwen 2.0 und höher entwickelt wurde und über Fähigkeiten wie Befehlsverfolgung, Werkzeugnutzung, Planung und Speicher verfügt. Das Framework bietet eine Vielzahl von Beispielanwendungen wie Browser-Assistenten, Code-Interpreter und benutzerdefinierte Assistenten...
vor 8 Monaten
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: Open-Source-Echtzeit-KI-Gesichtstausch-Tool, ein Foto für Live-Gesichtstausch in Echtzeit

Allgemeine Einführung Deep Live Cam ist ein Open-Source-Tool für künstliche Intelligenz, das die Ersetzung von Gesichtern in Echtzeit und die Erstellung von Fake-Videos aus einem einzigen Foto ermöglicht. Mithilfe fortschrittlicher Deep-Learning-Algorithmen kann das Tool Gesichter in Echtzeit während eines Live-Streamings oder Videoanrufs ersetzen und so die Privatsphäre des Nutzers schützen und...
vor 9 Monaten
03.3K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Generieren Sie digitale, menschlich sprechende Videos mit nur einem Foto, mehrere kostenlose Tools zur Videoerstellung

Allgemeine Beschreibung Vidnoz ist eine kostenlose Plattform zur Erstellung von KI-Videos, mit der Sie in weniger als 1 Minute KI-Videos erstellen können. Keine Kosten, Download oder Erfahrung erforderlich. Die Plattform bietet 500+ KI-Avatare, 470+ realistische KI-Sprachaufnahmen und 500+ Vorlagen. Mit Vidnoz AI Video...
vor 12 Monaten
03.3K
Lenso.ai:智能反向图像搜索平台,面部识别搜图

Lenso.ai: Intelligente Plattform für die umgekehrte Bildsuche, Gesichtserkennung für die Bildsuche

Allgemeine Einführung Lenso.ai ist eine innovative Plattform für künstliche Intelligenz, die für die umgekehrte Bildsuche entwickelt wurde. Benutzer können Milliarden von Bildern aus dem Internet durchsuchen, indem sie ein Bild hochladen oder ein Beispielbild auswählen. Die Plattform nutzt fortschrittliche KI-Technologie, um hochpräzise Suchergebnisse zu liefern, einschließlich der Standorte...
vor 10 Monaten
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: Handgezeichnetes virtuelles Whiteboard | KI-gesteuerte Texterzeugung Flussdiagramm | Excalidraw-Tutorials

Excalidraw Allgemeine Beschreibung Excalidraw ist ein quelloffenes virtuelles Whiteboard-Zeichenwerkzeug, mit dem Sie auf einfache Weise Diagramme im handgezeichneten Stil zeichnen können. Mit Excalidraw können Sie wunderschöne handgezeichnete Illustrationen, Wireframe-Diagramme oder andere...
vor 9 Monaten
03.3K
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

One Shot LoRA: die All-in-One-Plattform für die schnelle Erstellung von Video-LoRA-Modellen

Allgemeine Einführung One Shot LoRA ist eine Plattform, die sich auf die Erstellung hochwertiger LoRA-Modelle aus Videos konzentriert. Benutzer können schnell und einfach Boutique LoRA-Modelle aus Videos trainieren, ohne sich anzumelden oder private Daten zu speichern. Die Plattform unterstützt Hunyua...
vor 6 Monaten
03.3K
OpenAI Translator:多平台翻译增强工具|全局划词翻译

OpenAI Translator: Multiplattform-Tool zur Verbesserung der Übersetzung | Global Stroke Translation

Allgemeine Einführung openai-translator ist ein Werkzeug zur Verbesserung der Übersetzung, das auf der Grundlage der ChatGPT-API von OpenAI entwickelt wurde. Es umfasst ein Browser-Plugin und eine plattformübergreifende Desktop-Anwendung. Es unterstützt die drei Modi Übersetzung, Nachbesserung und Zusammenfassung und deckt 55 verschiedene...
vor 12 Monaten
03.3K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: Online-Fotobearbeitungstools, Keying mit einem Klick, Entfernen von Wasserzeichen, Fotowiederherstellung, Porträtbearbeitung

Umfassende Einführung ZuoSugar (PicWish) ist eine intelligente KI-Bildverarbeitungsplattform, die eine Fülle von Online-Fotobearbeitungswerkzeugen bietet und die Verwendung aller Plattformen unterstützt. Benutzer können mit einem Klick Keying, Wasserzeichenentfernung, verschwommene Fotos klar werden, verlustfreien Zoom, Bildbeschneidung, Bildkomprimierung und Schwarz-Weiß-Foto...
vor 8 Monaten
03.3K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: ein KI-Assistent für Wissensmanagement und Dokumentensuche in Unternehmen, der mehrere Arbeitsinstrumente integriert

Allgemeine Einführung Danswer ist ein Open-Source-KI-Assistent für die Dokumentensuche in Unternehmen, der entwickelt wurde, um eine Verbindung zu Teamdokumenten, Anwendungen und Personen herzustellen, um eine einheitliche Suche und Antworten auf natürlichsprachliche Abfragen über eine intelligente Chat-Schnittstelle und einheitliche Suchfunktionen bereitzustellen. Es wird sichergestellt, dass Benutzerdaten und Chats vollständig kontrolliert werden...
vor 5 Monaten
03.3K
Artbreeder:超强图像控制与图像风格混合工具,适合教学使用

Artbreeder: Hervorragende Bildkontrolle und Bildstilüberblendung für den Unterricht!

Artbreeder Einführung Artbreeder ist eine auf künstlicher Intelligenz (KI) basierende Website für kollaboratives Kunstschaffen. Sie verwendet StyleGAN- und BigGAN-Modelle, um den Benutzern zu helfen, Bilder von Gesichtern, Landschaften, Gemälden und mehr zu erzeugen und zu verändern. Der Schieberegler "Gene" funktioniert...
vor 2 Monaten
03.3K
瑞达写作:一键生成论文,免费选题生成论文大纲, 论文润色,引用文献数据

Rida Writing: Erstellen Sie einen Aufsatz mit einem Klick, wählen Sie kostenlos ein Thema, um eine Gliederung für den Aufsatz zu erstellen, polieren Sie den Aufsatz, zitieren Sie Literaturdaten

Umfassende Einführung Rida Writing ist eine KI-Plattform, die sich auf das Schreiben von akademischen Arbeiten konzentriert und den Nutzern helfen soll, ihre Aufgaben effizient zu erledigen. Durch Eingabe eines Dissertationstitels können Nutzer mit einem Klick komplette Dissertationsinhalte mit bis zu 50.000 Wörtern erstellen. Die Plattform bietet eine Vielzahl von Funktionen, einschließlich der kostenlosen Themenauswahl,...
vor 8 Monaten
03.3K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: Open-Source-Programm zur Stapelentfernung von Bild- und Videohintergründen, optimiert für RMBG 2.0

Allgemeine Einführung RMBG-2-Studio ist eine erweiterte Anwendung zum Entfernen und Ersetzen von Hintergründen, die auf der Grundlage des BRIA-RMBG-2.0-Modells entwickelt wurde. Die Anwendung ist so konzipiert, dass sie den Benutzern effiziente und genaue Funktionen zur Verarbeitung von Bildhintergründen für eine Vielzahl von Bildtypen bietet, einschließlich E-Commerce, Spiele und...
vor 8 Monaten
03.3K
VidAU:视频换脸与视频多语言翻译工具

VidAU: Video-Gesichtstausch und mehrsprachiges Video-Übersetzungsprogramm

Allgemeine Einführung VidAU.AI ist ein All-in-One-KI-Tool für die Video- und Audioerstellung und bietet eine breite Palette von Funktionen wie Video-Sprecher, Face Swap, mehrsprachige Übersetzung, Entfernung von Untertiteln und Wasserzeichen, Videomischung und -bearbeitung und vieles mehr. Es unterstützt die Erstellung von Videos, einschließlich Sketchen, Werbespots, Verkaufsgesprächen, Social-Media-Inhalten und Schulungen...
vor 11 Monaten
03.3K
LensGo:创造独特风格的视频变得简单|视频风格转换工具

LensGo: Einzigartige Videostile erstellen leicht gemacht|Videostil-Konvertierungstool

Allgemeine Einführung LensGo ist eine Plattform für die einfache Erstellung von Videos mit Stiländerungen mithilfe von KI-Technologie und bietet Tools für Stiländerungen, Bilderzeugung, Text-zu-Video, Training und Modellierung. Benutzer können Videostile mithilfe von Modellen oder Bildern ändern, Bilder aus Text- oder Bildhinweisen generieren oder ihre eigenen...
vor 12 Monaten
03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: MNN Multimodale Sprachmodellierung für Android

Umfassende Einführung MNN (Mobile Neural Network) ist ein effizientes, leichtgewichtiges Deep-Learning-Framework, das von Alibaba entwickelt und für mobile Geräte optimiert wurde. MNN ist nicht nur in der Lage, schnelle Inferenzen auf mobilen Geräten durchzuführen, sondern unterstützt auch multimodale Aufgaben, einschließlich...
vor 6 Monaten
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: Proxying/Umkehrung des Midjourney Discord-Kanals für AI-Mapping-API-Aufrufe (kostenloser Test)

Umfassende Einführung Midjourney Proxy ist ein Open-Source-Projekt, das entwickelt wurde, um Proxy-Dienste für Midjournys Discord-Kanal bereitzustellen, um AI-Zeichenfunktionen in API-Form zu konvertieren. Das Projekt ist komplett kostenlos und quelloffen, unterstützt One-Click-Face-Swap, Image Blending, Graph-Generierung ...
vor 8 Monaten
03.3K
Unscreen:自动移除视频背景,轻松制作无背景视频

Unscreen: Entfernen Sie automatisch den Videohintergrund, um ein Video ohne Hintergrund zu erstellen.

Unscreen ist ein leistungsstarkes Online-Tool, das sich auf die automatische Entfernung von Videohintergründen konzentriert. Benutzer laden einfach ein Video hoch oder stellen einen Link zu einem Video zur Verfügung und Unscreen analysiert und entfernt den Hintergrund automatisch und ohne jegliche Komplexität. Das Tool unterstützt eine breite Palette von Videoformaten, einschließlich .mp...
vor 8 Monaten
03.3K