AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 39 Artikel

Tags: Desktop-Automatisierung Intelligenz Seite 2

UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用-首席AI分享圈

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern.UI-TARS Desktop unterstützt plattformübergreifende...

Shortest:AI自动化测试工具,使用自然语言进行端到端测试-首席AI分享圈

Shortest: ein KI-Tool für automatisierte Tests, das natürliche Sprache für End-to-End-Tests verwendet

Allgemeine Einführung Shortest ist ein KI-gestütztes End-to-End-Testframework in natürlicher Sprache, das vom Anti-Work-Team entwickelt wurde. Es basiert auf Playwright und unterstützt die GitHub-Integration und die Zwei-Faktor-Authentifizierung (2FA). Shortests Hauptmerkmal ist das Schreiben von Testfällen in natürlicher Sprache und die Verwendung von Anthropic Cl...

Midscene.js:用AI驱动浏览器自动化测试的开源插件-首席AI分享圈

Midscene.js: ein Open-Source-Plugin, das Browser-Automatisierungstests mit KI unterstützt

Allgemeine Einführung Midscene.js ist ein KI-gesteuertes Browser-Automatisierungstool, das in der Lage ist, Webseiten zu steuern, Assertions auszuführen und Daten durch natürlichsprachliche Befehle zu extrahieren. Es unterstützt Chrome-Erweiterungen, JavaScript-SDKs und YAML-Skripte und vereinfacht so das Schreiben und Warten von UI-Tests. Durch die Nutzung multimodaler großer ...

Stagehand:自然语言实现浏览器自动化操作框架-首席AI分享圈

Stagehand: Ein Framework für die Implementierung von Browser-Automatisierungsvorgängen in natürlicher Sprache

Allgemeine Einführung Stagehand ist eine AI Web-Browsing-Framework auf Einfachheit und Erweiterbarkeit konzentriert. Es ist vollständig Playwright-kompatibel und bietet drei einfache KI-APIs (Act, Extract und Observe), die auf den zugrundeliegenden Playwright Page-Klassen für das Web durch natürliche Sprache aufgebaut sind...

Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化-首席AI分享圈

Eko: Intelligente Körper-Workflows in natürlicher Sprache für Desktop- und Browser-Automatisierung

Allgemeine Einführung Eko ist ein produktionsreifes JavaScript-Framework zur Erstellung effizienter intelligenter Agenten-Workflows durch Beschreibungen in natürlicher Sprache. Es wurde entwickelt, um Entwicklern die Möglichkeit zu geben, alltägliche Aufgaben mit Hilfe von KI-Technologien ohne tiefgreifende Programmierung zu automatisieren....

AutoMouser: Generierung von Browser-Automatisierungscode zur Umwandlung von Mausaktionen in Selenium-Python-Skripte über KI

Allgemeine Beschreibung AutoMouser ist eine Chrome-Erweiterung, die auf intelligente Weise Benutzerinteraktionen verfolgt und automatisch Selenium-Testcode unter Verwendung der GPT-Modelle von OpenAI generiert. Dies geschieht durch Aufzeichnung von Benutzer-Browser-Aktionen und deren Umwandlung in robuste, wartbare Python-Selenium-Skripte,...

Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架-首席AI分享圈

Browser Use Web UI: ein Open-Source-Framework für den Einsatz von KI-Intelligenzen beim Browsen im Internet, das es KI ermöglicht, Webseiten automatisch zu bearbeiten

Allgemeine Einführung Browser Use Web UI ist ein innovatives Open-Source-Projekt, das sich auf die Bereitstellung von KI-Agenten mit einer grafischen Schnittstelle Werkzeug für Browser-Interaktion Fähigkeiten konzentriert. Das Projekt baut auf dem Browser-Use-Core-Framework auf, um mit Gradio eine benutzerfreundliche Web-Oberfläche zu erstellen, die es KI-Agenten leicht macht, ...

NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目-首席AI分享圈

NeoAI: Open-Source-Projekt, mit dem KI den Fernbetrieb von Computern übernehmen und sie mit natürlicher Sprache steuern kann

Allgemeine Einführung NeoAI ist ein innovatives Open-Source-KI-Assistententool, mit dem Benutzer ihre Computer durch Dialoge in natürlicher Sprache einfach steuern und verwalten können. Ohne irgendeinen Code zu schreiben, können Benutzer einfach den täglichen Dialog nutzen, um Dateien zu finden, Aufgaben zu automatisieren, Geräte zu verwalten, usw. NeoAI unterstützt...

CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作-首席AI分享圈

CogAgent: Smart Spectrums quelloffenes intelligentes visuelles Sprachmodell für die Automatisierung grafischer Oberflächen

Umfassende Einführung CogAgent ist ein quelloffenes visuelles Sprachmodell, das von der Tsinghua University Data Mining Research Group (THUDM) entwickelt wurde und darauf abzielt, die Bedienung von plattformübergreifenden grafischen Benutzeroberflächen (GUIs) zu automatisieren. Das Modell basiert auf CogVLM (GLM-4V-9B), unterstützt zweisprachige Interaktionen in Englisch und Chinesisch und ist in der Lage, natürliche ...

ClickClickClick:启用任何LLM实现自动化安卓和电脑操作-首席AI分享圈

ClickClickClickClick: Aktivieren Sie jedes LLM zur Automatisierung von Android- und PC-Vorgängen

Allgemeine Einführung ClickClickClick ist ein von BandarLabs entwickeltes Framework, das darauf abzielt, Android- und PC-Operationen zu automatisieren, indem jedes lokale oder entfernte Large Language Model (LLM) verwendet wird. Das Projekt befindet sich derzeit in einer sehr experimentellen Phase und unterstützt eine Vielzahl von Modellen wie Ollama, Gemini und GPT 4o....

Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器-首席AI分享圈

Browser-Use: Entwicklung intelligenter Web-Automatisierungs-Tools für KI-Intelligenz zur einfachen Bedienung von Browsern

Umfassende Einführung Browser-Use ist ein innovatives Open-Source-Web-Automatisierungstool, das speziell entwickelt wurde, um Sprachmodelle (LLMs) in die Lage zu versetzen, auf natürliche Weise mit Websites zu interagieren. Es bietet ein leistungsfähiges und flexibles Framework, das eine breite Palette von Mainstream-Sprachmodellen unterstützt, darunter GPT-4, Claude und andere. Das bemerkenswerteste Merkmal des Tools ist...

Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)-首席AI分享圈

Projekt Mariner: Browser-Automatisierung, ein Forschungsprototyp zur Erforschung der Zukunft der Mensch-Computer-Interaktion (unveröffentlicht)

Allgemeine Einführung Project Mariner ist ein Forschungsprototyp, der von Google DeepMind gestartet wurde, um die Zukunft der Mensch-Computer-Interaktion zu erforschen. Das Projekt nutzt die leistungsstarken multimodalen Verstehens- und Schlussfolgerungsfähigkeiten von Gemini 2.0, um eine Vielzahl von Aufgaben durch Browser-Automatisierung durchzuführen....

Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)-首席AI分享圈

Dia Browser: bietet ein intelligentes Browsing-Erlebnis mit integrierten KI-Tools zur Automatisierung von Aufgaben im Browser (noch nicht live)

Allgemeine Beschreibung Dia Browser ist ein neuer intelligenter Browser, der von The Browser Company entwickelt wurde und den Nutzern durch die Integration fortschrittlicher KI-Tools ein effizienteres Browsing-Erlebnis bieten soll. Es wird erwartet, dass der Browser Anfang 2025 offiziell veröffentlicht wird. Zu den wichtigsten Funktionen gehören intelligente Schreibhilfe, automatisierte Aufgabenverarbeitung und...

Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体-首席AI分享圈

Clevrr Computer: Automatisierung der Desktop-Manipulationsintelligenz mit der PyAutoGUI-Bibliothek

Allgemeine Einführung Clevrr Computer ist ein Open-Source-Projekt, das darauf abzielt, Systemoperationen durch die Verwendung der PyAutoGUI-Bibliothek zu automatisieren. Das Projekt wurde von Anthropic inspiriert, um einen Automatisierungsagenten zu entwerfen, der die Systembetriebsaufgaben des Benutzers genau und effizient ausführen kann...

GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI-首席AI分享圈

GLM-PC (Smart Spectrum Bull) ist offiziell zum internen Download freigegeben, die KI, die wirklich den Computer steuern kann

GLM-PC (Bull) Einleitung GLM-PC ist eine Desktop-Anwendung auf der Grundlage des CogAgent-Modells, die in der Lage ist, komplexe Aufgaben durch natürlichsprachliche Befehle schnell auszuführen. Es verfügt über die Fähigkeit, Aufgaben zu planen und Schnittstellen zu verstehen, und kann verschiedene Computeroperationen entsprechend den Anweisungen des Benutzers selbständig ausführen. Vorsichtsmaßnahmen für die Verwendung Verwenden Sie eine dedizierte virtuelle Maschine...

Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)-首席AI分享圈

Runner H: Automatisierung von Aufgaben zur Ausführung von Webseiten durch natürlichsprachliche Befehle (Anwendung für interne Tests)

Allgemeine Einführung Runner H ist ein Unternehmen, das sich der Entwicklung innovativer Aktionsmodelle verschrieben hat, um die Produktivität von Mitarbeitern durch fortschrittliche KI-Funktionen zu steigern. Sein Hauptprodukt, Runner H, ist ein fortschrittlicher KI-Agent, der Benutzern helfen soll, komplexe, mehrstufige Aufgaben zu automatisieren und so Wiederholungen und manuelle Eingaben zu reduzieren. Durch...

AppAgent:利用多模态智能体自动操作智能手机-首席AI分享圈

AppAgent: automatisierte Smartphone-Bedienung durch multimodale Intelligenz

Umfassende Einführung AppAgent ist ein Large Language Model (LLM)-basiertes multimodales Agenten-Framework, das für die Handhabung von Smartphone-Anwendungen entwickelt wurde. Das Framework ahmt menschliche Interaktionen wie Taps und Swipes durch einen vereinfachten Manipulationsraum nach, wodurch die Notwendigkeit eines System-Backend-Zugriffs entfällt und die Nutzung über Anwendungen hinweg erweitert wird...

Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流-首席AI分享圈

Skyvern: Automatisierung von browserbasierten Arbeitsabläufen mit LLM und Computer Vision

Allgemeine Einführung Skyvern ist ein Tool zur Automatisierung von Browser-Workflows unter Verwendung von Large Language Modelling (LLM) und Computer Vision Techniken. Es automatisiert effizient manuelle Aktionen auf einer großen Anzahl von Websites, indem es einen einfachen API-Endpunkt bereitstellt, der Automatisierungslösungen ersetzen kann, die anfällig oder unzuverlässig sind...

de_DEDeutsch