AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1
Insgesamt 38 Artikel

Tags: Desktop-Automatisierung Intelligenz

Libra:用对话生成本地AI智能体的客户端(内测)-首席AI分享圈

Libra: ein Client zur Erzeugung lokaler KI-Intelligenzen mit Dialog (interner Test)

Libra ist ein innovatives Tool von Greenbit.ai, dessen Kernfunktion darin besteht, KI-Intelligenzen zu erzeugen, die lokal durch natürlichsprachliche Dialoge ausgeführt werden können. Der so genannte "Vibe Agent" ermöglicht es Nutzern, ihre Bedürfnisse in einfachen Worten zu beschreiben, schnell ihre eigenen Intelligenzen zu erstellen und Web-Suchen,...

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity: ein Open-Source-Projekt zum Trainieren von KI für die Durchführung von Webaktionen mit menschlichen Demonstrationen

Allgemeine Einführung Optexity ist ein Open-Source-Projekt auf GitHub, das vom Optexity-Team entwickelt wurde. Sein Kern ist es, menschliche Demonstrationsdaten zu verwenden, um KI zu trainieren, um Computeraufgaben zu erledigen, insbesondere Webseitenoperationen. Das Projekt enthält drei Code-Bibliotheken: ComputerGYM, AgentAI und Playwright, die ...

RunRabbit:使用语音和文字操作智能体完成电脑操作-首席AI分享圈

RunRabbit: Mit Sprache und Text Intelligentsia bedienen, um Computeroperationen zu erledigen

Allgemeine Einführung RunRabbit ist ein auf KI basierendes Tool, mit dem Nutzer ihren Browser durch einfache Sprach- oder Textbefehle steuern können, um verschiedene Aufgaben auszuführen. Seine beste Eigenschaft ist, dass es die Bedürfnisse des Benutzers versteht und dann automatisch Webseiten manipuliert, z. B. bei der Suche nach Informationen, beim Ausfüllen von Formularen oder bei der Ausführung sich wiederholender Aufgaben. Die Website ...

Agent TARS:使用视觉和命令操作电脑的开源智能体-首席AI分享圈

Agent TARS: eine Open-Source-Intelligenz, die mit Hilfe von Vision und Befehlen Computer steuert

Comprehensive Introduction Agent TARS ist eine multimodale KI-Intelligenz, die von ByteDance als Open Source zur Verfügung gestellt wird und deren Kernfunktionen den Benutzern helfen, komplexe Computeraufgaben zu erledigen, indem sie Webinhalte visuell verstehen und Befehlszeilen- und Dateisystemoperationen kombinieren. Anstatt wie herkömmliche Tools manuelle Eingriffe zu erfordern, führt es automatisch Browser...

Playwright MCP:微软推出的浏览器自动化MCP服务-首席AI分享圈

Playwright MCP: Browser-Automatisierungs-MCP-Dienst von Microsoft

Allgemeine Einführung Playwright MCP ist ein Open-Source-Tool, das von Microsoft entwickelt und auf GitHub gehostet wird. Es ermöglicht Modellen der künstlichen Intelligenz die direkte Steuerung von Browsern über das MCP-Protokoll (Model Context Protocol), um Aktionen wie das Öffnen von Webseiten, das Anklicken von Elementen und die Eingabe von Text auszuführen. Das Tool basiert auf Pl...

Airtop:使用自然语言控制的浏览器自动化工具-首席AI分享圈

Airtop: ein Browser-Automatisierungstool mit natürlicher Sprachsteuerung

Allgemeine Einführung Airtop ist ein KI-basiertes Browser-Automatisierungstool. Es ermöglicht Benutzern die Steuerung von Cloud-Browsern zur Durchführung komplexer Weboperationen wie das Einloggen in Websites, das Crawlen von Daten oder die Durchführung von Automatisierungsaufgaben durch einfache Befehle in natürlicher Sprache. Es löst die Komplexität des Schreibens traditioneller Skripte und anfälliger...

BrowserAgent:在浏览器中创建和运行AI工作流的工具-首席AI分享圈

BrowserAgent: ein Werkzeug zur Erstellung und Ausführung von KI-Workflows im Browser

Allgemeine Einführung BrowserAgent ist ein Tool, das KI-Workflows direkt im Browser erstellt und ausführt. Es ist einfach zu bedienen und erfordert keinen Code, der geschrieben werden muss. Alles, was der Benutzer tun muss, ist, den gewünschten Workflow zu beschreiben und die KI wird automatisch generiert. Sein Hauptmerkmal ist, dass es komplett privat ist, alle Daten werden in Ihrem Browser verarbeitet, keine...

autoMate:结合AI与RPA实现电脑任务自动化的本地工具-首席AI分享圈

autoMate: ein natives Tool, das KI und RPA zur Automatisierung von Computeraufgaben kombiniert

Umfassende Einführung autoMate ist ein lokales Automatisierungswerkzeug, das von yuruotong1 auf GitHub entwickelt wurde und dessen Kernfunktion AI+RPA (Artificial Intelligence + Robotic Process Automation) ist. Es kombiniert das intelligente Verständnis von umfangreichen Sprachmodellen mit den Prozessausführungsfähigkeiten von RPA, Benutzer müssen nur natürliche Sprache verwenden...

Proxy Lite:3B参数视觉模型驱动的网页自动化工具-首席AI分享圈

Proxy Lite: 3B Parametric Visuelles modellgesteuertes Web-Automatisierungswerkzeug

Allgemeine Einführung Proxy Lite ist ein quelloffenes, leichtgewichtiges Web-Automatisierungswerkzeug, das von Convergence AI als Mini-Version von Proxy entwickelt wurde. Es basiert auf einem 3B-Parameter Visual Language Model (VLM) und ist in der Lage, eigenständig im Web zu navigieren und Aufgaben auszuführen, wie z.B. das Finden von Informationen ...

Convergence:在代理浏览器中自动完成重复任务的AI助手-首席AI分享圈

Convergence: ein KI-Assistent, der sich wiederholende Aufgaben in einem Agentenbrowser automatisiert

Allgemeine Einführung Convergence ist ein Unternehmen, das sich der Aufgabe verschrieben hat, Menschen mit Hilfe von Technologien des maschinellen Lernens zu helfen, die Kontrolle über ihre Zeit zurückzugewinnen. Durch die Entwicklung von groß angelegten Meta-Lernmodellen (LMLMs) sind die KI-Agenten (Browser-Agenten) von Convergence in der Lage, sich neue Fähigkeiten anzueignen, Maßnahmen zu ergreifen und sich im Echtzeitbetrieb kontinuierlich zu verbessern. Sein Kern ...

mac assistant:macOS设备自动执行桌面操作的AI智能体-首席AI分享圈

mac assistant: die KI-Intelligenz, die Desktop-Aktionen auf macOS-Geräten automatisiert

Allgemeine Einführung mac assistant ist ein KI-Intelligenz-Projekt, das speziell für macOS entwickelt wurde und darauf abzielt, die Arbeit des Benutzers durch die Kombination von nativer Software und Webfunktionen zu vereinfachen. Das Projekt unterstützt derzeit die OpenAI- und GEMINI-APIs und plant für die Zukunft die Unterstützung eines nativen großen Sprachmodells, das von Ollama ausgeführt wird. mac_assista...

Open Operator:通过AI智能体在云浏览器中执行自动化操作-首席AI分享圈

Open Operator: Automatisierung in Cloud Browsern mit KI-Intelligenz

Allgemeine Einführung Open Operator ist ein Open-Source-Projekt, das darauf abzielt, Operationen im Browser durch KI-Intelligenzen zu automatisieren. Das von Browserbase entwickelte Projekt kombiniert die Technologien von Stagehand und Browserbase, um es den Benutzern zu ermöglichen, das Verhalten des Browsers durch natürlichsprachliche Befehle zu...

MobileAgent:多代理协作的移动设备操作助手-首席AI分享圈

MobileAgent: Multi-Agenten-Kollaboration für mobile Gerätebedienungsassistenten

Allgemeine Einführung MobileAgent ist ein leistungsstarker Assistent für die Bedienung von Mobilgeräten, der die Effizienz und Automatisierung der Bedienung von Mobilgeräten durch Multi-Agenten-Kollaboration und erweiterte visuelle Wahrnehmungsmodule verbessern soll. Er wurde vom X-PLUG-Team entwickelt, unterstützt Android- und Harmony-OS-Systeme und ist in der Lage, auf komplexen...

TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体-首席AI分享圈

TankWork: ein intelligenter Körper, der Computer über Sprache und Text steuert und Sprachfeedback in Echtzeit liefert

Allgemeine Einführung TankWork ist ein Open-Source-Desktop-Agent-Framework, das entwickelt wurde, um KI in die Lage zu versetzen, Ihren Computer durch Computer Vision und Interaktion auf Systemebene wahrzunehmen und zu steuern. Das Framework ermöglicht Agenten die direkte Steuerung von Computern durch Sprach- und Textbefehle, die Verarbeitung von Live-Bildschirminhalten und die Bereitstellung von kontinuierlichem audiovisuellem Feedback und Manipulation...

UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用-首席AI分享圈

UI-TARS Desktop: Desktop Intelligentsia Anwendung zur Steuerung von Computern mit natürlicher Sprache

Allgemeine Einführung UI-TARS Desktop ist eine grafische Interface-Agent-Anwendung, die auf dem von ByteDance entwickelten UI-TARS (Visual Language Model) basiert. Die Anwendung ermöglicht es Benutzern, Computer durch natürliche Sprache für eine intuitivere und effizientere Mensch-Computer-Interaktion zu steuern.UI-TARS Desktop unterstützt plattformübergreifende...

de_DEDeutsch