総合紹介 autoMateは、yuruotong1がGitHubでオープンソース開発したローカル自動化ツールで、AI+RPA(Artificial Intelligence+Robotic Process Automation)を中核機能としている。大規模言語モデルのインテリジェントな理解とRPAを組み合わせ...
概論 UI-TARS Desktopは、ByteDance社が開発したUI-TARS(Visual Language Model)に基づいたグラフィカルインターフェースエージェントアプリケーションです。UI-TARSデスクトップは、ByteDance社が開発したUI-TARS(Visual Language Model)をベースとしたグラフィカルインターフェースエージェントアプリケーションです。
包括的な紹介 AppAgentは、スマートフォンのアプリケーションを操作するために設計されたLarge Language Model(LLM)ベースのマルチモーダルエージェントフレームワークです。このフレームワークは、簡素化された操作空間を通じて、タップやスワイプといった人間のインタラクションを模倣する。そのため、システムのバックエンドにアクセスする必要がなく、さまざまなアプリケーションでの利用が可能である。
概論 Skyvernは、Large Language Modelling (LLM)とコンピュータビジョン技術を使用したブラウザワークフロー自動化ツールです。壊れやすかったり信頼できなかったりする自動化ソリューションを置き換えることができるシンプルなAPIエンドポイントを提供することで、多数のウェブサイトを効率的に自動化します。