
Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント
一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ウェブブラウジング、ファイル管理、データクローリングなどの複雑なタスクの実行を支援します。
一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ウェブブラウジング、ファイル管理、データクローリングなどの複雑なタスクの実行を支援します。
概要 Strawberryは、AIアシスタントを内蔵したスマートブラウザで、ユーザーの日常業務を自動化し、効率を向上させるために設計されている。ウェブコンテンツをリアルタイムで理解し、迅速なリサーチ、コンテンツ作成、データ照合などの複雑なタスクを実行するAI技術を統合することで、従来のブラウザとは一線を画しています。ユーザーは...
ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。
FellouはFellou AIが提供する世界初のAI対応アクションブラウザで、従来のブラウザのウェブ閲覧機能を提供するだけでなく、AI技術によりタスクの自動化や深い情報検索を実現します。Fellouは、Fellou AIが提供する世界初のAI対応アクションブラウザで、従来のブラウザのウェブ閲覧機能を提供するだけでなく、AI技術によってタスクの自動化や深い情報検索を実現する...
概要 AiPyはKnownsecチームによって開発されたオープンソースのPythonコマンドラインツールです。大規模言語モデル(LLM)とPython実行環境を組み合わせ、自然言語でタスクを記述することでPythonコードを自動生成し、実行することができます。
概論 DroidRunは、AIに人間のようにAndroid携帯を操作させるオープンソースのツールである。画面上のボタンや入力ボックスなどのインタラクティブな要素を抽出することで、アプリを開いたり、メッセージを送信したり、ウェブをブラウズしたりといったタスクをAIが自動化できるようにします。DroidRunは、視覚的解析とUI構造解析を組み合わせています。
一般的な紹介 エージェントSは、Simular AI社が開発したオープンソースのフレームワークであり、グラフィカル・ユーザー・インターフェース(GUI)を通じて、人間のようにコンピュータを操作することができる。マルチモーダル・マクロ言語モデルと経験的学習技術を使用し、ウェブ閲覧、文書編集、ソフトウェア使用などのタスクを実行する。プロジェクトはGitHubで公開されている。
Libraは、Greenbit.aiが提供する革新的なツールで、その中核機能は、自然言語対話を通じてローカルで実行可能なAIインテリジェンスを生成することである。バイブ・エージェント」と呼ばれるこのツールは、ユーザーが自分のニーズを簡単な言葉で説明したり、独自のインテリジェンスを素早く作成したり、ウェブ検索やデータ...
概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するためにAIを訓練することです。このプロジェクトには、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリが含まれており、ユーザは...
概論 RunRabbitはAIベースのツールであり、ユーザーは簡単な音声やテキストコマンドによってブラウザを操作し、様々なタスクを実行することができる。その最大の特徴は、ユーザーのニーズを理解し、情報の検索、フォームへの入力、反復的なタスクの実行など、ウェブページを自動的に操作することである。ウェブサイト ...
LangGraph CUAはLangChainチームによって開発されたオープンソースプロジェクトである。LangGraphフレームワークをベースにしており、開発者はPythonを使ってコンピュータを直接操作できるAIインテリジェンスを構築できる。このツールの中核は "Computer Use Agent" (CUA)で、人間の知能をシミュレートすることができる。
総合紹介エージェントTARSは、ByteDance社がオープンソース化したマルチモーダルAIインテリジェンスで、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えている。従来のツールのように手動操作を必要とせず、自動的にブラウザ...
一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールです。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御し、ウェブページを開いたり、要素をクリックしたり、テキストを入力したりといったアクションを実行することができる。このツールはPl...
概論 AirtopはAIベースのブラウザ自動化ツールである。クラウドブラウザを制御し、ウェブサイトへのログイン、データのクロール、自動化タスクの実行など、複雑なウェブ操作を簡単な自然言語コマンドで実行することができます。従来のスクリプトを書くことの複雑さを解決し、...
一般的な紹介 BrowserAgentは、ブラウザ上で直接AIワークフローを作成し、実行するツールです。使い方は簡単で、コードを記述する必要はありません。ユーザーが行うべきことは、希望するワークフローを記述することだけで、AIは自動的に生成されます。核となる特徴は、完全にプライベートであることで、すべてのデータはブラウザ上で処理され、...
概要 Highlight AIは、WindowsとmacOS(モバイル版は開発中)向けのデスクトップAIアシスタントで、音声コマンドと画面コンテンツの分析を通じて、ユーザーがあらゆるアプリでタスクを素早く完了できるよう支援します。画面の内容をキャプチャし、コードを生成し、質問に答え、GitHubと連携します。
総合紹介 autoMateは、yuruotong1がGitHub上でオープンソース化し開発したローカル自動化ツールで、AI+RPA(Artificial Intelligence + Robotic Process Automation)を中核機能としています。大規模な言語モデルのインテリジェントな理解とRPAのプロセス実行機能を組み合わせることで、ユーザーは自然言語を使用するだけでよい...
概論 Nanobrowserは、AI主導のマルチエージェントシステムによってウェブタスクを自動化するために設計されたオープンソースのChrome拡張機能です。LLM(大規模言語モデル)のAPIキーを提供するだけで使用でき、OpenAI Operatorに代わる無償の拡張機能です。
概要 Proxy Liteは、Convergence AIによって開発されたオープンソースの軽量ウェブ自動化ツールで、Proxyのミニバージョンとしてオープンウェイトデザインで開発されています。3BパラメータのVLM(Visual Language Model)をベースにしており、自律的なウェブナビゲーションとタスク実行が可能です。
一般的な紹介 Rabbit Android Agentは、Rabbitが開発した革新的なAIインテリジェンスで、音声やテキストコマンドを通じて、ユーザーがAndroidデバイス上で単一または複数のステップのタスクを完了できるように設計されています。この技術は、ラビット社のLAM(Large Action Model)をベースにしています。