AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
全44記事

Tags: デスクトップ・オートメーション・インテリジェンス

Suna:集成浏览器操作与数据分析的智能代理-首席AI分享圈

Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント

一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ウェブブラウジング、ファイル管理、データクローリングなどの複雑なタスクの実行を支援します。

Strawberry:自动化任务的AI智能浏览器-首席AI分享圈

ストロベリー:自動タスクのためのAIスマートブラウザ

概要 Strawberryは、AIアシスタントを内蔵したスマートブラウザで、ユーザーの日常業務を自動化し、効率を向上させるために設計されている。ウェブコンテンツをリアルタイムで理解し、迅速なリサーチ、コンテンツ作成、データ照合などの複雑なタスクを実行するAI技術を統合することで、従来のブラウザとは一線を画しています。ユーザーは...

Fellou:自动化执行任务的原生AI浏览器-首席AI分享圈

Fellou:タスクを自動化するネイティブAIブラウザ

FellouはFellou AIが提供する世界初のAI対応アクションブラウザで、従来のブラウザのウェブ閲覧機能を提供するだけでなく、AI技術によりタスクの自動化や深い情報検索を実現します。Fellouは、Fellou AIが提供する世界初のAI対応アクションブラウザで、従来のブラウザのウェブ閲覧機能を提供するだけでなく、AI技術によってタスクの自動化や深い情報検索を実現する...

AiPy:自动化运行Python代码完成数据分析任务-首席AI分享圈

AiPy:データ分析のためのPythonコード実行タスクの自動化

概要 AiPyはKnownsecチームによって開発されたオープンソースのPythonコマンドラインツールです。大規模言語モデル(LLM)とPython実行環境を組み合わせ、自然言語でタスクを記述することでPythonコードを自動生成し、実行することができます。

DroidRun:AI自动操作安卓手机的开源工具-首席AI分享圈

DroidRun:アンドロイド携帯を自動化するAI用オープンソースツール

概論 DroidRunは、AIに人間のようにAndroid携帯を操作させるオープンソースのツールである。画面上のボタンや入力ボックスなどのインタラクティブな要素を抽出することで、アプリを開いたり、メッセージを送信したり、ウェブをブラウズしたりといったタスクをAIが自動化できるようにします。DroidRunは、視覚的解析とUI構造解析を組み合わせています。

Agent S:像人类一样操作电脑的开源智能体框架-首席AI分享圈

エージェントS:人間のようにコンピュータを操作する知的体のためのオープンソース・フレームワーク

一般的な紹介 エージェントSは、Simular AI社が開発したオープンソースのフレームワークであり、グラフィカル・ユーザー・インターフェース(GUI)を通じて、人間のようにコンピュータを操作することができる。マルチモーダル・マクロ言語モデルと経験的学習技術を使用し、ウェブ閲覧、文書編集、ソフトウェア使用などのタスクを実行する。プロジェクトはGitHubで公開されている。

Libra:用对话生成本地AI智能体的客户端(内测)-首席AI分享圈

Libra: ダイアログ付きローカルAIインテリジェンス生成クライアント(内部テスト中)

Libraは、Greenbit.aiが提供する革新的なツールで、その中核機能は、自然言語対話を通じてローカルで実行可能なAIインテリジェンスを生成することである。バイブ・エージェント」と呼ばれるこのツールは、ユーザーが自分のニーズを簡単な言葉で説明したり、独自のインテリジェンスを素早く作成したり、ウェブ検索やデータ...

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するためにAIを訓練することです。このプロジェクトには、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリが含まれており、ユーザは...

RunRabbit:使用语音和文字操作智能体完成电脑操作-首席AI分享圈

RunRabbit:音声とテキストを使ってインテリジェンシアを操作し、コンピューター操作を完了させる

概論 RunRabbitはAIベースのツールであり、ユーザーは簡単な音声やテキストコマンドによってブラウザを操作し、様々なタスクを実行することができる。その最大の特徴は、ユーザーのニーズを理解し、情報の検索、フォームへの入力、反復的なタスクの実行など、ウェブページを自動的に操作することである。ウェブサイト ...

LangGraph CUA:コンピュータ操作を制御するLangGraphベースのAIインテリジェンス

LangGraph CUAはLangChainチームによって開発されたオープンソースプロジェクトである。LangGraphフレームワークをベースにしており、開発者はPythonを使ってコンピュータを直接操作できるAIインテリジェンスを構築できる。このツールの中核は "Computer Use Agent" (CUA)で、人間の知能をシミュレートすることができる。

Agent TARS:使用视觉和命令操作电脑的开源智能体-首席AI分享圈

エージェントTARS:視覚とコマンドを使ってコンピュータを操作するオープンソースのインテリジェンス

総合紹介エージェントTARSは、ByteDance社がオープンソース化したマルチモーダルAIインテリジェンスで、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えている。従来のツールのように手動操作を必要とせず、自動的にブラウザ...

Playwright MCP:微软推出的浏览器自动化MCP服务-首席AI分享圈

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールです。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御し、ウェブページを開いたり、要素をクリックしたり、テキストを入力したりといったアクションを実行することができる。このツールはPl...

Airtop:使用自然语言控制的浏览器自动化工具-首席AI分享圈

Airtop:自然言語コントロールを用いたブラウザ自動化ツール

概論 AirtopはAIベースのブラウザ自動化ツールである。クラウドブラウザを制御し、ウェブサイトへのログイン、データのクロール、自動化タスクの実行など、複雑なウェブ操作を簡単な自然言語コマンドで実行することができます。従来のスクリプトを書くことの複雑さを解決し、...

BrowserAgent:在浏览器中创建和运行AI工作流的工具-首席AI分享圈

BrowserAgent: ブラウザ上でAIワークフローを作成・実行するツール

一般的な紹介 BrowserAgentは、ブラウザ上で直接AIワークフローを作成し、実行するツールです。使い方は簡単で、コードを記述する必要はありません。ユーザーが行うべきことは、希望するワークフローを記述することだけで、AIは自動的に生成されます。核となる特徴は、完全にプライベートであることで、すべてのデータはブラウザ上で処理され、...

Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手-首席AI分享圈

Highlight AI: 音声と画面分析を使ってデスクトップタスクをこなすAIアシスタント

概要 Highlight AIは、WindowsとmacOS(モバイル版は開発中)向けのデスクトップAIアシスタントで、音声コマンドと画面コンテンツの分析を通じて、ユーザーがあらゆるアプリでタスクを素早く完了できるよう支援します。画面の内容をキャプチャし、コードを生成し、質問に答え、GitHubと連携します。

autoMate:结合AI与RPA实现电脑任务自动化的本地工具-首席AI分享圈

autoMate:AIとRPAを組み合わせてコンピュータ作業を自動化するネイティブツール

総合紹介 autoMateは、yuruotong1がGitHub上でオープンソース化し開発したローカル自動化ツールで、AI+RPA(Artificial Intelligence + Robotic Process Automation)を中核機能としています。大規模な言語モデルのインテリジェントな理解とRPAのプロセス実行機能を組み合わせることで、ユーザーは自然言語を使用するだけでよい...

Nanobrowser:浏览器中实现任务自动化的多智能插件-首席AI分享圈

ナノブラウザ:ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概論 Nanobrowserは、AI主導のマルチエージェントシステムによってウェブタスクを自動化するために設計されたオープンソースのChrome拡張機能です。LLM(大規模言語モデル)のAPIキーを提供するだけで使用でき、OpenAI Operatorに代わる無償の拡張機能です。

Proxy Lite:3B参数视觉模型驱动的网页自动化工具-首席AI分享圈

Proxy Lite:3Bパラメトリック・ビジュアルモデル駆動型ウェブ自動化ツール

概要 Proxy Liteは、Convergence AIによって開発されたオープンソースの軽量ウェブ自動化ツールで、Proxyのミニバージョンとしてオープンウェイトデザインで開発されています。3BパラメータのVLM(Visual Language Model)をベースにしており、自律的なウェブナビゲーションとタスク実行が可能です。

Rabbit Android Agent:语音控制安卓应用的智能体(未开放)-首席AI分享圈

Rabbit Android Agent:Androidアプリケーションのための音声制御インテリジェンス(非公開)

一般的な紹介 Rabbit Android Agentは、Rabbitが開発した革新的なAIインテリジェンスで、音声やテキストコマンドを通じて、ユーザーがAndroidデバイス上で単一または複数のステップのタスクを完了できるように設計されています。この技術は、ラビット社のLAM(Large Action Model)をベースにしています。

ja日本語