데스크톱 자동화 인텔리전스

총 44개 기사
Suna:集成浏览器操作与数据分析的智能代理

Suna: 브라우저 운영과 데이터 분석을 통합하는 지능형 에이전트

일반 소개 Suna는 Kortix AI에서 개발한 오픈 소스 범용 AI 에이전트로, Apache 2.0 라이선스를 기반으로 GitHub에서 호스팅되며 사용자가 무료로 다운로드, 수정 및 자체 호스팅할 수 있습니다. 자연어 대화를 사용하여 사용자에게 다음과 같은 도움을 줍니다.
4개월 전
02.6K
Strawberry:自动化任务的AI智能浏览器

Strawberry: 자동화된 작업을 위한 AI 스마트 브라우저

일반 설명 Strawberry는 사용자가 일상적인 작업을 자동화하고 효율성을 향상시킬 수 있도록 설계된 AI 비서가 내장된 스마트 브라우저입니다. AI 기술을 통합하여 웹 콘텐츠를 실시간으로 이해하고 빠른 검색, 콘텐츠 작성과 같은 복잡한 작업을 수행한다는 점에서 기존 브라우저와 차별화됩니다.
4개월 전
02K
Agent S:像人类一样操作电脑的开源智能体框架

에이전트 S: 인간처럼 컴퓨터를 작동하는 지능형 기관을 위한 오픈 소스 프레임워크

일반 소개 에이전트 S는 Simular AI에서 개발한 오픈 소스 프레임워크로, 그래픽 사용자 인터페이스(GUI)를 통해 인간처럼 컴퓨터를 조작할 수 있는 인공지능입니다. 멀티모달 대규모 언어 모델과 경험적 학습 기법을 사용하여 웹 검색, 문서 편집, 소프트웨어 사용 등의 작업을 수행합니다.
4개월 전
02.1K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: 대화를 통해 로컬 AI 인텔리전스를 생성하는 클라이언트(내부 테스트)

일반 소개 Libra는 자연어 대화를 통해 로컬에서 실행되는 AI 지능을 생성하는 것이 핵심 기능인 Greenbit.ai의 혁신적인 도구입니다. "바이브 에이전트"라고 불리는 이 도구는 사용자가 자신의 요구 사항을 간단한 용어로 설명하고 빠르게 생성할 수 있습니다.
4개월 전
01.8K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: 사람의 시연을 통해 웹 작업을 수행하도록 AI를 훈련시키는 오픈 소스 프로젝트

일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.
4개월 전
02.3K
RunRabbit:使用语音和文字操作智能体完成电脑操作

런래빗: 음성과 텍스트를 사용하여 컴퓨터 작업을 완료하는 인텔리전스 작동법

일반 소개 런래빗은 사용자가 간단한 음성 또는 텍스트 명령을 통해 브라우저를 제어하여 다양한 작업을 수행할 수 있는 인공지능 기반 도구입니다. 가장 큰 특징은 사용자의 요구를 이해한 다음 정보 검색, 양식 작성 또는 반복적인 작업 수행과 같은 웹 페이지를 자동으로 조작한다는 점입니다.
5개월 전
01.9K
Agent TARS:使用视觉和命令操作电脑的开源智能体

에이전트 타스: 비전과 명령을 사용하여 컴퓨터를 작동하는 오픈소스 인텔리전스

종합 소개 에이전트 TARS는 ByteDance에서 오픈소스화한 멀티모달 AI 인텔리전스로, 사용자가 웹 콘텐츠를 시각적으로 이해하고 명령줄과 파일 시스템 작업을 결합하여 복잡한 컴퓨터 작업을 완료할 수 있도록 도와주는 핵심 기능을 갖추고 있습니다. 기존 도구처럼 수동 조작이 필요하지 않고 스스로 ...
5개월 전
02.2K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop: 자연어 컨트롤을 사용하는 브라우저 자동화 도구

일반 소개 Airtop은 AI 기반 브라우저 자동화 도구입니다. 사용자는 간단한 자연어 명령을 통해 클라우드 브라우저를 제어하여 웹사이트 로그인, 데이터 크롤링 또는 자동화 작업 수행과 같은 복잡한 웹 작업을 수행할 수 있습니다. 복잡하고 용량이 큰 기존 스크립트 작성의 문제를 해결합니다.
5개월 전
02.3K
BrowserAgent:在浏览器中创建和运行AI工作流的工具

BrowserAgent: 브라우저에서 AI 워크플로를 생성하고 실행하기 위한 도구

일반 소개 브라우저에이전트는 브라우저에서 직접 AI 워크플로를 생성하고 실행하는 도구입니다. 사용하기 쉽고 코드를 작성할 필요가 없으며, 사용자가 원하는 워크플로우를 설명하기만 하면 AI가 자동으로 생성됩니다. 핵심 기능은 완전히 비공개이며, 모든 데이터는 브라우저에 있습니다.
5개월 전
02.2K
Convergence:在代理浏览器中自动完成重复任务的AI助手

컨버전스: 상담원 브라우저에서 반복적인 작업을 자동화하는 AI 어시스턴트

회사 소개 Convergence는 머신러닝 기술을 사용하여 사람들이 시간을 통제할 수 있도록 돕는 회사입니다. 대규모 메타 학습 모델(LMLM)을 개발함으로써 Convergence의 AI 에이전트(브라우저 에이전트)는 다음을 사용하여 실시간으로 새로운 기술을 습득할 수 있습니다.
2개월 전
02.7K
mac assistant:macOS设备自动执行桌面操作的AI智能体

Mac 어시스턴트: macOS 기기에서 데스크톱 작업을 자동화하는 AI 인텔리전스

일반 소개 맥 어시스턴트는 기본 소프트웨어와 웹 기능을 결합하여 사용자 작업을 간소화하는 것을 목표로 하는 macOS용으로 설계된 AI 인텔리전스 바디 프로젝트입니다. 이 프로젝트는 현재 OpenAI 및 GEMINI API를 지원하며 향후 지원할 계획입니다.
6개월 전
02.7K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

오픈 오퍼레이터: AI 인텔리전스를 통해 클라우드 브라우저에서 자동화된 작업 수행하기

일반 소개 오픈 오퍼레이터는 인공지능을 통해 브라우저에서 작업을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저베이스에서 개발했으며 스테이지핸드와 브라우저베이스의 기술이 결합되어 있습니다.
7개월 전
03.5K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.
7개월 전
02.7K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS 데스크톱: 자연어를 사용하여 컴퓨터를 제어하는 데스크톱 인텔리전스 애플리케이션

일반 소개 UI-TARS 데스크톱은 바이트댄스에서 개발한 UI-TARS(시각 언어 모델)를 기반으로 한 그래픽 인터페이스 에이전트 애플리케이션입니다. 이 애플리케이션을 통해 사용자는 자연어를 통해 컴퓨터를 제어하여 보다 직관적이고 효율적인 인간-컴퓨터 상호 작용을 할 수 있습니다.UI-TAR...
7개월 전
03K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.
7개월 전
03.3K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: AI로 브라우저 자동화 테스트를 구동하는 오픈 소스 플러그인

일반 소개 Midscene.js는 자연어 명령을 통해 웹 페이지를 제어하고, 어설션을 수행하고, 데이터를 추출하는 AI 기반 브라우저 자동화 도구입니다. 이 도구는 Chrome 확장 프로그램, JavaScript SDK 및 YAML 스크립트를 지원하여 UI 측정을 간소화합니다.
7개월 전
03.4K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: 데스크톱 및 브라우저 자동화를 위한 지능형 바디 워크플로 구축 자연어

일반 소개 Eko는 자연어 설명을 통해 효율적인 지능형 에이전트 워크플로우를 구축하도록 설계된 프로덕션급 자바스크립트 프레임워크입니다. 개발자가 심층적인 프로그래밍 없이도 AI 기술을 사용하여 일상적인 작업을 자동화할 수 있도록 설계되었으며, Eko는 단일 ...
5개월 전
02.6K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: AI를 통해 마우스 동작을 셀레늄 파이썬 스크립트로 변환하는 브라우저 자동화 코드 생성

일반 소개 AutoMouser는 사용자 상호작용을 지능적으로 추적하고 OpenAI의 GPT 모델을 사용하여 셀레늄 테스트 코드를 자동으로 생성하는 Chrome 확장 프로그램입니다. 사용자 브라우저 동작을 기록하고 이를 변환하여 이를 수행합니다.
7개월 전
02.7K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

브라우저 사용 웹 UI: 웹 탐색을 위해 AI 인텔리전스를 실행하기 위한 오픈 소스 프레임워크로, AI가 웹 페이지를 자동으로 조작할 수 있습니다.

일반 소개 브라우저 사용 웹 UI는 AI 에이전트에 그래픽 인터페이스 도구로서 브라우저 상호 작용 기능을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저 사용 핵심 프레임워크 위에 구축된 Gradio를 기반으로 합니다.
2개월 전
04.2K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.
7개월 전
02.3K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
7개월 전
03.7K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
8개월 전
02.8K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

클릭클릭클릭: 모든 LLM을 활성화하여 Android 및 PC 작업을 자동화하세요.

일반 소개 클릭클릭클릭은 반다랩스에서 개발한 프레임워크로, 로컬 또는 원격 LLM(대규모 언어 모델)을 사용해 안드로이드와 PC 작업을 자동화하는 것을 목표로 합니다. 이 프로젝트는 현재 매우 실험적인 단계에 있으며 다음과 같은 다양한 모델을 지원합니다.
8개월 전
02.3K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

브라우저 사용: AI 인텔리전트가 브라우저를 쉽게 운영할 수 있는 지능형 웹 자동화 도구 구축

종합 소개 브라우저 사용은 언어 모델(LLM)이 웹사이트와 자연스럽게 상호 작용할 수 있도록 특별히 설계된 혁신적인 오픈 소스 웹 자동화 도구입니다. 이 도구는 강력하고 유연한 프레임워크를 제공하여 GPT-4, Claud... 등 다양한 주류 언어 모델을 지원합니다.
8개월 전
03.7K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

프로젝트 마리너: 브라우저 자동화, 인간과 컴퓨터 상호 작용의 미래를 탐구하는 연구 프로토타입(미공개)

일반 소개 프로젝트 마리너는 구글 딥마인드에서 인간과 컴퓨터의 상호작용의 미래를 탐구하기 위해 시작한 연구용 프로토타입입니다. 이 프로젝트는 브라우저 자체의 강력한 멀티모달 이해 및 추론 기능을 통해 Gemini 2.0의 강력한 멀티모달 이해 및 추론 기능을 활용합니다.
7개월 전
02.5K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia 브라우저: 브라우저에서 작업을 자동화하는 통합 AI 도구를 통해 지능적인 브라우징 환경을 제공합니다(아직 출시되지 않음).

일반 설명 Dia Browser는 고급 AI 도구를 통합하여 사용자에게 보다 효율적인 브라우징 경험을 제공하는 것을 목표로 브라우저 회사에서 개발한 새로운 스마트 브라우저입니다. 이 브라우저는 2025년 초에 공식 출시될 예정이며 주요 기능은 다음과 같습니다.
8개월 전
03K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr 컴퓨터: PyAutoGUI 라이브러리를 사용한 데스크톱 조작 인텔리전스 자동화

일반 소개 Clevrr Computer는 PyAutoGUI 라이브러리를 사용하여 시스템 운영을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 다음을 사용하여 정확하고 효율적으로 작업을 수행할 수 있는 자동화 에이전트를 설계하기 위해 Anthropic에서 영감을 받았습니다.
8개월 전
02.4K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

컴퓨터를 제어할 수 있는 진짜 AI, GLM-PC(스마트 스펙트럼 불) 사내 다운로드용 정식 출시

GLM-PC (Bull) 소개 GLM-PC는 자연어 명령을 통해 복잡한 작업을 빠르게 수행할 수 있는 코그에이전트 모델 기반의 데스크톱 애플리케이션입니다. 작업 계획 및 인터페이스 이해 능력이 있으며, 사용자 지시에 따라 다양한 컴퓨터 작업을 자율적으로 완료할 수 있습니다. 사용 시 주의사항...
8개월 전
03.4K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)

Runner H: 자연어 명령을 통한 웹 페이지 실행 작업 자동화(내부 테스트용 애플리케이션)

일반 소개 Runner H는 고급 AI 기능을 통해 작업자의 생산성을 향상시키기 위해 설계된 최첨단 작업 모델 개발에 전념하는 회사입니다. 주력 제품인 Runner H는 사용자가 복잡한 다단계 작업을 자동화하고 재작업을 줄일 수 있도록 설계된 고급 AI 에이전트입니다.
8개월 전
02.7K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: 멀티모달 인텔리전스를 사용한 자동화된 스마트폰 작동

포괄적인 소개 AppAgent는 스마트폰 애플리케이션을 조작하도록 설계된 LLM(대규모 언어 모델) 기반 멀티모달 에이전트 프레임워크입니다. 이 프레임워크는 단순화된 조작 공간을 통해 탭 및 스와이프와 같은 인간의 상호 작용을 모방하여 시스템 백엔드 액세스가 필요하지 않으므로 다양한 앱으로 범위를 확장할 수 있습니다.
8개월 전
03.2K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

Skyvern: LLM 및 컴퓨터 비전으로 브라우저 기반 워크플로 자동화하기

일반 소개 Skyvern은 대규모 언어 모델링(LLM)과 컴퓨터 비전 기술을 사용하여 브라우저 워크플로우를 자동화하는 도구입니다. 취약하거나 신뢰할 수 없는 자동화 솔루션을 대체할 수 있는 간단한 API 엔드포인트를 제공하여 많은 수의 웹사이트를 효율적으로 자동화합니다.
5개월 전
03.7K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: AI가 컴퓨터를 직접 제어할 수 있도록 하는 클라우드의 제어 컴퓨터를 오픈 소스로 구현한 기능입니다.

일반 설명 Agent.exe는 사용자가 AI를 통해 로컬 컴퓨터를 직접 제어할 수 있도록 Anthropic의 클로드 3.5 소네트 API를 활용하는 오픈 소스 일렉트론 애플리케이션입니다. 이 프로젝트는 K...에 의해 개발되었습니다.
8개월 전
02.9K