TankWork: un cuerpo inteligente que maneja ordenadores mediante voz y texto y proporciona información de voz en tiempo real.
Últimos recursos sobre IAPublicado hace 7 meses Círculo de intercambio de inteligencia artificial 2.7K 00
Introducción general
TankWork es un marco de agentes de escritorio de código abierto diseñado para permitir que la IA perciba y controle el ordenador mediante la visión por ordenador y la interacción a nivel de sistema. El marco permite a los agentes controlar directamente los ordenadores mediante comandos de voz y texto, procesar el contenido de la pantalla en tiempo real y proporcionar información audiovisual continua y registros de acciones.TankWork está especialmente indicado para que desarrolladores e investigadores les ayuden a crear agentes de escritorio autónomos capaces de comprender, analizar e interactuar realmente con interfaces informáticas.

Lista de funciones
- Control directo por ordenadorEjecutar operaciones mediante comandos de voz y texto
- Análisis de visión por ordenador: Tratamiento del contenido de la pantalla en tiempo real
- interacción por vozProcesamiento del lenguaje natural con ElevenLabs
- Agentes personalizablesConfigurar personalidades y competencias
- Información en tiempo realActualizaciones audiovisuales y registro
Utilizar la ayuda
Proceso de instalación
- Requisitos de instalación::
- Instale Anaconda (recomendado para la gestión de dependencias)
- Acceder a un terminal/comando
- almacén de clones::
git clone https://github.com/AgentTankOS/tankwork.git
cd tankwork
- Instalación de dependencias::
pip install --upgrade pip setuptools wheel
pip install -r requirements.txt
- Entorno de configuración::
- En el directorio raíz del proyecto, cree el archivo
.env
Documentación:
cp .env.example .env
- Añada la clave de API y la configuración a
.env
Documentación:
GEMINI_API_KEY=your_api_key OPENAI_API_KEY=your_api_key ELEVENLABS_API_KEY=your_api_key ANTHROPIC_API_KEY=your_api_key ELEVENLABS_MODEL=eleven_flash_v2_5 COMPUTER_USE_IMPLEMENTATION=tank COMPUTER_USE_MODEL=claude-3-5-sonnet-20241022 COMPUTER_USE_MODEL_PROVIDER=anthropic NARRATIVE_LOGGER_NAME=ComputerUse.Tank NARRATIVE_MODEL=gpt-4o NARRATIVE_TEMPERATURE=0.6 NARRATIVE_MAX_TOKENS=250 LOG_LEVEL=INFO
- En el directorio raíz del proyecto, cree el archivo
- lanzar una aplicación::
python main.py
Proceso de utilización
- Modo de control por PC::
- Control del ordenador mediante comandos de texto o de voz.
- Por ejemplo, puedes decir "abrir navegador" o teclear "abrir navegador" para iniciar el navegador.
- Análisis de visión por ordenador::
- Procesa el contenido de la pantalla en tiempo real, reconociendo y respondiendo a los cambios que se producen en ella.
- Por ejemplo, el agente puede realizar automáticamente una acción preestablecida cuando aparece una imagen específica en la pantalla.
- interacción por voz::
- Utilice las capacidades de procesamiento del lenguaje natural de ElevenLabs para interactuar con los agentes a través de la voz.
- Por ejemplo, puede preguntar al agente por las condiciones meteorológicas actuales y el agente le responderá por voz.
- Agentes personalizados::
- Configure la personalidad y las habilidades del agente para satisfacer necesidades específicas.
- Por ejemplo, puede configurar un agente para que realice una tarea concreta a una hora determinada, como abrir un cliente de correo electrónico a las 8 de la mañana todos los días.
- Información en tiempo real::
- El agente proporcionará actualizaciones en tiempo real y registros de funcionamiento, tanto sonoros como visuales, para ayudar al usuario a comprender el estado actual de funcionamiento.
- Por ejemplo, cuando el agente ejecuta un comando, informa al usuario del resultado de la operación por voz.
Con estos pasos, puedes instalar y utilizar fácilmente TankWork para aprovechar al máximo sus potentes funciones para controlar y gestionar tu ordenador.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...