Maxun: una plataforma sin código y de código abierto que rastrea automáticamente datos web y los convierte en API u hojas de cálculo.
Últimos recursos sobre IAActualizado hace 10 meses Círculo de intercambio de inteligencia artificial 29.5K 00
Introducción general
Maxun es una plataforma de extracción de datos web sin código y de código abierto que permite a los usuarios entrenar robots en cuestión de minutos para que rastreen automáticamente datos web y los conviertan en API u hojas de cálculo. La plataforma admite paginación y desplazamiento, puede adaptarse a cambios en el diseño del sitio web y ofrece potentes funciones de rastreo de datos para una gran variedad de necesidades de extracción de datos.


Lista de funciones
- Extracción de datos sin código: no es necesario escribir código para rastrear los datos de la página web.
- Rastreo automatizado de datos: los robots automatizan las tareas de rastreo de datos.
- Generación de API: convierte los datos rastreados en una API.
- Conversión a hoja de cálculo: exportación de los datos capturados a una hoja de cálculo
- Función de paginación y desplazamiento: gestión de datos de varias páginas y de páginas largas.
- Adaptación a los cambios de diseño del sitio web: adaptación automática a los cambios de diseño de la página
- Soporte de inicio de sesión y autenticación de dos factores: rastreo de datos de sitios web que requieren inicio de sesión (próximamente).
- Integración con Google Sheets: importación de datos directamente a Google Sheets
- Compatibilidad con proxy: utilice proxies externos para eludir la protección anti-bot.
Utilizar la ayuda
Proceso de instalación
Instalación con Docker Compose
- Almacén de proyectos de clonación:
git clone https://github.com/getmaxun/maxun
- Vaya al catálogo de proyectos:
cd maxun
- Cree e inicie el servicio mediante Docker Compose:
docker-compose up -d --build
instalación manual
- Asegúrese de que Node.js, PostgreSQL, MinIO y Redis están instalados en su sistema.
- Almacén de proyectos de clonación:
git clone https://github.com/getmaxun/maxun
- Vaya al directorio del proyecto e instale las dependencias:
cd maxun
npm install
cd maxun-core
npm install
- Ponga en marcha los servicios front-end y back-end:
npm run start
- El servicio front-end se ejecutará en http://localhost:5173/ y el servicio back-end en http://localhost:8080/.
Normas de uso
- Creación de robots::
- Tras iniciar sesión en la plataforma, haz clic en el botón "Crear bot".
- Seleccione el tipo de datos que desea capturar (lista, texto o captura de pantalla).
- Configure las reglas de rastreo, como la URL de destino, la frecuencia de rastreo, etc.
- Guarde e inicie el robot, que realizará automáticamente la tarea de captura de datos.
- Exportación de datos::
- Una vez completada la misión bot, ve a la página de detalles de la misión.
- Seleccione el formato de exportación (API u hoja de cálculo).
- Haga clic en el botón "Exportar" para descargar los datos u obtener el enlace API.
- Paginación y desplazamiento::
- Configure las opciones de paginación y desplazamiento al crear un bot.
- El robot procesará automáticamente los datos de varias páginas y los datos de páginas largas para garantizar la integridad de los datos.
- Adaptación a los cambios de diseño del sitio web::
- La plataforma incorpora algoritmos inteligentes que se adaptan automáticamente a los cambios en el diseño de las páginas.
- No es necesario ajustar manualmente las reglas de rastreo, el robot se adaptará automáticamente a los cambios.
- Integración con Google Sheets::
- En Configuración de la plataforma, configure la integración de Google Sheets.
- Los datos capturados por el robot se importarán automáticamente al formulario de Google Sheets especificado.
- Utilizar proxies::
- En Configuración de la plataforma, configure el agente externo.
- El robot realizará la tarea de agarre a través de un proxy, eludiendo la protección antirrobot.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




