Introdução geral
O Aggregator é um projeto de código aberto desenvolvido para criar um pool de proxy gratuito que pode rastrear uma variedade de nós de proxy disponíveis. A plataforma tem um sistema de plug-in flexível, os usuários podem, de acordo com as necessidades especiais do site de destino, usar plug-ins para obter funções específicas. O projeto é usado principalmente para aprender técnicas de rastreamento, sendo proibido para qualquer atividade ilegal.
Lista de funções
- Agente Construção de piscinaRastreamento: rastreia e agrega automaticamente nós de proxy de várias fontes para formar um pool de proxy de alta qualidade.
- sistema de plug-inSuporte a plug-ins definidos pelo usuário para atender às necessidades específicas de diferentes sites.
- automaçãoInclui login automático, registro automático, agregação de assinaturas e outras funções para simplificar a operação do usuário.
- Suporte a vários protocolosSuporte a uma variedade de protocolos de proxy, como HTTP, HTTPS, SOCKS e outros.
- Código aberto e suporte da comunidadeO projeto é de código aberto e os usuários podem modificar e ampliar a funcionalidade e obter suporte por meio da comunidade.
Usando a Ajuda
Processo de instalação
- Preparação ambientalVerifique se o Python 3.6 ou superior está instalado.
- projeto de clonagem: Uso
git clone https://github.com/wzdnzd/aggregator
para clonar o projeto localmente. - Instalação de dependênciasVá para o diretório do projeto e execute
pip install -r requirements.txt
Instale as dependências necessárias. - arquivo de configuraçãoModificar conforme necessário
config.yaml
Arquivo de configuração para definir os parâmetros do alvo de rastreamento e do pool de proxy. - Projetos em andamento: Implementação
python collect.py
Para iniciar o rastreamento do nó proxy, executepython process.py
Agentes de processamento e agregação.
Processo de uso
- Iniciar o rastreador: Executar
python collect.py
Comece a rastrear os nós de proxy e o sistema os rastreará automaticamente de acordo com as definições no arquivo de configuração. - Processamento de dados: Executar
python process.py
Os nós de proxy rastreados são processados e filtrados para garantir a alta qualidade do pool de proxy. - Uso do plug-inDependendo das necessidades do site de destino, escreva ou use um plug-in existente a ser colocado no diretório
plugins
o sistema o carregará e executará automaticamente. - automaçãoConfigure o check-in automático, o registro automático e outras funções, e execute os scripts correspondentes para obter uma operação automatizada.
- Exibir resultadosApós a conclusão do processamento, os dados do pool de agentes serão salvos em um arquivo especificado e poderão ser usados pelo usuário conforme necessário.
Procedimento de operação detalhado
- Agente Construção de piscinaO sistema rastreia regularmente os nós de proxy de várias fontes e os examina e verifica para garantir a alta qualidade e a disponibilidade do pool de proxy.
- sistema de plug-inOs usuários podem escrever plug-ins personalizados com base nas necessidades específicas do site de destino a ser colocado no
plugins
o sistema carregará e executará automaticamente esses plug-ins. - automaçãoConfigure o check-in automático, o registro automático e outras funções por meio do arquivo de configuração, e o sistema executará essas operações periodicamente para simplificar a operação diária do usuário.
- Suporte a vários protocolosO sistema oferece suporte a vários protocolos de proxy, como HTTP, HTTPS, SOCKS, etc. Os usuários podem escolher o protocolo de proxy apropriado para usar de acordo com suas necessidades.