Aprendizagem pessoal com IA
e orientação prática

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Introdução geral

O MediaCrawler é uma ferramenta de rastreamento de conteúdo de mídia social criada para desenvolvedores. Ao fornecer uma função de rastreamento avançada, ela pode obter rapidamente vídeos, imagens, comentários, curtidas, retweets e outros dados de plataformas sociais como Xiaohongshu, Jieyin, Shutterbug, B-station, Weibo e assim por diante. Essa ferramenta usa o Playwright como uma ponte, preservando o ambiente do navegador após o login e obtendo parâmetros criptografados por meio da execução de expressões JS, simplificando assim a dificuldade da engenharia reversa complexa.

Apenas para uso profissional, observe que a coleta de dados precisa ser realizada dentro do escopo da autorização.

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

 


 

Lista de funções

Suporte a plataformas como Xiaohongshu, Jieyin, Shutterbugs, B-station, Weibo, etc.
Fornecer login por cookie, login por código QR, login por número de celular e outros métodos
Suporte à pesquisa de palavras-chave e à função de rastreamento de ID de vídeo/post especificado
Suporte a cache de estado de login e pool de proxy IP
Fornecer soluções de CAPTCHA com controle deslizante (algumas plataformas)

 

terraço Pesquisa de palavras-chave Especifique o ID do post a ser rastreado Comentários secundários Página inicial do Criador Designado Cache de estado de login Pool de proxy IP Gerar nuvens de palavras de comentários
Little Red Book (site de rede social)
jitterbug
violino
Estação B
microblog
quadro de mensagens eletrônicas

 

 

Usando a Ajuda

Criar e ativar um ambiente virtual Python
Instale as dependências: use o comando `pip install -r requirements.txt`.
Para instalar o driver do navegador Playwright: use o comando `playwright install`.
Para executar o rastreador: use um argumento de linha de comando, como `python main.py --platform xhs --lt qrcode --type search`.
Use `python main.py --help` para ver exemplos de rastreadores para outras plataformas.
Verifique a estrutura do código do projeto e responda a mais perguntas no repositório do GitHub.

 

 

Materiais didáticos

Chefe do Círculo de Compartilhamento de IAEste conteúdo foi ocultado pelo autor. Digite o código de verificação para visualizar o conteúdo
Captcha:
Preste atenção ao número público do WeChat deste site, responda "CAPTCHA, um tipo de teste de desafio-resposta (computação)", obtenha o código de verificação. Pesquise no WeChat por "Chefe do Círculo de Compartilhamento de IA"ou"Aparência-AI"ou WeChat escaneando o lado direito do código QR pode prestar atenção a esse número público do WeChat do site.

Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil