Introdução geral
Firecrawl MCP Server é uma ferramenta de código aberto desenvolvida pela MendableAI, com base no Modelo de protocolo de contexto (MCP), integrada à API Firecrawl, oferece rastreamento avançado da Web e extração de dados. Projetado para modelos de IA, como Cursor, Claude e outros clientes LLM, ele oferece suporte a uma ampla gama de operações, desde o rastreamento de uma única página até o rastreamento em lote, pesquisa e extração de dados estruturados. Quer se trate de renderização JavaScript de páginas da Web dinâmicas, rastreamento profundo e filtragem de conteúdo, o Firecrawl MCP Server realiza o trabalho com eficiência. A ferramenta é compatível com implantações em nuvem e auto-hospedadas com novas tentativas automáticas, limitação de taxa e sistemas de registro para desenvolvedores, pesquisadores e engenheiros de dados. Desde março de 2025, o projeto é atualizado continuamente no GitHub e é amplamente reconhecido pela comunidade.
Lista de funções
- Captura de página únicaMarkdown: extrai Markdown ou dados estruturados de um URL especificado.
- rastreador em massaManuseio eficiente de vários URLs com suporte para operação paralela e limitação de taxa integrada.
- Pesquisa na WebExtrai conteúdo de resultados de pesquisa com base em uma consulta.
- rastreamento profundoSuporte à descoberta de URLs e ao rastreamento da Web em várias camadas.
- extração de dadosExtração de informações estruturadas de páginas da Web usando LLM.
- Renderização JavaScriptCaptura o conteúdo completo de uma página da Web dinâmica.
- Filtragem inteligenteFiltragem de conteúdo por meio de inclusão/exclusão de tags.
- Monitoramento de condiçõesProgresso da tarefa em lote: fornece consultas sobre o progresso da tarefa em lote e o uso de crédito.
- sistema de registroStatus operacional: registra o status operacional, o desempenho e as mensagens de erro.
- Suporte para celular/desktopAdaptação a diferentes portas de visualização de dispositivos.
Usando a Ajuda
Processo de instalação
O Firecrawl MCP Server oferece vários métodos de instalação para diferentes cenários de uso. Veja a seguir as etapas detalhadas:
Maneira 1: execução rápida com o npx
- Obtenha a chave da API do Firecrawl (registre-se no site do Firecrawl para obtê-la).
- Abra um terminal e defina as variáveis de ambiente:
export FIRECRAWL_API_KEY="fc-YOUR_API_KEY"
intercambialidade "fc-YOUR_API_KEY"
para sua chave real.
3) Execute o pedido:
npx -y firecrawl-mcp
- Após a inicialização bem-sucedida, o terminal exibe
[INFO] Servidor FireCrawl MCP inicializado com sucesso
.
Modo 2: Instalação manual
- Instalação global:
npm install -g firecrawl-mcp
- Defina as variáveis de ambiente (como acima).
- Em execução:
firecrawl-mcp
Abordagem 3: implementação auto-hospedada
- Clonar um repositório do GitHub:
git clone https://github.com/mendableai/firecrawl-mcp-server.git cd firecrawl-mcp-server
- Instale a dependência:
npm install
- Construir projeto:
npm run build
- Defina as variáveis de ambiente e execute-o:
node dist/src/index.js
Maneira 4: Executar no cursor
- seguro Cursor Versão 0.45.6 ou superior.
- Abra Cursor Settings (Configurações do cursor) > Features (Recursos) > MCP Servers (Servidores MCP).
- Clique em "+ Add New MCP Server" e digite:
- Nome.
firecrawl-mcp
- Tipo.
comando
- Comando.
env FIRECRAWL_API_KEY=sua-chave-api npx -y firecrawl-mcp
- Os usuários do Windows que estiverem com problemas podem tentar:
cmd /c "set FIRECRAWL_API_KEY=sua-chave-api && npx -y firecrawl-mcp"
- Nome.
- Salve e atualize a lista de servidores MCP, que o Composer Agent invoca automaticamente.
Maneira 5: Correndo no Windsurf
- compilador
. /codeium/windsurf/model_config.json
::{ "mcpServers": { "mcp-server-firecrawl": { "comando": "npx", "args": ["-y", "firecrawl-mcp" ], { "env": { "FIRECRAWL_API_KEY": "YOUR_API_KEY_HERE" } } } }
- Salve e execute o Windsurf.
Configuração de variáveis de ambiente
Configuração necessária
FIRECRAWL_API_KEY
Chave de API da nuvem: chave de API da nuvem, que deve ser definida ao usar serviços de nuvem.
Configurações opcionais
FIRECRAWL_API_URL
Endpoints de API para instâncias auto-hospedadas, comohttps://firecrawl.your-domain.com
.- Repetir a configuração:
FIRECRAWL_RETRY_MAX_ATTEMPTS
Número máximo de novas tentativas, padrão 3.FIRECRAWL_RETRY_INITIAL_DELAY
Atraso da primeira tentativa (milissegundos): atraso da primeira tentativa (milissegundos), padrão 1000.FIRECRAWL_RETRY_MAX_DELAY
Atraso máximo em milissegundos, padrão 10000.FIRECRAWL_RETRY_BACKOFF_FACTOR
Fator de fallback: O fator de fallback, padrão 2.
- Monitoramento de crédito:
FIRECRAWL_CREDIT_WARNING_THRESHOLD
Limite de aviso: Limite de aviso, padrão 1000.FIRECRAWL_CREDIT_CRITICAL_THRESHOLD
Limite de emergência: Limite de emergência, padrão 100.
Exemplo de configuração
Uso da nuvem:
export FIRECRAWL_API_KEY="your-api-key"
export FIRECRAWL_RETRY_MAX_ATTEMPTS=5
export FIRECRAWL_RETRY_INITIAL_DELAY=2000
export FIRECRAWL_CREDIT_WARNING_THRESHOLD=2000
Funções principais
Função 1: raspagem de uma única página (firecrawl_scrape)
- procedimento::
- Depois de iniciar o servidor, envie uma solicitação POST:
curl -X POST http://localhost:端口/firecrawl_scrape \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com", "formats": ["markdown"], "onlyMainContent": true, "timeout": 30000}'
- Retorna o conteúdo principal no formato Markdown.
- Depois de iniciar o servidor, envie uma solicitação POST:
- Descrição do parâmetro::
onlyMainContent
Apenas os elementos principais são extraídos.includeTags
/excludeTags
Tags HTML: Especifique as tags HTML a serem incluídas ou excluídas.
- cenário do aplicativoExtraia rapidamente as principais informações de um artigo ou página.
Função 2: Rastreamento em lote (firecrawl_batch_scrape)
- procedimento::
- Envia uma solicitação em massa:
curl -X POST http://localhost:端口/firecrawl_batch_scrape \ -H "Content-Type: application/json" \ -d '{"urls": ["https://example1.com", "https://example2.com"], "options": {"formats": ["markdown"]}}'
- Obtenha a ID da operação, por exemplo.
lote_1
. - Verifique o status:
curl -X POST http://localhost:端口/firecrawl_check_batch_status \ -H "Content-Type: application/json" \ -d '{"id": "batch_1"}'
- Envia uma solicitação em massa:
- caracterizaçãoLimitação de taxa integrada e processamento paralelo para coleta de dados em grande escala.
Função 3: Pesquisa na Web (firecrawl_search)
- procedimento::
- Enviar uma solicitação de pesquisa:
curl -X POST http://localhost:端口/firecrawl_search \ -H "Content-Type: application/json" \ -d '{"query": "AI tools", "limit": 5, "scrapeOptions": {"formats": ["markdown"]}}'
- Retorna o conteúdo Markdown dos resultados da pesquisa.
- Enviar uma solicitação de pesquisa:
- usoAcesso em tempo real aos dados da página da Web relevantes para a consulta.
Função 4: Deep Crawl (firecrawl_crawl)
- procedimento::
- Iniciar uma solicitação de rastreamento:
curl -X POST http://localhost:端口/firecrawl_crawl \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com", "maxDepth": 2, "limit": 100}'
- Retorna os resultados do rastreamento.
- Iniciar uma solicitação de rastreamento:
- parâmetros::
maxDepth
controlando a profundidade do rastreamento.limite
Limite o número de páginas.
Função 5: Extração de dados (firecrawl_extract)
- procedimento::
- Envia uma solicitação de extração:
curl -X POST http://localhost:端口/firecrawl_extract \ -H "Content-Type: application/json" \ -d '{"urls": ["https://example.com"], "prompt": "Extract product name and price", "schema": {"type": "object", "properties": {"name": {"type": " string"}, "price": {"type": "number"}}}}'
- Retorna dados estruturados.
- Envia uma solicitação de extração:
- caracterizaçãoSuporte para extração LLM, esquema personalizado para garantir o formato de saída.
Dicas e truques
- Visualização do registroObservação: fique de olho nos registros do terminal em tempo de execução (por exemplo
[INFO] Iniciando o scrape
) para depurar. - Tratamento de errosSe você encontrar
[ERRO] Limite de taxa excedido
Ajuste os parâmetros de repetição ou aguarde. - Integração com o LLMNo Cursor ou Claude A ferramenta é chamada automaticamente ao inserir os requisitos de rastreamento diretamente no
Por meio das operações acima, os usuários podem facilmente implementar e usar o Firecrawl MCP Server para atender às necessidades diversificadas de dados da Web.