Servidor MCP Firecrawl: Serviço MCP de rastreador da Web baseado no Firecrawl

Recursos mais recentes de IAAtualizado há 6 meses Círculo de compartilhamento de IA

20.7K 00

Introdução geral

Firecrawl MCP Server é uma ferramenta de código aberto desenvolvida pela MendableAI, com base no Modelo de protocolo de contexto (MCP), integrada à API Firecrawl, oferece rastreamento avançado da Web e extração de dados. Projetado para modelos de IA, como Cursor, Claude e outros clientes LLM, ele oferece suporte a uma ampla gama de operações, desde o rastreamento de uma única página até o rastreamento em lote, pesquisa e extração de dados estruturados. Quer se trate de renderização JavaScript de páginas da Web dinâmicas, rastreamento profundo e filtragem de conteúdo, o Firecrawl MCP Server realiza o trabalho com eficiência. A ferramenta é compatível com implantações em nuvem e auto-hospedadas com novas tentativas automáticas, limitação de taxa e sistemas de registro para desenvolvedores, pesquisadores e engenheiros de dados. Desde março de 2025, o projeto é atualizado continuamente no GitHub e é amplamente reconhecido pela comunidade.

Firecrawl MCP Server：基于 Firecrawl 的网页爬虫 MCP 服务

Lista de funções

Captura de página únicaMarkdown: extrai Markdown ou dados estruturados de um URL especificado.
rastreador em massaManuseio eficiente de vários URLs com suporte para operação paralela e limitação de taxa integrada.
Pesquisa na WebExtrai conteúdo de resultados de pesquisa com base em uma consulta.
rastreamento profundoSuporte à descoberta de URLs e ao rastreamento da Web em várias camadas.
extração de dadosExtração de informações estruturadas de páginas da Web usando LLM.
Renderização JavaScriptCaptura o conteúdo completo de uma página da Web dinâmica.
Filtragem inteligenteFiltragem de conteúdo por meio de inclusão/exclusão de tags.
Monitoramento de condiçõesProgresso da tarefa em lote: fornece consultas sobre o progresso da tarefa em lote e o uso de crédito.
sistema de registroStatus operacional: registra o status operacional, o desempenho e as mensagens de erro.
Suporte para celular/desktopAdaptação a diferentes portas de visualização de dispositivos.

Usando a Ajuda

Processo de instalação

O Firecrawl MCP Server oferece vários métodos de instalação para diferentes cenários de uso. Veja a seguir as etapas detalhadas:

Maneira 1: execução rápida com o npx

Obtenha a chave da API do Firecrawl (registre-se no site do Firecrawl para obtê-la).
Abra um terminal e defina as variáveis de ambiente:
```
export FIRECRAWL_API_KEY="fc-YOUR_API_KEY"
```

intercambialidade "fc-YOUR_API_KEY" para sua chave real.
3) Execute o pedido:

npx -y firecrawl-mcp

Após a inicialização bem-sucedida, o terminal exibe [INFO] FireCrawl MCP Server initialized successfully.

Modo 2: Instalação manual

Instalação global:
```
npm install -g firecrawl-mcp
```
Defina as variáveis de ambiente (como acima).
Em execução:
```
firecrawl-mcp
```

Abordagem 3: implementação auto-hospedada

Clonar um repositório do GitHub:

git clone https://github.com/mendableai/firecrawl-mcp-server.git
cd firecrawl-mcp-server

Instale a dependência:
```
npm install
```
Construir projeto:
```
npm run build
```
Defina as variáveis de ambiente e execute-o:
```
node dist/src/index.js
```

Maneira 4: Executar no cursor

seguro Cursor Versão 0.45.6 ou superior.
Abra Cursor Settings (Configurações do cursor) > Features (Recursos) > MCP Servers (Servidores MCP).
Clique em "+ Add New MCP Server" e digite:
- Nome. firecrawl-mcp
- Tipo. command
- Comando. env FIRECRAWL_API_KEY=your-api-key npx -y firecrawl-mcp
- Os usuários do Windows que estiverem com problemas podem tentar:cmd /c "set FIRECRAWL_API_KEY=your-api-key && npx -y firecrawl-mcp"
Salve e atualize a lista de servidores MCP, que o Composer Agent invoca automaticamente.

Maneira 5: Correndo no Windsurf

compilador ./codeium/windsurf/model_config.json::

{
"mcpServers": {
"mcp-server-firecrawl": {
"command": "npx",
"args": ["-y", "firecrawl-mcp"],
"env": {
"FIRECRAWL_API_KEY": "YOUR_API_KEY_HERE"
}
}
}
}

Salve e execute o Windsurf.

Configuração de variáveis de ambiente

Configuração necessária

FIRECRAWL_API_KEYChave de API da nuvem: chave de API da nuvem, que deve ser definida ao usar serviços de nuvem.

Configurações opcionais

FIRECRAWL_API_URLEndpoints de API para instâncias auto-hospedadas, como https://firecrawl.your-domain.com.
Repetir a configuração:
- FIRECRAWL_RETRY_MAX_ATTEMPTSNúmero máximo de novas tentativas, padrão 3.
- FIRECRAWL_RETRY_INITIAL_DELAYAtraso da primeira tentativa (milissegundos): atraso da primeira tentativa (milissegundos), padrão 1000.
- FIRECRAWL_RETRY_MAX_DELAYAtraso máximo em milissegundos, padrão 10000.
- FIRECRAWL_RETRY_BACKOFF_FACTORFator de fallback: O fator de fallback, padrão 2.
Monitoramento de crédito:
- FIRECRAWL_CREDIT_WARNING_THRESHOLDLimite de aviso: Limite de aviso, padrão 1000.
- FIRECRAWL_CREDIT_CRITICAL_THRESHOLDLimite de emergência: Limite de emergência, padrão 100.

Exemplo de configuração

Uso da nuvem:

export FIRECRAWL_API_KEY="your-api-key"
export FIRECRAWL_RETRY_MAX_ATTEMPTS=5
export FIRECRAWL_RETRY_INITIAL_DELAY=2000
export FIRECRAWL_CREDIT_WARNING_THRESHOLD=2000

Funções principais

Função 1: raspagem de uma única página (firecrawl_scrape)

procedimento::

Depois de iniciar o servidor, envie uma solicitação POST:

curl -X POST http://localhost:端口/firecrawl_scrape \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com", "formats": ["markdown"], "onlyMainContent": true, "timeout": 30000}'

Retorna o conteúdo principal no formato Markdown.

Descrição do parâmetro::
- onlyMainContentApenas os elementos principais são extraídos.
- includeTags/excludeTagsTags HTML: Especifique as tags HTML a serem incluídas ou excluídas.
cenário do aplicativoExtraia rapidamente as principais informações de um artigo ou página.

Função 2: Rastreamento em lote (firecrawl_batch_scrape)

procedimento::

Envia uma solicitação em massa:

curl -X POST http://localhost:端口/firecrawl_batch_scrape \
-H "Content-Type: application/json" \
-d '{"urls": ["https://example1.com", "https://example2.com"], "options": {"formats": ["markdown"]}}'

Obtenha a ID da operação, por exemplo. batch_1.

Verifique o status:

curl -X POST http://localhost:端口/firecrawl_check_batch_status \
-H "Content-Type: application/json" \
-d '{"id": "batch_1"}'

caracterizaçãoLimitação de taxa integrada e processamento paralelo para coleta de dados em grande escala.

Função 3: Pesquisa na Web (firecrawl_search)

procedimento::

Enviar uma solicitação de pesquisa:

curl -X POST http://localhost:端口/firecrawl_search \
-H "Content-Type: application/json" \
-d '{"query": "AI tools", "limit": 5, "scrapeOptions": {"formats": ["markdown"]}}'

Retorna o conteúdo Markdown dos resultados da pesquisa.

usoAcesso em tempo real aos dados da página da Web relevantes para a consulta.

Função 4: Deep Crawl (firecrawl_crawl)

procedimento::

Iniciar uma solicitação de rastreamento:

curl -X POST http://localhost:端口/firecrawl_crawl \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com", "maxDepth": 2, "limit": 100}'

Retorna os resultados do rastreamento.

parâmetros::maxDepth controlando a profundidade do rastreamento.limit Limite o número de páginas.

Função 5: Extração de dados (firecrawl_extract)

procedimento::

Envia uma solicitação de extração:

curl -X POST http://localhost:端口/firecrawl_extract \
-H "Content-Type: application/json" \
-d '{"urls": ["https://example.com"], "prompt": "Extract product name and price", "schema": {"type": "object", "properties": {"name": {"type": "string"}, "price": {"type": "number"}}}}'

Retorna dados estruturados.

caracterizaçãoSuporte para extração LLM, esquema personalizado para garantir o formato de saída.

Dicas e truques

Visualização do registroObservação: fique de olho nos registros do terminal em tempo de execução (por exemplo [INFO] Starting scrape) para depurar.
Tratamento de errosSe você encontrar [ERROR] Rate limit exceededAjuste os parâmetros de repetição ou aguarde.
Integração com o LLMNo Cursor ou Claude A ferramenta é chamada automaticamente ao inserir os requisitos de rastreamento diretamente no

Por meio das operações acima, os usuários podem facilmente implementar e usar o Firecrawl MCP Server para atender às necessidades diversificadas de dados da Web.

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Athina AI: visualização do fluxo de execução de código para criar e depurar aplicativos de IA

Recursos mais recentes de IA # Fluxo de trabalho com pouco código

8 meses atrás

017.3K

Upscayl: Ferramenta de ampliação sem perdas de imagens AI gratuita e de código aberto | Download do cliente Upscayl

Recursos mais recentes de IA # Ampliação e restauração de imagens AI

1 ano atrás

019.5K

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gráfico de conhecimento # Recuperação de conhecimento e estrutura RAG

8 meses atrás

019.7K

AI Humanize: reescreva textos on-line gratuitamente para contornar a detecção de IA

Recursos mais recentes de IA # AI Writing

5 meses atrás

017.9K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

Servidor MCP Firecrawl: Serviço MCP de rastreador da Web baseado no Firecrawl

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Maneira 1: execução rápida com o npx

Modo 2: Instalação manual

Abordagem 3: implementação auto-hospedada

Maneira 4: Executar no cursor

Maneira 5: Correndo no Windsurf

Configuração de variáveis de ambiente

Configuração necessária

Configurações opcionais

Exemplo de configuração

Funções principais

Função 1: raspagem de uma única página (firecrawl_scrape)

Função 2: Rastreamento em lote (firecrawl_batch_scrape)

Função 3: Pesquisa na Web (firecrawl_search)

Função 4: Deep Crawl (firecrawl_crawl)

Função 5: Extração de dados (firecrawl_extract)

Dicas e truques

Archon: uma estrutura de desenvolvimento para criar e otimizar inteligências de IA de forma autônoma

Matrix: um jogo imersivo de hacking de palavras com o tema Matrix

Artigos relacionados

Athina AI: visualização do fluxo de execução de código para criar e depurar aplicativos de IA

Upscayl: Ferramenta de ampliação sem perdas de imagens AI gratuita e de código aberto | Download do cliente Upscayl

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

AI Humanize: reescreva textos on-line gratuitamente para contornar a detecção de IA

Sem comentários

Últimas coleções

Artigos mais recentes

Servidor MCP Firecrawl: Serviço MCP de rastreador da Web baseado no Firecrawl

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Maneira 1: execução rápida com o npx

Modo 2: Instalação manual

Abordagem 3: implementação auto-hospedada

Maneira 4: Executar no cursor

Maneira 5: Correndo no Windsurf

Configuração de variáveis de ambiente

Configuração necessária

Configurações opcionais

Exemplo de configuração

Funções principais

Função 1: raspagem de uma única página (firecrawl_scrape)

Função 2: Rastreamento em lote (firecrawl_batch_scrape)

Função 3: Pesquisa na Web (firecrawl_search)

Função 4: Deep Crawl (firecrawl_crawl)

Função 5: Extração de dados (firecrawl_extract)

Dicas e truques

Archon: uma estrutura de desenvolvimento para criar e otimizar inteligências de IA de forma autônoma

Matrix: um jogo imersivo de hacking de palavras com o tema Matrix

Artigos relacionados

Athina AI: visualização do fluxo de execução de código para criar e depurar aplicativos de IA

Upscayl: Ferramenta de ampliação sem perdas de imagens AI gratuita e de código aberto | Download do cliente Upscayl

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

AI Humanize: reescreva textos on-line gratuitamente para contornar a detecção de IA

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes