Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

Scripts de geração de imagens de IA baseados em trabalho da Cloudflare

Introdução geral

O CloudFlare-AI-Image é um projeto de código aberto hospedado no GitHub que fornece serviços gratuitos de geração de imagens de IA por meio da plataforma Cloudflare Workers. Ele suporta funções de texto para mapa e mapa para mapa, com base em cinco modelos, incluindo Flux.1 [schnell], Stable Diffusion XL, etc., o uso padrão de SD-XL-Base-CF. Os usuários podem inserir uma descrição de texto ou fazer upload de uma imagem de referência, você pode gerar imagens de alta qualidade. A interface do projeto é compatível com o formato OpenAI e é fácil de integrar e implantar para desenvolvedores, designers e entusiastas criativos. Com a rede global da Cloudflare, a velocidade de geração é rápida e estável, e o código-fonte é aberto e pode ser modificado livremente.

Script de geração de imagens de IA baseado no Cloudflare Worker-1


 

Lista de funções

  • Suporte a imagens de texto para gerar, insira a descrição do texto para gerar imagens de alta qualidade.
  • Oferece suporte a imagens geradas por gráficos para gerar novas imagens com base em imagens de referência carregadas.
  • Cinco modelos opcionais são fornecidos: DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
  • API REST compatível com o formato OpenAI para facilitar a integração em aplicativos de terceiros.
  • Parâmetros de geração personalizáveis, como estilo de imagem, número de etapas e resolução.
  • Implantado no Cloudflare Workers, não são necessários servidores gerenciados.
  • Oferece suporte ao armazenamento KV para armazenar em cache as imagens geradas.
  • Código-fonte aberto, modificável pelo usuário e extensível.

 

Usando a Ajuda

Processo de instalação

Para usar o CloudFlare-AI-Image, você precisa concluir as seguintes etapas de implantação. O processo é simples, mas requer uma configuração cuidadosa de seu ambiente.

  1. Registre-se em uma conta da Cloudflare
    Visite o site oficial da Cloudflare para se registrar ou entrar em uma conta. O plano gratuito é suficiente para dar suporte a este projeto. Certifique-se de que a conta tenha permissões de namespace Workers AI e KV.
  2. Clonagem do código do projeto
    Execute o seguinte comando no terminal para clonar o projeto localmente:

    git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
    

    Vá para o catálogo de projetos:

    cd CloudFlare-AI-Image
    
  3. Instalação do Wrangler
    O Wrangler é uma ferramenta para implantar o Cloudflare Workers. Comando de instalação:

    npm install -g @cloudflare/wrangler
    

    Faça login no Wrangler:

    wrangler login
    

    Siga as instruções para autorizar em seu navegador.

  4. Configuração de variáveis de ambiente
    O projeto precisa vincular os namespaces Workers AI e KV e configurar as informações da conta.

    • Faça login no painel do Cloudflare e localize o ID da conta.
    • Crie tokens de API com permissões para incluir IA do Workers, edição de scripts do Workers e armazenamento de KV.
    • compilador wrangler.toml com o ID da conta e o namespace KV:
      account_id = "你的账户ID"
      name = "cloudflare-ai-image"
      compatibility_date = "2023-09-01"
      [[kv_namespaces]]
      binding = "IMAGE_KV"
      id = "你的KV命名空间ID"
      
    • Criar um espaço de nome KV:
      wrangler kv:namespace create IMAGE_KV
      

      Copie a ID retornada e preencha o campo wrangler.toml.

    • Defina o token da API:
      wrangler secret put CLOUDFLARE_API_TOKEN
      

      Digite seu token de API.

    • (Opcional) Defina SF_TOKEN se estiver usando um modelo de estágio de fluxo baseado em silício:
      wrangler secret put SF_TOKEN
      

      Insira o token de API solicitado da Silicon Mobility Platform.

  5. Projetos de implantação
    Execute no diretório do projeto:

    wrangler publish
    

    Depois de uma implementação bem-sucedida, obtenha o URL dos trabalhadores, por exemplo https://cloudflare-ai-image.your-account.workers.dev.

  6. teste local
    Se a depuração local for necessária, execute:

    wrangler dev
    

    Isso iniciará o servidor local e acessará o arquivo http://localhost:8787 Função de teste.

Uso

Depois de implantado, você pode usar a geração de imagens por meio da API, do cliente ou do URL do Workers. Aqui estão instruções detalhadas sobre como fazer isso.

Selecione o modelo

O projeto suporta cinco modelos, sendo que o FLUX.1-Schnell-CF é recomendado para obter melhores resultados, mas há um limite de uso diário. Outros modelos estão listados abaixo:

  • DS-8-CFBaseado no Dreamshaper-8-LCM, é adequado para gerar rapidamente imagens de estilo artístico.
  • SD-XL-Bash-CFModelo padrão, baseado no Stable Diffusion XL, equilibrando velocidade e qualidade.
  • SD-XL-Lightning-CFOtimizado para velocidade e adequado para cenários simples.
  • FLUX.1-Schnell-CFModelo de alta qualidade, rico em detalhes, recomendado para cenas complexas.
  • SF-KolorsBaseado em Kwai-Kolors, adequado para imagens de estilo asiático, SF_TOKEN precisa ser configurado.

Ao selecionar um modelo, especifique o nome do modelo na solicitação de API ou no arquivo de configuração, por exemplo "model": "@cf/black-forest-labs/flux-1-schnell".

Diagrama de Vincennes

Os diagramas de Venn geram imagens a partir de descrições textuais.

  • via API::
    Chame o ponto de extremidade da API usando uma solicitação POST:

    curl -X POST https://your-project.workers.dev/api/generate \
    -H "Content-Type: application/json" \
    -d '{"prompt": "一片星空下的雪山,月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'
    

    Retorna JSON contendo o URL da imagem ou dados Base64.

  • através do cliente::
    A interface do projeto é compatível com o formato OpenAI e pode ser usada com um cliente habilitado para OpenAI (como o cliente ChatGPT). Configure o endereço da API do cliente para ser o URL de seus funcionários e digite o prompt para gerar a imagem.
  • via URL dos trabalhadores::
    entrevistas https://your-project.workers.devdigite a palavra de prompt, clique em Generate e o navegador exibirá a imagem.

Otimizar palavras de alerta::
As palavras-chave claras melhoram a qualidade da imagem. Exemplo:

  • Difuso:"一朵花"
  • Otimização:"一朵盛开的红玫瑰,背景是绿色草地,阳光明媚"
    As dicas em inglês podem funcionar melhor, como "A red rose in bloom on a green meadow under bright sunlight".

Tucson (cidade)

As tuplas geram novas imagens com base em imagens de referência.

  • via API::
    Faça upload de uma imagem e forneça uma palavra-chave:

    curl -X POST https://your-project.workers.dev/api/generate \
    -H "Content-Type: application/json" \
    -d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'
    
  • via URL dos trabalhadores::
    Visite a página, faça upload de uma imagem de referência, insira uma descrição (por exemplo "卡通风格") para gerar uma nova imagem.

Parâmetros personalizados

Há suporte para o ajuste dos seguintes parâmetros:

  • EtapasPadrão 8, intervalo de 1 a 50, etapas mais altas fornecem mais detalhes, mas aumentam o consumo de tempo.
  • resolução (de uma foto)Padrão: 512x512, ajustável para 1024x1024 (dependendo do suporte do modelo).
  • penteadoControlado por palavras-chave, como "油画风格"e"赛博朋克".
    Adicione parâmetros à solicitação de API:
{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}

Opções de tradução forçada

  • --ntlDesativar a tradução e manter as palavras originais do prompt para usuários multilíngues.
  • --tlTradução forçada de palavras de prompt para o inglês para melhorar a qualidade da geração.
    Na solicitação de API, adicione "translate": "tl" talvez "translate": "ntl".

Ver registro

Faça login no painel da Cloudflare e acesse a visão geral dos Workers para ver os registros de solicitação, os registros de geração e o uso de recursos.

advertência

  • cota livreO plano gratuito do Cloudflare Workers de 100.000 solicitações por dia é suficiente para suportar o uso pessoal. Pode haver limites adicionais nas chamadas de modelo para o Workers AI (por exemplo, limite diário para FLUX.1).
  • Desempenho do modeloO FLUX.1-Schnell-CF funciona melhor, mas pode ser limitado em cargas elevadas. O SD-XL-Bash-CF é adequado para uso diário.
  • segurançaRecomenda-se definir a chave de API para evitar acesso não autorizado.
  • Restrições de palavras-chavePara evitar conteúdo sensível ou inadequado, os modelos são filtrados automaticamente.

 

cenário do aplicativo

  1. criação de conteúdo
    Os blogueiros precisam ilustrar suas postagens, inserir "一片热带雨林,阳光穿透树叶"A versão mais recente do produto é aquela que gera imagens de alta qualidade em segundos, economizando dinheiro em custos de design.
  2. desenvolvimento de aplicativos
    O desenvolvedor gera um mapa de exibição de produtos para a plataforma de comércio eletrônico, que é chamado dinamicamente por meio da API, e insere descrições como "现代风格的沙发,白色背景"para aprimorar a experiência do usuário.
  3. Descoberta da arte
    O aluno ou artista faz upload de um esboço, usa o diagrama para gerar um diagrama e insere o "赛博朋克风格"A empresa está sempre pronta para gerar um trabalho exclusivo para estudo ou apresentação.
  4. Educação e treinamento
    Os professores geram materiais de instrução, como insumos "古代中国的城市街道"usado em cursos de história para visualizar cenas.

 

QA

  1. Quanto tempo leva para gerar uma imagem?
    De 2 a 15 segundos, dependendo do modelo, do número de etapas e da rede. O flux.1-schnell-cf é o mais rápido, o sd-xl-bash-cf é um pouco mais lento.
  2. Quais tipos de imagem são compatíveis?
    Oferece suporte a paisagens, pessoas, objetos, estilos de arte, etc. Cenas complexas precisam ser otimizadas para palavras-chave e o conteúdo sensível será filtrado.
  3. Tenho que pagar pela implantação?
    Não é necessário. O projeto é de código aberto e o plano gratuito da Cloudflare é suficiente. Os modelos SF-Kolors exigem um aplicativo SF_TOKEN gratuito.
  4. Como faço para trocar de modelo?
    Especifique o nome do modelo na solicitação de API ou modifique o modelo padrão no arquivo de configuração. Recomenda-se testar o FLUX.1-Schnell-CF.
  5. Como funciona o recurso Tupelo?
    Faça upload de uma imagem de referência, insira uma descrição (por exemplo "卡通风格"), gerando novas imagens por meio da API ou de uma página.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Scripts de geração de imagens de IA baseados em trabalho da Cloudflare
pt_BRPortuguês do Brasil