Scripts de geração de imagens de IA baseados em trabalho da Cloudflare

Recursos mais recentes de IAPublicado há 5 meses Círculo de compartilhamento de IA

16.2K 00

Introdução geral

O CloudFlare-AI-Image é um projeto de código aberto hospedado no GitHub que fornece serviços gratuitos de geração de imagens de IA por meio da plataforma Cloudflare Workers. Ele oferece suporte a recursos gerados por texto e por gráficos com base em cinco modelos, incluindo Fluxo.1 [schnell], Stable Diffusion XL, etc. O SD-XL-Base-CF é usado por padrão. Os usuários podem gerar imagens de alta qualidade inserindo descrições de texto ou carregando imagens de referência. A interface do projeto é compatível com o formato OpenAI, o que facilita a integração e a implantação para desenvolvedores, designers e entusiastas criativos. Com a rede global da Cloudflare, a velocidade de geração é rápida e estável, e o código-fonte é aberto e pode ser modificado livremente.

Lista de funções

Suporte a imagens de texto para gerar, insira a descrição do texto para gerar imagens de alta qualidade.
Oferece suporte a imagens geradas por gráficos para gerar novas imagens com base em imagens de referência carregadas.
Cinco modelos opcionais são fornecidos: DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
API REST compatível com o formato OpenAI para facilitar a integração em aplicativos de terceiros.
Parâmetros de geração personalizáveis, como estilo de imagem, número de etapas e resolução.
Implantado no Cloudflare Workers, não são necessários servidores gerenciados.
Oferece suporte ao armazenamento KV para armazenar em cache as imagens geradas.
Código-fonte aberto, modificável pelo usuário e extensível.

Usando a Ajuda

Processo de instalação

Para usar o CloudFlare-AI-Image, você precisa concluir as seguintes etapas de implantação. O processo é simples, mas requer uma configuração cuidadosa de seu ambiente.

Registre-se em uma conta da Cloudflare
Visite o site oficial da Cloudflare para se registrar ou entrar em uma conta. O plano gratuito é suficiente para dar suporte a este projeto. Certifique-se de que a conta tenha permissões de namespace Workers AI e KV.
Clonagem do código do projeto
Execute o seguinte comando no terminal para clonar o projeto localmente:
```
git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
```
Vá para o catálogo de projetos:
```
cd CloudFlare-AI-Image
```
Instalação do Wrangler
O Wrangler é uma ferramenta para implantar o Cloudflare Workers. Comando de instalação:
```
npm install -g @cloudflare/wrangler
```
Faça login no Wrangler:
```
wrangler login
```
Siga as instruções para autorizar em seu navegador.
Configuração de variáveis de ambiente
O projeto precisa vincular os namespaces Workers AI e KV e configurar as informações da conta.
- Faça login no painel do Cloudflare e localize o ID da conta.
- Crie tokens de API com permissões para incluir IA do Workers, edição de scripts do Workers e armazenamento de KV.
- compilador wrangler.toml com o ID da conta e o namespace KV:
```
account_id = "你的账户ID"
name = "cloudflare-ai-image"
compatibility_date = "2023-09-01"
[[kv_namespaces]]
binding = "IMAGE_KV"
id = "你的KV命名空间ID"
```
- Criar um espaço de nome KV:
```
wrangler kv:namespace create IMAGE_KV
```
  Copie a ID retornada e preencha o campo wrangler.toml.
- Defina o token da API:
```
wrangler secret put CLOUDFLARE_API_TOKEN
```
  Digite seu token de API.
- (Opcional) Defina SF_TOKEN se estiver usando um modelo de estágio de fluxo baseado em silício:
```
wrangler secret put SF_TOKEN
```
  Insira o token de API solicitado da Silicon Mobility Platform.
Projetos de implantação
Execute no diretório do projeto:
```
wrangler publish
```
Depois de uma implementação bem-sucedida, obtenha o URL dos trabalhadores, por exemplo https://cloudflare-ai-image.your-account.workers.dev.
teste local
Se a depuração local for necessária, execute:
```
wrangler dev
```
Isso iniciará o servidor local e acessará o arquivo http://localhost:8787 Função de teste.

Uso

Depois de implantado, você pode usar a geração de imagens por meio da API, do cliente ou do URL do Workers. Aqui estão instruções detalhadas sobre como fazer isso.

Selecione o modelo

O projeto suporta cinco modelos, sendo que o FLUX.1-Schnell-CF é recomendado para obter melhores resultados, mas há um limite de uso diário. Outros modelos estão listados abaixo:

DS-8-CFBaseado no Dreamshaper-8-LCM, é adequado para gerar rapidamente imagens de estilo artístico.
SD-XL-Bash-CFModelo padrão, baseado no Stable Diffusion XL, equilibrando velocidade e qualidade.
SD-XL-Lightning-CFOtimizado para velocidade e adequado para cenários simples.
FLUX.1-Schnell-CFModelo de alta qualidade, rico em detalhes, recomendado para cenas complexas.
SF-KolorsBaseado em Kwai-Kolors, adequado para imagens de estilo asiático, SF_TOKEN precisa ser configurado.

Ao selecionar um modelo, especifique o nome do modelo na solicitação de API ou no arquivo de configuração, por exemplo "model": "@cf/black-forest-labs/flux-1-schnell".

Diagrama de Vincennes

Os diagramas de Venn geram imagens a partir de descrições textuais.

via API::
Chame o ponto de extremidade da API usando uma solicitação POST:

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "一片星空下的雪山，月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'

Retorna JSON contendo o URL da imagem ou dados Base64.

através do cliente::
A interface do projeto é compatível com o formato OpenAI e pode ser usada com clientes habilitados para OpenAI, como ChatGPT (Cliente). Configure o endereço da API do cliente para ser o URL de seus funcionários e digite o prompt para gerar a imagem.
via URL dos trabalhadores::
entrevistas https://your-project.workers.devdigite a palavra de prompt, clique em Generate e o navegador exibirá a imagem.

Otimizar palavras de alerta::
As palavras-chave claras melhoram a qualidade da imagem. Exemplo:

Difuso:"一朵花"
Otimização:"一朵盛开的红玫瑰，背景是绿色草地，阳光明媚"
As dicas em inglês podem funcionar melhor, como "A red rose in bloom on a green meadow under bright sunlight".

Tucson (cidade)

As tuplas geram novas imagens com base em imagens de referência.

via API::
Faça upload de uma imagem e forneça uma palavra-chave:

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'

via URL dos trabalhadores::
Visite a página, faça upload de uma imagem de referência, insira uma descrição (por exemplo "卡通风格") para gerar uma nova imagem.

Parâmetros personalizados

Há suporte para o ajuste dos seguintes parâmetros:

EtapasPadrão 8, intervalo de 1 a 50, etapas mais altas fornecem mais detalhes, mas aumentam o consumo de tempo.
resolução (de uma foto)Padrão: 512x512, ajustável para 1024x1024 (dependendo do suporte do modelo).
penteadoControlado por palavras-chave, como "油画风格"e"赛博朋克".
Adicione parâmetros à solicitação de API:

{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}

Opções de tradução forçada

--ntlDesativar a tradução e manter as palavras originais do prompt para usuários multilíngues.
--tlTradução forçada de palavras de prompt para o inglês para melhorar a qualidade da geração.
Na solicitação de API, adicione "translate": "tl" talvez "translate": "ntl".

Ver registro

Faça login no painel da Cloudflare e acesse a visão geral dos Workers para ver os registros de solicitação, os registros de geração e o uso de recursos.

advertência

cota livreO plano gratuito do Cloudflare Workers de 100.000 solicitações por dia é suficiente para suportar o uso pessoal. Pode haver limites adicionais nas chamadas de modelo para o Workers AI (por exemplo, limite diário para FLUX.1).
Desempenho do modeloO FLUX.1-Schnell-CF funciona melhor, mas pode ser limitado em cargas elevadas. O SD-XL-Bash-CF é adequado para uso diário.
segurançaRecomenda-se definir a chave de API para evitar acesso não autorizado.
Restrições de palavras-chavePara evitar conteúdo sensível ou inadequado, os modelos são filtrados automaticamente.

cenário do aplicativo

criação de conteúdo
Os blogueiros precisam ilustrar suas postagens, inserir "一片热带雨林，阳光穿透树叶"A versão mais recente do produto é aquela que gera imagens de alta qualidade em segundos, economizando dinheiro em custos de design.
desenvolvimento de aplicativos
O desenvolvedor gera um mapa de exibição de produtos para a plataforma de comércio eletrônico, que é chamado dinamicamente por meio da API, e insere descrições como "现代风格的沙发，白色背景"para aprimorar a experiência do usuário.
Descoberta da arte
O aluno ou artista faz upload de um esboço, usa o diagrama para gerar um diagrama e insere o "赛博朋克风格"A empresa está sempre pronta para gerar um trabalho exclusivo para estudo ou apresentação.
Educação e treinamento
Os professores geram materiais de instrução, como insumos "古代中国的城市街道"usado em cursos de história para visualizar cenas.

QA

Quanto tempo leva para gerar uma imagem?
De 2 a 15 segundos, dependendo do modelo, do número de etapas e da rede. O flux.1-schnell-cf é o mais rápido, o sd-xl-bash-cf é um pouco mais lento.
Quais tipos de imagem são compatíveis?
Oferece suporte a paisagens, pessoas, objetos, estilos de arte, etc. Cenas complexas precisam ser otimizadas para palavras-chave e o conteúdo sensível será filtrado.
Tenho que pagar pela implantação?
Não é necessário. O projeto é de código aberto e o plano gratuito da Cloudflare é suficiente. Os modelos SF-Kolors exigem um aplicativo SF_TOKEN gratuito.
Como faço para trocar de modelo?
Especifique o nome do modelo na solicitação de API ou modifique o modelo padrão no arquivo de configuração. Recomenda-se testar o FLUX.1-Schnell-CF.
Como funciona o recurso Tupelo?
Faça upload de uma imagem de referência, insira uma descrição (por exemplo "卡通风格"), gerando novas imagens por meio da API ou de uma página.