Introdução geral
O CloudFlare-AI-Image é um projeto de código aberto hospedado no GitHub que fornece serviços gratuitos de geração de imagens de IA por meio da plataforma Cloudflare Workers. Ele suporta funções de texto para mapa e mapa para mapa, com base em cinco modelos, incluindo Flux.1 [schnell], Stable Diffusion XL, etc., o uso padrão de SD-XL-Base-CF. Os usuários podem inserir uma descrição de texto ou fazer upload de uma imagem de referência, você pode gerar imagens de alta qualidade. A interface do projeto é compatível com o formato OpenAI e é fácil de integrar e implantar para desenvolvedores, designers e entusiastas criativos. Com a rede global da Cloudflare, a velocidade de geração é rápida e estável, e o código-fonte é aberto e pode ser modificado livremente.
Lista de funções
- Suporte a imagens de texto para gerar, insira a descrição do texto para gerar imagens de alta qualidade.
- Oferece suporte a imagens geradas por gráficos para gerar novas imagens com base em imagens de referência carregadas.
- Cinco modelos opcionais são fornecidos: DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
- API REST compatível com o formato OpenAI para facilitar a integração em aplicativos de terceiros.
- Parâmetros de geração personalizáveis, como estilo de imagem, número de etapas e resolução.
- Implantado no Cloudflare Workers, não são necessários servidores gerenciados.
- Oferece suporte ao armazenamento KV para armazenar em cache as imagens geradas.
- Código-fonte aberto, modificável pelo usuário e extensível.
Usando a Ajuda
Processo de instalação
Para usar o CloudFlare-AI-Image, você precisa concluir as seguintes etapas de implantação. O processo é simples, mas requer uma configuração cuidadosa de seu ambiente.
- Registre-se em uma conta da Cloudflare
Visite o site oficial da Cloudflare para se registrar ou entrar em uma conta. O plano gratuito é suficiente para dar suporte a este projeto. Certifique-se de que a conta tenha permissões de namespace Workers AI e KV. - Clonagem do código do projeto
Execute o seguinte comando no terminal para clonar o projeto localmente:git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
Vá para o catálogo de projetos:
cd CloudFlare-AI-Image
- Instalação do Wrangler
O Wrangler é uma ferramenta para implantar o Cloudflare Workers. Comando de instalação:npm install -g @cloudflare/wrangler
Faça login no Wrangler:
wrangler login
Siga as instruções para autorizar em seu navegador.
- Configuração de variáveis de ambiente
O projeto precisa vincular os namespaces Workers AI e KV e configurar as informações da conta.- Faça login no painel do Cloudflare e localize o ID da conta.
- Crie tokens de API com permissões para incluir IA do Workers, edição de scripts do Workers e armazenamento de KV.
- compilador
wrangler.toml
com o ID da conta e o namespace KV:account_id = "你的账户ID" name = "cloudflare-ai-image" compatibility_date = "2023-09-01" [[kv_namespaces]] binding = "IMAGE_KV" id = "你的KV命名空间ID"
- Criar um espaço de nome KV:
wrangler kv:namespace create IMAGE_KV
Copie a ID retornada e preencha o campo
wrangler.toml
. - Defina o token da API:
wrangler secret put CLOUDFLARE_API_TOKEN
Digite seu token de API.
- (Opcional) Defina SF_TOKEN se estiver usando um modelo de estágio de fluxo baseado em silício:
wrangler secret put SF_TOKEN
Insira o token de API solicitado da Silicon Mobility Platform.
- Projetos de implantação
Execute no diretório do projeto:wrangler publish
Depois de uma implementação bem-sucedida, obtenha o URL dos trabalhadores, por exemplo
https://cloudflare-ai-image.your-account.workers.dev
. - teste local
Se a depuração local for necessária, execute:wrangler dev
Isso iniciará o servidor local e acessará o arquivo
http://localhost:8787
Função de teste.
Uso
Depois de implantado, você pode usar a geração de imagens por meio da API, do cliente ou do URL do Workers. Aqui estão instruções detalhadas sobre como fazer isso.
Selecione o modelo
O projeto suporta cinco modelos, sendo que o FLUX.1-Schnell-CF é recomendado para obter melhores resultados, mas há um limite de uso diário. Outros modelos estão listados abaixo:
- DS-8-CFBaseado no Dreamshaper-8-LCM, é adequado para gerar rapidamente imagens de estilo artístico.
- SD-XL-Bash-CFModelo padrão, baseado no Stable Diffusion XL, equilibrando velocidade e qualidade.
- SD-XL-Lightning-CFOtimizado para velocidade e adequado para cenários simples.
- FLUX.1-Schnell-CFModelo de alta qualidade, rico em detalhes, recomendado para cenas complexas.
- SF-KolorsBaseado em Kwai-Kolors, adequado para imagens de estilo asiático, SF_TOKEN precisa ser configurado.
Ao selecionar um modelo, especifique o nome do modelo na solicitação de API ou no arquivo de configuração, por exemplo "model": "@cf/black-forest-labs/flux-1-schnell"
.
Diagrama de Vincennes
Os diagramas de Venn geram imagens a partir de descrições textuais.
- via API::
Chame o ponto de extremidade da API usando uma solicitação POST:curl -X POST https://your-project.workers.dev/api/generate \ -H "Content-Type: application/json" \ -d '{"prompt": "一片星空下的雪山,月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'
Retorna JSON contendo o URL da imagem ou dados Base64.
- através do cliente::
A interface do projeto é compatível com o formato OpenAI e pode ser usada com um cliente habilitado para OpenAI (como o cliente ChatGPT). Configure o endereço da API do cliente para ser o URL de seus funcionários e digite o prompt para gerar a imagem. - via URL dos trabalhadores::
entrevistashttps://your-project.workers.dev
digite a palavra de prompt, clique em Generate e o navegador exibirá a imagem.
Otimizar palavras de alerta::
As palavras-chave claras melhoram a qualidade da imagem. Exemplo:
- Difuso:
"一朵花"
- Otimização:
"一朵盛开的红玫瑰,背景是绿色草地,阳光明媚"
As dicas em inglês podem funcionar melhor, como"A red rose in bloom on a green meadow under bright sunlight"
.
Tucson (cidade)
As tuplas geram novas imagens com base em imagens de referência.
- via API::
Faça upload de uma imagem e forneça uma palavra-chave:curl -X POST https://your-project.workers.dev/api/generate \ -H "Content-Type: application/json" \ -d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'
- via URL dos trabalhadores::
Visite a página, faça upload de uma imagem de referência, insira uma descrição (por exemplo"卡通风格"
) para gerar uma nova imagem.
Parâmetros personalizados
Há suporte para o ajuste dos seguintes parâmetros:
- EtapasPadrão 8, intervalo de 1 a 50, etapas mais altas fornecem mais detalhes, mas aumentam o consumo de tempo.
- resolução (de uma foto)Padrão: 512x512, ajustável para 1024x1024 (dependendo do suporte do modelo).
- penteadoControlado por palavras-chave, como
"油画风格"
e"赛博朋克"
.
Adicione parâmetros à solicitação de API:
{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}
Opções de tradução forçada
- --ntlDesativar a tradução e manter as palavras originais do prompt para usuários multilíngues.
- --tlTradução forçada de palavras de prompt para o inglês para melhorar a qualidade da geração.
Na solicitação de API, adicione"translate": "tl"
talvez"translate": "ntl"
.
Ver registro
Faça login no painel da Cloudflare e acesse a visão geral dos Workers para ver os registros de solicitação, os registros de geração e o uso de recursos.
advertência
- cota livreO plano gratuito do Cloudflare Workers de 100.000 solicitações por dia é suficiente para suportar o uso pessoal. Pode haver limites adicionais nas chamadas de modelo para o Workers AI (por exemplo, limite diário para FLUX.1).
- Desempenho do modeloO FLUX.1-Schnell-CF funciona melhor, mas pode ser limitado em cargas elevadas. O SD-XL-Bash-CF é adequado para uso diário.
- segurançaRecomenda-se definir a chave de API para evitar acesso não autorizado.
- Restrições de palavras-chavePara evitar conteúdo sensível ou inadequado, os modelos são filtrados automaticamente.
cenário do aplicativo
- criação de conteúdo
Os blogueiros precisam ilustrar suas postagens, inserir"一片热带雨林,阳光穿透树叶"
A versão mais recente do produto é aquela que gera imagens de alta qualidade em segundos, economizando dinheiro em custos de design. - desenvolvimento de aplicativos
O desenvolvedor gera um mapa de exibição de produtos para a plataforma de comércio eletrônico, que é chamado dinamicamente por meio da API, e insere descrições como"现代风格的沙发,白色背景"
para aprimorar a experiência do usuário. - Descoberta da arte
O aluno ou artista faz upload de um esboço, usa o diagrama para gerar um diagrama e insere o"赛博朋克风格"
A empresa está sempre pronta para gerar um trabalho exclusivo para estudo ou apresentação. - Educação e treinamento
Os professores geram materiais de instrução, como insumos"古代中国的城市街道"
usado em cursos de história para visualizar cenas.
QA
- Quanto tempo leva para gerar uma imagem?
De 2 a 15 segundos, dependendo do modelo, do número de etapas e da rede. O flux.1-schnell-cf é o mais rápido, o sd-xl-bash-cf é um pouco mais lento. - Quais tipos de imagem são compatíveis?
Oferece suporte a paisagens, pessoas, objetos, estilos de arte, etc. Cenas complexas precisam ser otimizadas para palavras-chave e o conteúdo sensível será filtrado. - Tenho que pagar pela implantação?
Não é necessário. O projeto é de código aberto e o plano gratuito da Cloudflare é suficiente. Os modelos SF-Kolors exigem um aplicativo SF_TOKEN gratuito. - Como faço para trocar de modelo?
Especifique o nome do modelo na solicitação de API ou modifique o modelo padrão no arquivo de configuração. Recomenda-se testar o FLUX.1-Schnell-CF. - Como funciona o recurso Tupelo?
Faça upload de uma imagem de referência, insira uma descrição (por exemplo"卡通风格"
), gerando novas imagens por meio da API ou de uma página.