Scripts de generación de imágenes de IA basados en Cloudflare Worker

Últimos recursos sobre IAPublicado hace 11 meses Círculo de intercambio de inteligencia artificial

76.2K 00

Introducción general

CloudFlare-AI-Image es un proyecto de código abierto alojado en GitHub que proporciona servicios gratuitos de generación de imágenes de IA a través de la plataforma Cloudflare Workers. Admite funciones generadas por texto y por gráficos basadas en cinco modelos, entre ellos Flux.1 [schnell], Stable Diffusion XL, etc. SD-XL-Base-CF se utiliza por defecto. los usuarios pueden generar imágenes de alta calidad introduciendo descripciones de texto o cargando imágenes de referencia. La interfaz del proyecto es compatible con el formato OpenAI, lo que facilita la integración y simplifica la implementación para desarrolladores, diseñadores y entusiastas creativos. Con la red global de Cloudflare, la velocidad de generación es rápida y estable, y el código es abierto y puede modificarse libremente.

Lista de funciones

Soporte de texto para generar imágenes, descripción de texto de entrada para generar imágenes de alta calidad.
Admite imágenes generadas por gráficos para generar nuevas imágenes basadas en imágenes de referencia cargadas.
Se ofrecen cinco modelos opcionales: DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
API REST compatible con el formato OpenAI para facilitar la integración en aplicaciones de terceros.
Parámetros de generación personalizables, como estilo de imagen, número de pasos y resolución.
Implementado en Cloudflare Workers, no se necesitan servidores gestionados.
Admite el almacenamiento KV para almacenar en caché las imágenes generadas.
Código fuente abierto, modificable por el usuario y extensible.

Utilizar la ayuda

Proceso de instalación

Para utilizar CloudFlare-AI-Image, debe completar los siguientes pasos de implementación. El proceso es sencillo, pero requiere una cuidadosa configuración de su entorno.

Regístrese para obtener una cuenta de Cloudflare
Visite el sitio web oficial de Cloudflare para registrarse o abrir una cuenta. El plan gratuito es suficiente para este proyecto. Asegúrate de que la cuenta tiene permisos de espacio de nombres Workers AI y KV.
Clonación del código del proyecto
Ejecute el siguiente comando en el terminal para clonar el proyecto localmente:
```
git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
```
Vaya al catálogo de proyectos:
```
cd CloudFlare-AI-Image
```
Instalación del Wrangler
Wrangler es una herramienta para desplegar Cloudflare Workers. Comando de instalación:
```
npm install -g @cloudflare/wrangler
```
Inicia sesión en Wrangler:
```
wrangler login
```
Siga las instrucciones para autorizar en su navegador.
Configuración de variables de entorno
El proyecto debe vincular los espacios de nombres Workers AI y KV y configurar la información de la cuenta.
- Inicie sesión en el panel de control de Cloudflare y busque el ID de cuenta.
- Cree tokens API con permisos para incluir la IA de Workers, la edición de scripts de Workers y el almacenamiento de KV.
- compilador wrangler.toml con el ID de cuenta y el espacio de nombres KV:
```
account_id = "你的账户ID"
name = "cloudflare-ai-image"
compatibility_date = "2023-09-01"
[[kv_namespaces]]
binding = "IMAGE_KV"
id = "你的KV命名空间ID"
```
- Crear un espacio de nombres KV:
```
wrangler kv:namespace create IMAGE_KV
```
  Copie el ID devuelto y rellene el campo wrangler.toml.
- Establezca el token de la API:
```
wrangler secret put CLOUDFLARE_API_TOKEN
```
  Introduzca su token de API.
- (Opcional) Establezca SF_TOKEN si utiliza un modelo de etapa de flujo basado en silicio:
```
wrangler secret put SF_TOKEN
```
  Introduzca el token de API solicitado a la Plataforma de Movilidad Silicon.
Proyectos de implantación
Ejecutar en el directorio del proyecto:
```
wrangler publish
```
Tras un despliegue correcto, obtenga la URL de los trabajadores, por ejemplo https://cloudflare-ai-image.your-account.workers.dev.
prueba local
Si se requiere depuración local, ejecute:
```
wrangler dev
```
Esto iniciará el servidor local y accederá al http://localhost:8787 Función de prueba.

Utilización

Una vez desplegada, puede utilizar la Generación de imágenes a través de la API, el cliente o la URL de trabajadores. Aquí tienes instrucciones detalladas sobre cómo hacerlo.

Seleccionar modelo

El proyecto admite cinco modelos, se recomienda FLUX.1-Schnell-CF para obtener los mejores resultados, pero hay un límite de uso diario. A continuación se enumeran otros modelos:

DS-8-CF: Basado en Dreamshaper-8-LCM, es adecuado para generar rápidamente imágenes de estilo artístico.
SD-XL-Bash-CFModelo por defecto, basado en Stable Diffusion XL, que equilibra velocidad y calidad.
SD-XL-Rayo-CFOptimizado para la velocidad y adecuado para escenarios sencillos.
FLUX.1-Schnell-CFModelo de alta calidad, rico en detalles, recomendado para escenas complejas.
SF-Kolors: Basado en Kwai-Kolors, adecuado para imágenes de estilo asiático, SF_TOKEN necesita ser configurado.

Al seleccionar un modelo, especifique el nombre del modelo en la solicitud API o en el archivo de configuración, por ejemplo "model": "@cf/black-forest-labs/flux-1-schnell".

Diagrama de Vincennes

Los diagramas de Venn generan imágenes a partir de descripciones textuales.

mediante API::
Llame al punto final de la API mediante una solicitud POST:

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "一片星空下的雪山，月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'

Devuelve JSON que contiene la URL de la imagen o datos Base64.

a través del cliente::
La interfaz del proyecto es compatible con el formato OpenAI y puede utilizarse con clientes compatibles con OpenAI como ChatGPT (Cliente). Configure la dirección API del cliente para que sea la URL de sus Trabajadores e introduzca la solicitud para generar la imagen.
a través de Workers URL::
entrevistas https://your-project.workers.devintroduzca la palabra clave, haga clic en Generar y el navegador mostrará la imagen.

Optimizar las palabras clave::
Unas palabras clave claras mejoran la calidad de la imagen. Por ejemplo:

Difuso:"一朵花"
Optimización:"一朵盛开的红玫瑰，背景是绿色草地，阳光明媚"
Las señales en inglés pueden funcionar mejor, como "A red rose in bloom on a green meadow under bright sunlight".

Tucson (ciudad)

Las tuplas generan nuevas imágenes basadas en imágenes de referencia.

mediante API::
Sube una imagen y proporciona una palabra clave:

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'

a través de Workers URL::
Visite la página, cargue una imagen de referencia, introduzca una descripción (p. ej. "卡通风格") para generar una nueva imagen.

Parámetros personalizados

Es posible ajustar los siguientes parámetros:

Pasos: Por defecto 8, rango 1-50, pasos más altos dan más detalle pero aumentan el consumo de tiempo.
resolución (de una foto): Por defecto 512x512, ajustable a 1024x1024 (según modelo soportado).
peinadoControlado por palabras clave como "油画风格"y"赛博朋克".
Añade parámetros a la solicitud API:

{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}

Opciones de traducción forzada

--ntlDesactivar la traducción y conservar las palabras originales para los usuarios multilingües.
--tl: Forzar la traducción de palabras de aviso al inglés para mejorar la calidad de la generación.
En la solicitud de API, añada "translate": "tl" tal vez "translate": "ntl".

Ver registro

Inicie sesión en el panel de control de Cloudflare y vaya a la vista general de trabajadores para ver los registros de solicitudes, los registros de generación y el uso de recursos.El espacio de nombres KV almacena imágenes en caché para reducir la generación duplicada.

advertencia

cuota libre: El plan gratuito de Cloudflare Workers de 100.000 solicitudes al día es suficiente para el uso personal. puede haber límites adicionales en las llamadas de modelos para Workers AI (por ejemplo, límites diarios para FLUX.1).
Rendimiento del modeloFLUX.1-Schnell-CF funciona mejor pero puede verse limitado con cargas elevadas.SD-XL-Bash-CF es adecuado para el uso diario.
seguridadSe recomienda configurar la clave API para evitar accesos no autorizados.
Restricciones de palabras clave: Para evitar contenidos sensibles o inapropiados, los modelos se filtran automáticamente.

escenario de aplicación

creación de contenidos
Los blogueros necesitan ilustrar sus entradas, introducir "一片热带雨林，阳光穿透树叶"La versión más reciente del programa genera imágenes de alta calidad en cuestión de segundos, lo que le permite ahorrar dinero en costes de diseño.
desarrollo de aplicaciones
El desarrollador genera un mapa de visualización de productos para la plataforma de comercio electrónico, que se llama dinámicamente a través de la API, e introduce descripciones como "现代风格的沙发，白色背景"para mejorar la experiencia del usuario.
Descubrimiento del arte
El estudiante o artista carga un boceto, utiliza la función de generación de diagramas e introduce el "赛博朋克风格", generando un trabajo único para su estudio o presentación.
Educación y formación
Los profesores generan materiales didácticos como "古代中国的城市街道"Utilizado en los cursos de historia para visualizar escenas.

CONTROL DE CALIDAD

¿Cuánto se tarda en generar una imagen?
2-15 segundos, según el modelo, el número de pasos y la red. flux.1-schnell-cf es el más rápido, sd-xl-bash-cf es un poco más lento.
¿Qué tipos de imágenes son compatibles?
Admite paisajes, personas, objetos, estilos artísticos, etc. Las escenas complejas deben optimizarse para las palabras clave y el contenido sensible se filtrará.
¿Tengo que pagar por la implantación?
No es necesario. El proyecto es de código abierto y el plan gratuito de Cloudflare es suficiente.Los modelos SF-Kolors requieren una aplicación SF_TOKEN gratuita.
¿Cómo cambio de modelo?
Especifique el nombre del modelo en la solicitud de la API o modifique el modelo predeterminado en el archivo de configuración. Se recomienda probar FLUX.1-Schnell-CF.
¿Cómo funciona la función Tupelo?
Cargue una imagen de referencia e introduzca una descripción (p. ej. "卡通风格"), generando nuevas imágenes a través de la API o de una página.