Scripts de génération d'images d'IA basés sur le travail de Cloudflare

Dernières ressources sur l'IAPosté il y a 5 mois Cercle de partage de l'IA

15.8K 00

Introduction générale

CloudFlare-AI-Image est un projet open source hébergé sur GitHub qui fournit des services gratuits de génération d'images d'IA via la plateforme Cloudflare Workers. Il prend en charge les fonctions générées par du texte et des graphes sur la base de cinq modèles, notamment Flux.1 [schnell], Stable Diffusion XL, etc. SD-XL-Base-CF est utilisé par défaut. Les utilisateurs peuvent générer des images de haute qualité en saisissant des descriptions textuelles ou en téléchargeant des images de référence. L'interface du projet est compatible avec le format OpenAI, ce qui le rend facile à intégrer et à déployer pour les développeurs, les concepteurs et les passionnés de création. Grâce au réseau mondial de Cloudflare, la vitesse de génération est rapide et stable, et le code est open source et peut être librement modifié.

Liste des fonctions

Prise en charge de la génération d'images à partir de texte, saisie d'une description textuelle pour générer des images de haute qualité.
Prise en charge des images générées par le graphe pour générer de nouvelles images sur la base des images de référence téléchargées.
Cinq modèles sont proposés en option : DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
API REST compatible avec le format OpenAI pour une intégration facile dans des applications tierces.
Paramètres de génération personnalisables tels que le style d'image, le nombre d'étapes et la résolution.
Déployé sur Cloudflare Workers, aucun serveur géré n'est nécessaire.
Prise en charge du stockage KV pour la mise en cache des images générées.
Code source ouvert, modifiable et extensible par l'utilisateur.

Utiliser l'aide

Processus d'installation

Pour utiliser CloudFlare-AI-Image, vous devez suivre les étapes de déploiement suivantes. Le processus est simple, mais nécessite une configuration minutieuse de votre environnement.

Ouvrir un compte Cloudflare
Visitez le site officiel de Cloudflare pour vous inscrire ou ouvrir un compte. Le plan gratuit est suffisant pour soutenir ce projet. Assurez-vous que le compte dispose des autorisations pour les espaces de noms Workers AI et KV.
Clonage du code du projet
Exécutez la commande suivante dans le terminal pour cloner le projet localement :
```
git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
```
Accédez au catalogue de projets :
```
cd CloudFlare-AI-Image
```
Installation de la Wrangler
Wrangler est un outil permettant de déployer les travailleurs Cloudflare. Commande d'installation :
```
npm install -g @cloudflare/wrangler
```
Se connecter à Wrangler :
```
wrangler login
```
Suivez les instructions d'autorisation dans votre navigateur.
Configuration des variables d'environnement
Le projet doit lier les espaces de noms Workers AI et KV et configurer les informations de compte.
- Connectez-vous au tableau de bord de Cloudflare et trouvez l'ID du compte.
- Créer des jetons API avec des autorisations pour inclure l'IA des travailleurs, l'édition des scripts des travailleurs et le stockage des KV.
- compilateur wrangler.toml avec l'identifiant du compte et l'espace de noms KV :
```
account_id = "你的账户ID"
name = "cloudflare-ai-image"
compatibility_date = "2023-09-01"
[[kv_namespaces]]
binding = "IMAGE_KV"
id = "你的KV命名空间ID"
```
- Créer un espace de noms KV :
```
wrangler kv:namespace create IMAGE_KV
```
  Copiez l'identifiant renvoyé et remplissez le champ wrangler.toml.
- Définir le jeton de l'API :
```
wrangler secret put CLOUDFLARE_API_TOKEN
```
  Saisissez votre code API.
- (Facultatif) Définir SF_TOKEN si l'on utilise un modèle d'étage de flux basé sur le silicium :
```
wrangler secret put SF_TOKEN
```
  Saisissez le code API demandé à la plate-forme Silicon Mobility.
Projets de déploiement
Exécuter dans le répertoire du projet :
```
wrangler publish
```
Après un déploiement réussi, obtenez l'URL des travailleurs, par exemple https://cloudflare-ai-image.your-account.workers.dev.
test local
Si le débogage local est nécessaire, exécutez :
```
wrangler dev
```
Cette opération permet de démarrer le serveur local et d'accéder à la base de données http://localhost:8787 Fonction de test.

Utilisation

Une fois déployée, vous pouvez utiliser la génération d'images via l'API, le client ou l'URL des travailleurs. Voici des instructions détaillées sur la manière de procéder.

Sélectionner le modèle

Le projet prend en charge cinq modèles, FLUX.1-Schnell-CF est recommandé pour de meilleurs résultats, mais il y a une limite d'utilisation quotidienne. Les autres modèles sont listés ci-dessous :

DS-8-CF: Basé sur Dreamshaper-8-LCM, il est adapté à la génération rapide d'images de style artistique.
SD-XL-Bash-CFModèle par défaut, basé sur la diffusion stable XL, équilibrant la vitesse et la qualité.
SD-XL-Lightning-CFOptimiser la vitesse pour des scénarios simples.
FLUX.1-Schnell-CFModèle de haute qualité, riche en détails, recommandé pour les scènes complexes.
SF-KolorsSF_TOKEN : Basé sur Kwai-Kolors, adapté aux images de style asiatique, SF_TOKEN doit être configuré.

Lors de la sélection d'un modèle, spécifiez le nom du modèle dans la requête API ou le fichier de configuration, par exemple "model": "@cf/black-forest-labs/flux-1-schnell".

Schéma de Vincennes

Les diagrammes de Venn génèrent des images à partir de descriptions textuelles.

via l'API: :
Appeler le point de terminaison de l'API à l'aide d'une requête POST :

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "一片星空下的雪山，月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'

Renvoie JSON contenant l'URL de l'image ou les données Base64.

via le client: :
L'interface du projet est compatible avec le format OpenAI et peut être utilisée avec des clients compatibles OpenAI tels que ChatGPT (Client). Configurez l'adresse API du client pour qu'elle corresponde à l'URL de vos travailleurs et entrez l'invite pour générer l'image.
via l'URL des travailleurs: :
entretiens https://your-project.workers.dev, saisissez le mot-guide, cliquez sur Générer, et le navigateur affiche l'image.

Optimiser les mots-clés: :
Des mots clés clairs améliorent la qualité de l'image. Exemple :

Floue :"一朵花"
Optimisation :"一朵盛开的红玫瑰，背景是绿色草地，阳光明媚"
Des indices en anglais peuvent s'avérer plus efficaces, tels que "A red rose in bloom on a green meadow under bright sunlight".

Tucson (ville)

Les tuples génèrent de nouvelles images basées sur des images de référence.

via l'API: :
Téléchargez une image et indiquez un mot clé :

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'

via l'URL des travailleurs: :
Visitez la page, téléchargez une image de référence, entrez une description (par ex. "卡通风格") pour générer une nouvelle image.

Paramètres personnalisés

Les paramètres suivants peuvent être réglés :

Étapes: Défaut 8, plage de 1 à 50, des pas plus élevés donnent plus de détails mais augmentent la consommation de temps.
résolution (d'une photo)La taille de l'image : 512x512 par défaut, réglable jusqu'à 1024x1024 (en fonction du modèle supporté).
coiffureLes mots-clés : Contrôlés par des mots-clés tels que "油画风格","赛博朋克".
Ajouter des paramètres à la demande d'API :

{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}

Options de traduction forcée

--ntlPour les utilisateurs multilingues, il est possible de désactiver la traduction et de conserver le texte original de l'invite.
--tlLes mots-clés : Forcer la traduction des mots-clés en anglais pour améliorer la qualité de la génération.
Dans la demande d'API, ajoutez "translate": "tl" peut-être "translate": "ntl".

Voir le journal

Connectez-vous au tableau de bord Cloudflare et accédez à la vue d'ensemble des travailleurs pour consulter les journaux des demandes, les journaux de génération et l'utilisation des ressources.L'espace de noms KV met en cache les images afin de réduire la génération de doublons.

mise en garde

quota libreIl peut y avoir des limites supplémentaires sur les appels de modèle pour Workers AI (par exemple, limite quotidienne pour FLUX.1).
Performances du modèleLes résultats de l'étude sont les suivants : FLUX.1-Schnell-CF fonctionne le mieux mais peut être limité à des charges élevées ; SD-XL-Bash-CF est adapté à une utilisation quotidienne.
la sécuritéIl est recommandé de définir la clé de l'API afin d'éviter tout accès non autorisé.
Restrictions concernant les mots clésLes modèles sont automatiquement filtrés afin d'éviter tout contenu sensible ou inapproprié.

scénario d'application

création de contenu
Les blogueurs doivent illustrer leurs articles, saisir "一片热带雨林，阳光穿透树叶"La version la plus récente du produit est celle qui génère des images de haute qualité en quelques secondes, ce qui vous permet d'économiser sur les coûts de conception.
développement d'applications
Le développeur génère un plan d'affichage des produits pour la plateforme de commerce électronique, qui est appelé dynamiquement par l'intermédiaire de l'API, et entre des descriptions telles que "现代风格的沙发，白色背景"Les données de la base de données de la Commission européenne sont également utilisées pour améliorer l'expérience de l'utilisateur.
Découverte de l'art
L'étudiant ou l'artiste télécharge une esquisse, utilise la fonction de génération de diagramme et saisit le nom de l'artiste. "赛博朋克风格"La création d'un travail unique à des fins d'étude ou de présentation.
Éducation et formation
Les enseignants produisent du matériel pédagogique tel que des intrants "古代中国的城市街道"Les images sont utilisées dans les cours d'histoire pour visualiser des scènes.

QA

Combien de temps faut-il pour générer une image ?
2-15 secondes, selon le modèle, le nombre d'étapes et le réseau. flux.1-schnell-cf est le plus rapide, sd-xl-bash-cf est un peu plus lent.
Quels sont les types d'images pris en charge ?
Prend en charge les paysages, les personnes, les objets, les styles artistiques, etc. Les scènes complexes doivent être optimisées pour les mots clés et les contenus sensibles seront filtrés.
Dois-je payer pour le déploiement ?
Pas nécessaire. Le projet est open source et le plan gratuit de Cloudflare est suffisant. Les modèles SF-Kolors nécessitent une application SF_TOKEN gratuite.
Comment changer de modèle ?
Spécifiez le nom du modèle dans la requête API ou modifiez le modèle par défaut dans le fichier de configuration. Il est recommandé de tester FLUX.1-Schnell-CF.
Comment fonctionne la fonction Tupelo ?
Téléchargez une image de référence, entrez une description (par ex. "卡通风格"), en générant de nouvelles images par l'intermédiaire de l'API ou d'une page.