STABLE DIFFUSION et écriture de prompts

STABLE DIFFUSION est un outil gratuit Open Source que l’on peut installer en local sur son ordinateur offrant la possibilité de générer des images de toutes thématiques via l’utilisation de prompts ou invites en français contenant des mots clés généralistes et spécifiques. La communauté est très active et de nombreuses extensions ont vu le jour pour accroître de manière significative la qualité des rendus obtenus. De nombreuses IA génératrices d’images utilisent donc le script TEXT-TO-IMAGE d’où l’importance cruciales des descriptions textuelles que l’on va écrire pour générer l’image souhaitée. Ces descriptions seront souvent écrites en anglais, la plupart des bases de données contenant les milliards de paires textes-images utilisées comme références par l’IA étant écrites dans cette langue. Une des possibilités offertes par Stable Diffusion est de générer sa propre bibliothèque d’images contenants des photographies d’une personne en particulier (voir illustration en-tête de ce présent article avec mon portrait)et ainsi d’obtenir des rendus multiples avec le visage de la même personne. Pour mener à bien cette opération on peut utiliser l’outil COLAB mis à disposition par GOOGLE, on sélectionne au minium de trentaire de photographies de la personne, en faisant surtout bien attention de varier l’environnement sur les photos, elles doivent toutes être différentes, éclairage, angles de vue, en mode portrait, de près, de loin, avec le sourire, en criant, bouche fermée, de vraies séances photo, pas deux fois les mêmes objets environnant ni les mêmes habits. L’IA a besoin de diversité dans son modèle d’apprentissage. Petit bémol qui a son importance, l’apprentissage par l’IA requiert beaucoup de puissance de calcul, l’opération peut être réalisée en local sur un ordinateur mais votre GPU doit être pourvu au minimum de 12Go de VRAM type GDDR. Bien évidemment, des alternatives en lignes sont disponibles et pour quelques euros cette opération peut être réalisée via l’utilisation de runpod.io notamment. L’écriture des prompts est vraiment un point essentiel à étudier pour obtenir de bons résultats, la syntaxe et l’ordre des mots sont importants, on peut affecter un degré d’importante à chaque élément utilisé. L’installation en local de Stable Diffusion est relativement simple, sachez toutefois qu’il existe des interfaces web en ligne spécifiquement dédiés à la génération d’images moyennant bien évidemment un abonnement. Générez des images nécéssite l’utilisation de fichiers référence types CHECKPOINT ainsi que des fichiers LORA et autres VAE par exemple pour définir un environnement de rendu particulier (en mode réaliste, en mode cartoon, en mode rendu 3D, etc …). Vous trouverez ci-dessous l’ensemble des liens utiles pour l’installation de Stable Diffusion en local et ainsi se lancer dans l’écriture de prompts. Bonne écriture et réfléchissez à l’orientation que l’on peut donner à l’utilisation des Intelligences Artificielles, bonne ou mauvaise ? …

DOCUMENTATION DIVERSE

Pour une liste des principaux paramètres à utiliser dans les prompts: STABLE DIFFUSION PROMPT BOOK.
Un PDF d’utilisation de: STABLE DIFFUSION en français.
Pour l’écriture de prompts: PROMPT BUILDER.
Pour télécharger des CHECKPOINTS, LORA, VAE…: CIVITAIM.
Pour des galeries de rendu et obtenir des exemples de prompts: LEXICA.
Pour utiliser des styles à incorporer dans vos prompts: CHEATSHEET.
Pour en savoir plus sur STABLE DIFFUSION en français: STABLE DIFFUSION FRANCE.
Pour utiliser une configuration STABLE DIFFUSION EN LIGNE avec un puissant GPU: RUNPOD.IO.
Pour utiliser une version IA EN LIGNE: DREAMLIKE.ART.
Pour procéder à une génération de ckpt avec ses propres photos personnelles: ASTRIA.AI.