Stable Diffusion est une intelligence artificielle de type texte-image. Elle génère des images à partir d'une description simple en langage naturel.
Développé par StabilityAI , il est open-source. Contrairement à des modèles comme DALL-E ou Midjourney, il peut fonctionner sur des GPU domestiques. La communauté SD est très active. De nombreux modèles et modules complémentaires affinés sont disponibles. Vous pouvez même entraîner un modèle avec vos propres données !
Stable Diffusion utilise une partie de l'ensemble de données LAION Aesthetics. Il est formé pour créer des images qui correspondent à des invites de texte. Ce modèle peut créer des œuvres d'art numériques uniques. Il peut également faire d'autres choses comme des animations et la manipulation d'images.
Vous pouvez trouver des exemple dans notre collection de prompts, gallerie d'images et avec le navigateur d'images .Qu'est-ce qu'un Prompt ?
Un prompt est une phrase, généralement de 350 caractères ou moins (75 jetons), qui décrit l'image que vous souhaitez générer.
Le prompt négatif est un moyen simple de spécifier ce qui ne doit pas apparaître dans l'image générée.
What is a negative prompt ?
A negative prompt is a list of words or concepts you want Stable Diffusion to avoid in the generated image. While the regular prompt describes what you want, the negative prompt acts as a filter — steering the model away from unwanted elements such as artifacts, deformations, or specific styles. Common entries include terms like blurry, bad anatomy, extra fingers, watermark, low quality, ugly.
Negative prompts work through classifier-free guidance: the model simultaneously moves toward your prompt and away from the negative prompt, with the CFG scale controlling how strongly both signals are applied. Note that Flux models largely make negative prompts obsolete — their improved architecture handles quality and anatomy natively, so prompt adherence alone is usually sufficient.
How does mentioning an artist influence the result ?
Adding an artist's name to your prompt biases the model toward their visual signature — brushwork, color palette, composition, lighting style, and level of detail. This works because Stable Diffusion was trained on large labeled datasets that include artworks attributed to specific artists. For example, adding Greg Rutkowski tends to produce highly detailed fantasy illustrations, while Monet shifts the output toward soft impressionist textures.
Not all artists carry the same weight in the model — some are strongly represented in the training data, others barely influence the output. The effect also varies between model versions: an artist well-recognized by SD 1.5 may be less prominent in SDXL or Flux. Explore hundreds of artist style comparisons on our dedicated artist reference page to find the styles that best match your creative vision.
Que signifie 'seed' ?
La 'seed' (graine) est un nombre qui démarre le processus de création. Vous n’êtes pas obligé de créer ce nombre vous-même, il est créé aléatoirement si vous n’en choisissez pas un (généralement en choisissant -1).
Mais si vous contrôlez la graine, vous pouvez recréer les mêmes images, essayer différents paramètres ou modifier l'invite.
Qu'est-ce qu'une LoRA ?
LoRA signifie 'Low Rank Adaptation'. Il s'agit d'un ensemble de petites extensions qui modifient les modèles de base.
Vous pouvez l'utiliser pour ajuster Stable Diffusion pour un certain style ou sujet. Vous pouvez mélanger plusieurs LoRA dans une invite avec des poids différents. Cela ouvre des possibilités infinies de création.
Puis-je installer Stable Diffusion localement ?
Oui ! un GPU avec au moins 6 Go de mémoire (NVRAM) est requis.
Vous pouvez utiliser des modèles personnalisés formés par la communauté, affiner les résultats avec LoRA et bien plus encore.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.What is ComfyUI ?
ComfyUI is a node-based graphical interface for Stable Diffusion. Rather than a traditional form, it lets you build image generation pipelines visually by connecting nodes — each node handles one specific step: loading a model, encoding a prompt, sampling, or decoding the image. This makes the entire process transparent and fully customizable.
Compared to Automatic1111, ComfyUI offers more granular control over the generation pipeline and is generally faster, at the cost of a steeper learning curve. It supports all major models: SD 1.5, SDXL, Stable Diffusion 3, and Flux. The ecosystem is extended via ComfyUI Manager, which lets you install hundreds of community custom nodes directly from the interface. Download it from the official ComfyUI GitHub repository.
What is Flux ?
Flux is a state-of-the-art text-to-image model released in 2024 by Black Forest Labs, founded by former Stability AI researchers. It significantly outperforms SDXL in prompt adherence, photorealism, and — notably — the ability to render legible text inside generated images, a long-standing weakness of previous diffusion models.
Flux comes in three variants: FLUX.1-schnell (fastest, Apache 2.0 license), FLUX.1-dev (higher quality, open weights for non-commercial use), and FLUX.1-pro (best quality, API only). The open variants are available on Hugging Face and run locally via ComfyUI or Automatic1111 with the appropriate extension.
Quelle est la dernière version de Stable Diffusion ?
Le 23 octobre 2024, Stability AI a publié Stable Diffusion 3.5 . Il s'agit de leur modèle de conversion de texte en image le plus performant, avec une grande amélioration des capacités d'orthographe, des performances et de la qualité.