A Stable Diffusion egy szövegből képet készítő mesterséges intelligencia. Egyszerű leírásból generál képeket természetes nyelven.
Fejlesztette: StabilityAI , nyílt forráskódú. A DALL-E vagy Midjourney modellekkel ellentétben normál GPU-kon is futtatható. Az SD közösség nagyon aktív. Számos finomhangolt modell és kiegészítő érhető el. Még saját adatokkal is betaníthat egy modellt!
A Stable Diffusion a LAION Aesthetics adatkészlet egy részét használja. Arra van betanítva, hogy a szöveges utasításoknak megfelelő képeket készítsen. Ez a modell egyedi digitális művészetet tud létrehozni. Más feladatokat is el tud végezni, például animációkat és képszerkesztést.
Példákat láthat a utasítás galériánkban, Művészeti Galéria és képböngészőnkben..Mi az az utasítás?
Az utasítás egy mondat, általában 350 karakter vagy kevesebb (75 token), amely leírja a létrehozni kívánt képet.
A negatív utasítás egyszerű módja annak, hogy meghatározza, mi ne jelenjen meg a generált képen.
What is a negative prompt ?
A negative prompt is a list of words or concepts you want Stable Diffusion to avoid in the generated image. While the regular prompt describes what you want, the negative prompt acts as a filter — steering the model away from unwanted elements such as artifacts, deformations, or specific styles. Common entries include terms like blurry, bad anatomy, extra fingers, watermark, low quality, ugly.
Negative prompts work through classifier-free guidance: the model simultaneously moves toward your prompt and away from the negative prompt, with the CFG scale controlling how strongly both signals are applied. Note that Flux models largely make negative prompts obsolete — their improved architecture handles quality and anatomy natively, so prompt adherence alone is usually sufficient.
How does mentioning an artist influence the result ?
Adding an artist's name to your prompt biases the model toward their visual signature — brushwork, color palette, composition, lighting style, and level of detail. This works because Stable Diffusion was trained on large labeled datasets that include artworks attributed to specific artists. For example, adding Greg Rutkowski tends to produce highly detailed fantasy illustrations, while Monet shifts the output toward soft impressionist textures.
Not all artists carry the same weight in the model — some are strongly represented in the training data, others barely influence the output. The effect also varies between model versions: an artist well-recognized by SD 1.5 may be less prominent in SDXL or Flux. Explore hundreds of artist style comparisons on our dedicated artist reference page to find the styles that best match your creative vision.
Mit jelent a seed?
A seed egy szám, amely elindítja a létrehozási folyamatot. Nem kell magának létrehoznia ezt a számot, véletlenszerűen generálódik, ha nem választ egyet (általában -1 választásával).
De ha irányítja a seed-et, újra létrehozhatja ugyanazokat a képeket, kipróbálhat különböző beállításokat, vagy megváltoztathatja az utasítást.
Mi az a LoRA?
A LoRA jelentése Low Rank Adaptation. Ez egy kis kiterjesztéskészlet, amely a bázismodell finomhangolására szolgál.
Használhatja a Stable Diffusion egy bizonyos stílushoz vagy témához való igazítására. Több LoRA-t is keverhet egy utasításban különböző súlyokkal. Ez végtelen lehetőségeket nyit meg az alkotásra.
Telepíthetem a Stable Diffusion-t helyileg?
Igen! Legalább 6 GB memóriával (NVRAM) rendelkező GPU szükséges.
Használhatja a közösség által betanított testreszabott modelleket, finomhangolhatja az eredményeket LoRA-val és még sok mással.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.What is ComfyUI ?
ComfyUI is a node-based graphical interface for Stable Diffusion. Rather than a traditional form, it lets you build image generation pipelines visually by connecting nodes — each node handles one specific step: loading a model, encoding a prompt, sampling, or decoding the image. This makes the entire process transparent and fully customizable.
Compared to Automatic1111, ComfyUI offers more granular control over the generation pipeline and is generally faster, at the cost of a steeper learning curve. It supports all major models: SD 1.5, SDXL, Stable Diffusion 3, and Flux. The ecosystem is extended via ComfyUI Manager, which lets you install hundreds of community custom nodes directly from the interface. Download it from the official ComfyUI GitHub repository.
What is Flux ?
Flux is a state-of-the-art text-to-image model released in 2024 by Black Forest Labs, founded by former Stability AI researchers. It significantly outperforms SDXL in prompt adherence, photorealism, and — notably — the ability to render legible text inside generated images, a long-standing weakness of previous diffusion models.
Flux comes in three variants: FLUX.1-schnell (fastest, Apache 2.0 license), FLUX.1-dev (higher quality, open weights for non-commercial use), and FLUX.1-pro (best quality, API only). The open variants are available on Hugging Face and run locally via ComfyUI or Automatic1111 with the appropriate extension.
Mi a Stable Diffusion legújabb verziója?
2024. október 23-án a Stability AI kiadta a Stable Diffusion 3.5 verziót. Ez a legfejlettebb szövegből képet készítő modelljük, amely nagy javulást hozott a helyesírási képességekben, a teljesítményben és a minőségben.