
A Stable Diffusion egy szövegből képet készítő mesterséges intelligencia. Egyszerű leírásból generál képeket természetes nyelven.
Fejlesztette: StabilityAI , nyílt forráskódú. A DALL-E vagy Midjourney modellekkel ellentétben normál GPU-kon is futtatható. Az SD közösség nagyon aktív. Számos finomhangolt modell és kiegészítő érhető el. Még saját adatokkal is betaníthat egy modellt!
A Stable Diffusion a LAION Aesthetics adatkészlet egy részét használja. Arra van betanítva, hogy a szöveges utasításoknak megfelelő képeket készítsen. Ez a modell egyedi digitális művészetet tud létrehozni. Más feladatokat is el tud végezni, például animációkat és képszerkesztést.
Példákat láthat a utasítás galériánkban, Művészeti Galéria és képböngészőnkben..Mi az az utasítás?
Az utasítás egy mondat, általában 350 karakter vagy kevesebb (75 token), amely leírja a létrehozni kívánt képet.
A negatív utasítás egyszerű módja annak, hogy meghatározza, mi ne jelenjen meg a generált képen.
Mit jelent a seed?
A seed egy szám, amely elindítja a létrehozási folyamatot. Nem kell magának létrehoznia ezt a számot, véletlenszerűen generálódik, ha nem választ egyet (általában -1 választásával).
De ha irányítja a seed-et, újra létrehozhatja ugyanazokat a képeket, kipróbálhat különböző beállításokat, vagy megváltoztathatja az utasítást.
Mi az a LoRA?
A LoRA jelentése Low Rank Adaptation. Ez egy kis kiterjesztéskészlet, amely a bázismodell finomhangolására szolgál.
Használhatja a Stable Diffusion egy bizonyos stílushoz vagy témához való igazítására. Több LoRA-t is keverhet egy utasításban különböző súlyokkal. Ez végtelen lehetőségeket nyit meg az alkotásra.
Telepíthetem a Stable Diffusion-t helyileg?
Igen! Legalább 6 GB memóriával (NVRAM) rendelkező GPU szükséges.
Használhatja a közösség által betanított testreszabott modelleket, finomhangolhatja az eredményeket LoRA-val és még sok mással.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.Mi a Stable Diffusion legújabb verziója?
2024. október 23-án a Stability AI kiadta a Stable Diffusion 3.5 verziót. Ez a legfejlettebb szövegből képet készítő modelljük, amely nagy javulást hozott a helyesírási képességekben, a teljesítményben és a minőségben.