
Stable Diffusion to sztuczna inteligencja przekształcająca tekst w obraz. Generuje obrazy na podstawie prostego opisu w języku naturalnym.
Opracowane przez StabilityAI , jest open source. W przeciwieństwie do modeli takich jak DALL-E czy Midjourney, może działać na zwykłych GPU. Społeczność SD jest bardzo aktywna. Dostępnych jest wiele dostrojonych modeli i dodatków. Możesz nawet trenować model na własnych danych!
Stable Diffusion wykorzystuje część zestawu danych LAION Aesthetics. Jest szkolony do tworzenia obrazów pasujących do tekstowych poleceń. Ten model może tworzyć unikalną sztukę cyfrową. Może również wykonywać inne zadania, takie jak animacje i manipulacja obrazami.
Możesz zobaczyć przykłady w naszej galerii poleceń, Galeria sztuki i przeglądarka obrazów..Co to jest polecenie?
Polecenie to zdanie, zazwyczaj 350 znaków lub mniej (75 tokenów), które opisuje obraz, który chcesz wygenerować.
Negatywne polecenie to prosty sposób na określenie, co nie powinno pojawić się na wygenerowanym obrazie.
Co oznacza seed?
Seed to liczba, która rozpoczyna proces tworzenia. Nie musisz samodzielnie tworzyć tej liczby, jest ona generowana losowo, jeśli jej nie wybierzesz (zazwyczaj wybierając -1).
Ale jeśli kontrolujesz seed, możesz ponownie tworzyć te same obrazy, wypróbować różne ustawienia lub zmienić polecenie.
Co to jest LoRA?
LoRA oznacza Low Rank Adaptation. To zestaw małych rozszerzeń, które dostosowują modele bazowe.
Możesz go użyć do dostosowania Stable Diffusion do określonego stylu lub tematu. Możesz mieszać wiele LoRA w jednym poleceniu z różnymi wagami. To otwiera nieograniczone możliwości tworzenia.
Czy mogę zainstalować Stable Diffusion lokalnie?
Tak! Wymagana jest GPU z co najmniej 6 GB pamięci (NVRAM).
Możesz używać dostosowanych modeli szkolonych przez społeczność, dostrajać wyniki za pomocą LoRA i wiele więcej.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.Jaka jest najnowsza wersja Stable Diffusion?
23 października 2024 roku Stability AI wydało Stable Diffusion 3.5 . To ich najbardziej zaawansowany model przekształcający tekst w obraz z dużymi ulepszeniami w zakresie umiejętności ortograficznych, wydajności i jakości.