
Stable Diffusion - це штучний інтелект, який перетворює текст на зображення. Він генерує зображення з простої опису природною мовою.
Розроблений StabilityAI , він є відкритим кодом. На відміну від моделей, таких як DALL-E або Midjourney, він може працювати на звичайних GPU. Спільнота SD дуже активна. Доступно багато налаштованих моделей та додатків. Ви навіть можете навчити модель на своїх даних!
Stable Diffusion використовує частину набору даних LAION Aesthetics. Він навчений створювати зображення, які відповідають текстовим підказкам. Ця модель може створювати унікальне цифрове мистецтво. Вона також може виконувати інші завдання, такі як анімація та маніпуляція зображеннями.
Ви можете побачити приклади в нашій галереї підказок, Галерея мистецтва та браузері зображень..Що таке підказка?
Підказка - це речення, зазвичай до 350 символів (75 токенів), яке описує зображення, яке ви хочете створити.
Негативна підказка - це простий спосіб вказати, що не повинно з'являтися на створеному зображенні.
Що означає seed?
Seed - це число, яке запускає процес створення. Вам не потрібно створювати це число самостійно, воно генерується випадковим чином, якщо ви не виберете одне (зазвичай вибираючи -1).
Але якщо ви контролюєте seed, ви можете створювати ті ж самі зображення знову, спробувати різні налаштування або змінити підказку.
Що таке LoRA?
LoRA означає Low Rank Adaptation. Це набір невеликих розширень, які налаштовують базові моделі.
Ви можете використовувати його для налаштування Stable Diffusion для певного стилю або теми. Ви можете змішувати багато LoRA в одній підказці з різними вагами. Це відкриває безмежні можливості для створення.
Чи можу я встановити Stable Diffusion локально?
Так! Потрібна GPU з принаймні 6 Гб пам'яті (NVRAM).
Ви можете використовувати налаштовані моделі, навчені спільнотою, налаштовувати результати за допомогою LoRA та багато іншого.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.Яка найновіша версія Stable Diffusion?
23 жовтня 2024 року Stability AI випустила Stable Diffusion 3.5 . Це їхня найпотужніша модель перетворення тексту на зображення з великими покращеннями в орфографічних можливостях, продуктивності та якості.