Stable Diffusion היא בינה מלאכותית להמרת טקסט לתמונה. היא יוצרת תמונות מתיאור פשוט בשפה טבעית.
פותחה על ידי StabilityAI , היא קוד פתוח. בניגוד למודלים כמו DALL-E או Midjourney, היא יכולה לפעול על GPUs רגילים. קהילת SD פעילה מאוד. יש הרבה מודלים מותאמים אישית ותוספים זמינים. אתה אפילו יכול לאמן מודל עם הנתונים שלך!
Stable Diffusion משתמשת בחלק ממאגר הנתונים LAION Aesthetics. היא מאומנת ליצור תמונות שמתאימות להנחיות טקסט. מודל זה יכול ליצור אמנות דיגיטלית ייחודית. הוא גם יכול לעשות דברים אחרים כמו אנימציות ומניפולציות תמונה.
אתה יכול לראות דוגמאות ב- גלריית ההנחיות, גלריית האמנות ו- דפדפן התמונות..מהי הנחיה?
הנחיה היא משפט, בדרך כלל 350 תווים או פחות (75 טוקנים), שמתאר את התמונה שאתה רוצה ליצור.
הנחיה שלילית היא דרך פשוטה לציין מה לא צריך להופיע בתמונה שנוצרה.
What is a negative prompt ?
A negative prompt is a list of words or concepts you want Stable Diffusion to avoid in the generated image. While the regular prompt describes what you want, the negative prompt acts as a filter — steering the model away from unwanted elements such as artifacts, deformations, or specific styles. Common entries include terms like blurry, bad anatomy, extra fingers, watermark, low quality, ugly.
Negative prompts work through classifier-free guidance: the model simultaneously moves toward your prompt and away from the negative prompt, with the CFG scale controlling how strongly both signals are applied. Note that Flux models largely make negative prompts obsolete — their improved architecture handles quality and anatomy natively, so prompt adherence alone is usually sufficient.
How does mentioning an artist influence the result ?
Adding an artist's name to your prompt biases the model toward their visual signature — brushwork, color palette, composition, lighting style, and level of detail. This works because Stable Diffusion was trained on large labeled datasets that include artworks attributed to specific artists. For example, adding Greg Rutkowski tends to produce highly detailed fantasy illustrations, while Monet shifts the output toward soft impressionist textures.
Not all artists carry the same weight in the model — some are strongly represented in the training data, others barely influence the output. The effect also varies between model versions: an artist well-recognized by SD 1.5 may be less prominent in SDXL or Flux. Explore hundreds of artist style comparisons on our dedicated artist reference page to find the styles that best match your creative vision.
מה המשמעות של seed?
ה-seed הוא מספר שמתחיל את תהליך היצירה. אתה לא צריך ליצור את המספר הזה בעצמך, הוא נוצר באופן אקראי אם אתה לא בוחר אחד (בדרך כלל על ידי בחירת -1).
אבל אם אתה שולט ב-seed, אתה יכול ליצור את אותן תמונות שוב, לנסות הגדרות שונות או לשנות את ההנחיה.
מה זה LoRA?
LoRA פירושו התאמה בדרגה נמוכה. זהו סט של תוספים קטנים שמכווננים את המודלים הבסיסיים.
אתה יכול להשתמש בזה כדי להתאים את Stable Diffusion לסגנון או נושא מסוים. אתה יכול לשלב הרבה LoRAs בהנחיה אחת עם משקלים שונים. זה פותח אינסוף אפשרויות ליצירה.
האם אני יכול להתקין את Stable Diffusion מקומית?
כן! נדרש GPU עם לפחות 6Gb זיכרון (NVRAM).
אתה יכול להשתמש במודלים מותאמים אישית שאומנו על ידי הקהילה, לכוון תוצאות עם LoRA ועוד הרבה.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.What is ComfyUI ?
ComfyUI is a node-based graphical interface for Stable Diffusion. Rather than a traditional form, it lets you build image generation pipelines visually by connecting nodes — each node handles one specific step: loading a model, encoding a prompt, sampling, or decoding the image. This makes the entire process transparent and fully customizable.
Compared to Automatic1111, ComfyUI offers more granular control over the generation pipeline and is generally faster, at the cost of a steeper learning curve. It supports all major models: SD 1.5, SDXL, Stable Diffusion 3, and Flux. The ecosystem is extended via ComfyUI Manager, which lets you install hundreds of community custom nodes directly from the interface. Download it from the official ComfyUI GitHub repository.
What is Flux ?
Flux is a state-of-the-art text-to-image model released in 2024 by Black Forest Labs, founded by former Stability AI researchers. It significantly outperforms SDXL in prompt adherence, photorealism, and — notably — the ability to render legible text inside generated images, a long-standing weakness of previous diffusion models.
Flux comes in three variants: FLUX.1-schnell (fastest, Apache 2.0 license), FLUX.1-dev (higher quality, open weights for non-commercial use), and FLUX.1-pro (best quality, API only). The open variants are available on Hugging Face and run locally via ComfyUI or Automatic1111 with the appropriate extension.
מהי הגרסה החדשה ביותר של Stable Diffusion?
ב-23 באוקטובר 2024, Stability AI שחררה Stable Diffusion 3.5 . זהו המודל החזק ביותר שלהם להמרת טקסט לתמונה עם שיפורים גדולים ביכולות האיות, הביצועים והאיכות.