What is Stable Diffusion?

Stable Diffusion is a text-to-image Artificial Intelligence developed by Stability AI. It generates images from a simple description in natural language. Unlike DALL-E or Midjourney, it is open source and can run on consumer GPUs with at least 6 GB of VRAM.

A prompt is a sentence, usually 350 characters or less (75 tokens), that describes the image you want to generate. A negative prompt specifies what should not appear in the generated image.

Can I install Stable Diffusion locally?

Yes. A GPU with at least 6 GB of VRAM is required. You can use AUTOMATIC1111’s web UI or ComfyUI to run Stable Diffusion locally. Community-trained models, LoRA fine-tunes, and many extensions are available.

Can I use Stable Diffusion images commercially?

It depends on the model. The base Stable Diffusion models use the CreativeML Open RAIL-M license, which allows commercial use with some restrictions — you cannot use images to harm or deceive people. Always check the license of the specific checkpoint you use, as some community models restrict commercial use.

Stable Diffusion online AI

Trí tuệ nhân tạo miễn phí cho mọi người

Tạo hình ảnh AI miễn phí, trực tiếp trong trình duyệt.
Nhập một prompt. Công cụ của chúng tôi tạo ra hình ảnh độc đáo trong vài giây. Không cần tài khoản, GPU hay cài đặt.

Công cụ tạo hình ảnh miễn phí trực tuyến

        Stable Diffusion 3
      
        🔥Wan Animate🔥
      
        webUI
      
        Inpainting

        Stable Diffusion XL
      
        Magic Prompt generator
      
        Open DALL-e
      
        Upscaling

Bộ công cụ trí tuệ nhân tạo và LLM miễn phí:

        🔥GPT-4🔥
      
        GPT 3.5
      
        Llama 3
      
        Mixtral - Mistral AI
      
        DeepSeek-R1

Tác phẩm nghệ thuật từ Cộng đồng

Captain_America_trying_to_make_toast_in_Iron_Man_Helmet.webp

1265568326-modern_4-story_construction,_with_low_homes,_main_street.,__lora_add-detail-xl.webp

3861030857-drawing_of_a_full_cartoon_of_a_duck_with_eye_patches,_weird_appearance_playing_basketball,_Ron_English_concept_art,_dribbling.webp

1195407874-cozy_futuristic_modern_french_street,_french_peoples_walking.webp

1815091708-a_cartoon_bear_dressed_like_a_fire_fighter,_the_bear_is_wearing_a_red_fire_fighter_uniform._there_is_a_small_yellow_duck.webp

Iron_Man,_Arnold_Tsang,_Toru_Nakayama,_Masterpiece,_Studio_Quality,_6k_,_toa,_toaair,_1boy,_glowing,_axe,_mecha,_science_fiction.webp

1242236124-a_modern_and_inviting_living_room_within_a_cabin,_boasting_a_double-height_ceiling_and_a_floor-to-ceiling_window_on_one_side.webp

2388582922-isometric_illustration_of_deep_sea_scifi_underwater_base_._retro_futurism._white._ralph_mcquarrie._wide_shoot.webp

1151222255-christmas_girlands_with_decorations_around_edges,_old_paper_inside_as_background,_ultrarealistic,_8k.webp

2885217816-isometric_clean_pixel_art_image_cutaway_of_inside_of_japanese_bath_house,__lora_add-detail-xl_0.4_.webp

3692047872-beautiful_woman_wearing_a_beige_skirt,_dark_brown_turtleneck_sweater,_small_neckless,_cute-fine-face,_anime._illustration,_reali.webp

2198772702-photorealistic_ink_art_showing_silouhette_of_beautiful_and_mysterious_woman_into_psychedelic_desert_with_charred_shrubs,_far_bac.webp

250-chest_games_as_it_was_an_adventure_disney_pixar_studio_style_movie,_cartoon,_style_detail_texture,_3d_render,_unreal_engine,_vol.webp

49576313-watercolor_painting,_wooden_cabin_with_a_straw_roof_on_a_cliff,_coastal_view,_contemporary,_high_contrast,_cell_shading,_strong.webp

1056248693-an_hyperrealistic_wanted_poster_with_the_face_of_a_robot,_featuring_a_100000_buzz_reward,_issued_by_civitai_county.webp

Stable Diffusion là gì?

Stable Diffusion là AI tạo ảnh từ văn bản. Gõ điều bạn muốn — nó sẽ tạo ảnh.

Được phát triển bởi StabilityAI , là mã nguồn mở. Chạy trên GPU thông thường — không cần đám mây. Cộng đồng rất năng động. Nhiều mô hình và tiện ích bổ sung miễn phí. Bạn thậm chí có thể huấn luyện nó trên ảnh của mình!

Nó được huấn luyện trên hàng triệu ảnh. Dùng để tạo nghệ thuật số, chỉnh sửa ảnh, hoạt ảnh và nhiều hơn nữa.

Bạn có thể xem các ví dụ trong thư viện lời nhắc, Thư viện Nghệ thuật và trình duyệt hình ảnh..

Câu hỏi thường gặp

Lời nhắc là gì?

Prompt là mô tả văn bản hướng dẫn AI. Nó có thể bao gồm chủ đề, phong cách nghệ thuật, ánh sáng, tâm trạng và phương tiện — ví dụ: 'một hiệp sĩ thời trung cổ trong khu rừng tối, tranh sơn dầu, ánh sáng kịch tính, điện ảnh'. Prompt càng cụ thể, kết quả càng gần với tầm nhìn của bạn. Giữ nó dưới 350 ký tự để có kết quả tốt nhất.

Prompt âm cho AI biết những gì không nên có trong ảnh.

Prompt âm là gì?

Prompt âm cho AI biết điều gì KHÔNG được hiển thị. Ví dụ phổ biến: 'blurry, low quality, watermark, text, deformed hands'. Dùng chúng để loại bỏ lỗi AI thường gặp.

Prompt âm nhanh chóng cải thiện chất lượng ảnh. Thêm trọng số — như '(blurry:1.4)' — để làm chúng mạnh hơn.

Hạt giống có nghĩa là gì?

Seed là một số khởi tạo quá trình ngẫu nhiên đằng sau việc tạo hình ảnh. Mỗi hình ảnh bắt đầu từ nhiễu, và seed xác định nhiễu ban đầu trông như thế nào. Để -1 để nhận seed ngẫu nhiên — và hình ảnh khác nhau — mỗi lần.

Cố định seed để tái tạo chính xác cùng một hình ảnh. Điều này hữu ích cho thử nghiệm: giữ seed không đổi trong khi chỉ thay đổi prompt hoặc cài đặt để so sánh các biến thể một cách chính xác. Đây cũng là cách tái tạo một kết quả yêu thích sau này.

LoRA là gì?

LoRA viết tắt của Low-Rank Adaptation. Đây là một tệp bổ sung nhỏ (thường 50–150 MB) tinh chỉnh mô hình cơ sở cho một phong cách, nhân vật hoặc chủ đề cụ thể — mà không cần đào tạo lại toàn bộ mô hình.

Tải LoRA để tạo hình ảnh theo phong cách nghệ thuật cụ thể, tái tạo nhân vật cụ thể hoặc khớp với một khái niệm tham chiếu. Bạn có thể kết hợp nhiều LoRA trong một prompt bằng cách sử dụng trọng số: <lora:my-style:0.8>. Hàng nghìn LoRA miễn phí có sẵn trên Civitai và Hugging Face.

Cách cài đặt Stable Diffusion cục bộ?

Chạy Stable Diffusion cục bộ yêu cầu GPU NVIDIA gần đây với ít nhất 6 GB VRAM. GPU AMD hoạt động với driver ROCm trên Linux. Apple Silicon (M1/M2/M3) cũng được hỗ trợ qua backend MPS. Nếu bạn không có GPU tương thích, công cụ trực tuyến miễn phí của chúng tôi chạy trực tiếp trong trình duyệt — không cần cài đặt.

Đầu tiên, tải base model và refiner từ Stability AI.
Tiếp theo, cài Python 3.10 và Git.
Tải webUI từ Automatic1111.
Đặt cả hai mô hình vào thư mục models/Stable-diffusion .
Tìmwebui.bat và nhấp đúp để cài đặt.
Mở trình duyệt tại localhost:8760.

Cần bao nhiêu VRAM cho Stable Diffusion?

Bạn cần ít nhất 4 GB VRAM để chạy Stable Diffusion. 6 GB là mức tối thiểu được khuyến nghị cho mô hình SDXL. Với 8 GB trở lên, bạn có thể tạo ảnh lớn hơn và dùng nhiều tính năng hơn.

Không có GPU vẫn có thể chạy trên CPU, nhưng chậm hơn nhiều. Bạn cũng có thể dùng demo trực tuyến miễn phí của chúng tôi mà không cần GPU.

Img2img là gì?

Img2img cho phép dùng ảnh hiện có làm điểm xuất phát. Bạn cung cấp ảnh gốc và prompt. Stable Diffusion sẽ biến đổi ảnh theo hướng dẫn của bạn.

Dùng để thay đổi phong cách ảnh, sửa ảnh đã tạo, hoặc hoàn thiện phác thảo. Denoising strength kiểm soát mức độ AI thay đổi ảnh gốc.

Tôi có thể dùng ảnh Stable Diffusion cho mục đích thương mại không?

Điều này phụ thuộc vào mô hình. Các mô hình Stable Diffusion cơ sở dùng giấy phép CreativeML Open RAIL-M. Giấy phép này cho phép sử dụng thương mại, nhưng có hạn chế — không được dùng ảnh để gây hại hoặc lừa dối người khác.

Luôn kiểm tra giấy phép của checkpoint bạn sử dụng. Một số mô hình cộng đồng hạn chế dùng thương mại. Nếu bán hoặc công bố ảnh AI, hãy lưu lại thông tin mô hình và giấy phép.

ControlNet là gì?

ControlNet là tiện ích mở rộng của Stable Diffusion giúp bạn kiểm soát chính xác bố cục ảnh. Bạn cung cấp ảnh tham chiếu — tư thế, bản đồ cạnh hoặc bản đồ độ sâu — và AI sẽ theo cấu trúc đó.

Dùng ControlNet để giữ nguyên tư thế chính xác, sao chép bố cục cảnh hoặc phác thảo chính xác. Nó hoạt động cùng prompt để kiểm soát cả nội dung lẫn cấu trúc ảnh.

Checkpoint là gì?

Checkpoint là một file mô hình AI đã lưu. Nó chứa mọi thứ mô hình học được trong quá trình huấn luyện. Bạn tải checkpoint để xác định phong cách và chủ đề hình ảnh.

Các checkpoint khác nhau cho kết quả rất khác nhau. Một số được huấn luyện cho ảnh thực tế, số khác cho anime hoặc minh họa. Bạn có thể tải checkpoint miễn phí từ Hugging Face hoặc Civitai.

ComfyUI là gì?

ComfyUI là giao diện miễn phí dựa trên nút cho Stable Diffusion. Bạn xây dựng quy trình ảnh bằng cách kết nối các khối gọi là nút. Mỗi nút thực hiện một bước — tải mô hình, thêm prompt hoặc lưu ảnh.

ComfyUI cho bạn kiểm soát hoàn toàn từng bước. Nó nhanh và nhẹ hơn Automatic1111. Người dùng nâng cao ưa dùng cho quy trình phức tạp. Bạn có thể chia sẻ quy trình dưới dạng file JSON.

Flux là gì?

Flux là mô hình AI tạo ảnh từ văn bản của Black Forest Labs, được thành lập bởi các nhà nghiên cứu cũ của Stability AI. Phiên bản mới nhất là FLUX.2, phát hành tháng 11 năm 2025, tạo ảnh lên đến 4MP với chất lượng ảnh thực và kiểm soát đa tham chiếu.

FLUX.2 có bốn biến thể: Max (chất lượng đỉnh), Pro (chất lượng tốc độ cao), Flex (độ chính xác và văn bản sắc nét) và Dev (trọng số mở, triển khai tự do). FLUX.2 Dev chạy cục bộ trong ComfyUI hoặc Automatic1111 — cùng công cụ với Stable Diffusion.

Phiên bản mới nhất của Stable Diffusion là gì?

Phiên bản mới nhất là Stable Diffusion 3.5 , phát hành vào tháng 10 năm 2024. Tạo ra hình ảnh sắc nét hơn với khả năng hiển thị văn bản tốt hơn đáng kể, màu sắc phong phú hơn và chi tiết tinh tế được cải thiện. Có ba kích thước: Large (8B tham số), Large Turbo cho tạo nhanh và Medium — tất cả đều có thể chạy cục bộ với VRAM vừa phải.

Trở lại đầu trang Thư viện hình ảnh