
Stable Diffusion là một trí tuệ nhân tạo chuyển văn bản thành hình ảnh. Nó tạo ra hình ảnh từ một mô tả đơn giản bằng ngôn ngữ tự nhiên.
Được phát triển bởi StabilityAI , nó là mã nguồn mở. Không giống như các mô hình như DALL-E hay Midjourney, nó có thể chạy trên các GPU thông thường. Cộng đồng SD rất tích cực. Có rất nhiều mô hình tinh chỉnh và tiện ích bổ sung có sẵn. Bạn thậm chí có thể đào tạo một mô hình với dữ liệu của riêng bạn!
Stable Diffusion sử dụng một phần của bộ dữ liệu LAION Aesthetics. Nó được đào tạo để tạo ra hình ảnh phù hợp với các lời nhắc văn bản. Mô hình này có thể tạo ra nghệ thuật kỹ thuật số độc đáo. Nó cũng có thể làm những việc khác như hoạt hình và chỉnh sửa hình ảnh.
Bạn có thể xem các ví dụ trong thư viện lời nhắc, Thư viện Nghệ thuật và trình duyệt hình ảnh..Lời nhắc là gì?
Lời nhắc là một câu, thường là 350 ký tự hoặc ít hơn (75 token), mô tả hình ảnh bạn muốn tạo.
Lời nhắc tiêu cực là một cách đơn giản để chỉ định những gì không nên xuất hiện trong hình ảnh được tạo ra.
Hạt giống có nghĩa là gì?
Hạt giống là một con số bắt đầu quá trình tạo ra. Bạn không cần phải tự tạo ra con số này, nó được tạo ngẫu nhiên nếu bạn không chọn một số (thường bằng cách chọn -1).
Nhưng nếu bạn kiểm soát hạt giống, bạn có thể tạo ra cùng một hình ảnh nhiều lần, thử các cài đặt khác nhau hoặc thay đổi lời nhắc.
LoRA là gì?
LoRA có nghĩa là Thích ứng Hạng thấp. Nó là một tập hợp các tiện ích mở rộng nhỏ điều chỉnh các mô hình cơ bản.
Bạn có thể sử dụng nó để điều chỉnh Stable Diffusion cho một phong cách hoặc chủ đề nhất định. Bạn có thể kết hợp nhiều LoRA trong một lời nhắc với các trọng số khác nhau. Điều này mở ra vô số khả năng sáng tạo.
Tôi có thể cài đặt Stable Diffusion cục bộ không?
Có! Một GPU với ít nhất 6Gb bộ nhớ (NVRAM) là cần thiết.
Bạn có thể sử dụng các mô hình tùy chỉnh được đào tạo bởi cộng đồng, tinh chỉnh kết quả với LoRA và nhiều hơn nữa.
How to install Stable Diffusion locally ?
First, get the SDXL base model and refiner from Stability AI.Phiên bản mới nhất của Stable Diffusion là gì?
Vào ngày 23 tháng 10 năm 2024, Stability AI đã phát hành Stable Diffusion 3.5 . Đây là mô hình chuyển văn bản thành hình ảnh mạnh mẽ nhất của họ với những cải tiến lớn về khả năng chính tả, hiệu suất và chất lượng.