Stable Diffusion online AI
誰でも無料で利用できる人工知能
AIの画像を無料で、ブラウザから直接生成できます。
promptを入力してください。ツールが数秒でユニークな画像を作成します。アカウント、GPU、インストール不要。
無料の画像生成ツールオンライン
無料の人工知能とLLMツールボックス:
コミュニティからのアートワーク
Stable Diffusionとは?
Stable Diffusionはテキストから画像を作るAIです。欲しいものを入力すると画像を生成します。
によって開発されました StabilityAI 、オープンソースです。普通のGPUで動き、クラウド不要です。コミュニティはとても活発です。多くのモデルやアドオンが無料で使えます。自分の画像でトレーニングすることもできます!
数百万枚の画像で学習しました。デジタルアート、写真編集、アニメーションなどに使えます。
例を私たちの プロンプトギャラリー, アートギャラリー および 画像ブラウザで見ることができます。.よくある質問
プロンプトとは?
プロンプトはAIを導くテキスト説明です。被写体、アートスタイル、照明、雰囲気、素材を含めることができます — 例:'暗い森の中世の騎士、油絵、ドラマチックな照明、映画的'。プロンプトが具体的なほど、結果はあなたのビジョンに近くなります。最良の結果のために350文字以内にしてください。
ネガティブプロンプトは、画像に含めたくないものをAIに伝えます。
ネガティブプロンプトとは何ですか?
ネガティブプロンプトはAIに表示してほしくないものを伝えます。例:'blurry, low quality, watermark, text, deformed hands'。これらでAIの典型的なミスを取り除けます。
ネガティブプロンプトは画像品質を素早く改善します。強化するにはウェイトを追加しましょう — 例:'(blurry:1.4)'。
シードとは何ですか?
シードは画像生成の背後にあるランダムプロセスを初期化する数値です。すべての画像はノイズから始まり、シードはその開始ノイズの形を決定します。毎回異なる画像を得るには-1のままにしてランダムシードを使用してください。
完全に同じ画像を再現するためにシードを固定します。これは実験に役立ちます:シードを一定に保ちながらプロンプトや設定だけを変えて、バリエーションを正確に比較できます。後でお気に入りの結果を再現する方法でもあります。
LoRAとは?
LoRAはLow-Rank Adaptationの略です。ベースモデル全体を再トレーニングせずに、特定のスタイル、キャラクター、またはテーマ向けに微調整する小さなアドオンファイル(通常50〜150MB)です。
特定の芸術スタイルで画像を生成したり、特定のキャラクターを再現したり、参照コンセプトに合わせたりするためにLoRAを読み込みます。重みを使って複数のLoRAを一つのプロンプトで組み合わせることができます:<lora:my-style:0.8>。何千もの無料LoRAがCivitaiとHugging Faceで利用可能です。
Stable Diffusionをローカルにインストールするには?
Stable Diffusionをローカルで実行するには、最低6GBのVRAMを持つ最新のNVIDIA GPUが必要です。AMD GPUはLinux上でROCmドライバーで動作します。Apple Silicon(M1/M2/M3)もMPSバックエンドを通じてサポートされています。互換性のあるGPUがない場合は、無料のオンラインツールがブラウザで直接動作します — インストール不要。
まず、Stability AIから base model と refiner をダウンロードします。次に Python 3.10 とGitをインストールします。
webUIをセットアップします: Automatic1111.
両モデルを models/Stable-diffusion フォルダに入れます。
webui.bat をダブルクリックしてインストールします。
ブラウザでlocalhost:8760を開きます。
Stable DiffusionにはどれだけのVRAMが必要ですか?
Stable Diffusionを動かすには最低4GBのVRAMが必要です。SDXLモデルには6GBが推奨最低値です。8GB以上あると大きな画像を生成でき、より多くの機能を使えます。
GPUがなくてもCPUで実行できますが、はるかに遅くなります。GPUなしで使える無料オンラインデモもご利用いただけます。
img2imgとは何ですか?
Img2imgは既存の画像を出発点として使う機能です。元画像とプロンプトを指定します。Stable Diffusionがその指示に従って画像を変換します。
写真のスタイル変更、生成画像の修正、ラフスケッチの仕上げに使えます。デノイズ強度で変化の度合いを調整できます — 低いと元画像に近く、高いと大きく変わります。
Stable Diffusionの画像を商業利用できますか?
モデルによって異なります。Stable Diffusionの基本モデルはCreativeML Open RAIL-Mライセンスを使用しています。商業利用は可能ですが制限があります — 人を傷つけたり欺いたりするために画像を使用することはできません。
使用するcheckpointのライセンスを必ず確認してください。一部のコミュニティモデルは商業利用を制限しています。AI生成画像を販売・公開する場合は、モデルとライセンスの記録を保管してください。
ControlNetとは何ですか?
ControlNetはStable Diffusionの拡張機能で、画像の構図を細かく制御できます。ポーズ、エッジマップ、深度マップなどの参照画像を与えると、AIがその構造に従います。
人物の正確なポーズを保持したり、シーンのレイアウトを複製したり、スケッチを正確にトレースするのに使えます。プロンプトと組み合わせて、内容と構造の両方を制御できます。
チェックポイントとは何ですか?
チェックポイントは保存されたAIモデルファイルです。モデルがトレーニング中に学習した内容をすべて含んでいます。チェックポイントを読み込むと、画像のスタイルと被写体が決まります。
チェックポイントが違うと結果も大きく変わります。リアルな写真向け、アニメやイラスト向けなど様々です。Hugging FaceやCivitaiから無料でダウンロードできます。
ComfyUIとは何ですか?
ComfyUIはStable Diffusion向けの無料ノードベースインターフェースです。ノードと呼ぶブロックを繋いで画像ワークフローを作ります。各ノードは1つのステップを実行します — モデルの読み込み、プロンプト追加、または画像の保存。
ComfyUIは各ステップを完全に制御できます。Automatic1111より速く、軽量です。上級ユーザーは複雑なワークフローに使います。ワークフローをJSONファイルとして共有できます。
Fluxとは何ですか?
FluxはBlack Forest Labsが開発したテキストから画像を生成するAIモデルです。同社はStability AIの元研究者が設立しました。最新版はFLUX.2(2025年11月リリース)で、最大4MPのフォトリアリスティックな画像とマルチリファレンス制御を備えています。
FLUX.2には4つのバリアントがあります:Max(最高品質)、Pro(最高速度での高品質)、Flex(精度と鮮明なテキスト)、Dev(オープンウェイト、自由にデプロイ可能)。FLUX.2 DevはComfyUIやAutomatic1111でローカル実行できます。
Stable Diffusionの最新バージョンは何ですか?
最新バージョンは Stable Diffusion 3.5 、2024年10月にリリース。テキストレンダリングが大幅に改善され、色彩が豊かになり、細部のディテールが向上した、よりシャープな画像を生成します。Large(80億パラメータ)、高速生成用のLarge Turbo、Mediumの3サイズがあり、いずれも中程度のVRAMでローカル実行可能です。