Stable Diffusionで美しい画像を作るとき、“呪文”の使い方によっては思った通りの画像が作れなかったり、効果が出なかったりすることも。
呪文の使い方にはコツが必要です。では、どのようにすると理想の画像が作れるのでしょうか?
そこで、よく使われているおすすめ呪文集と呪文を最適化するコツをご紹介しますので、美しいAI画像を作りたい方は、ぜひ参考にしてみてください。
Stable Diffusionで使う基本的なプロンプトの法則
プロンプトは、AIに画像生成を指示するためのテキストです。
魔法のように簡単に画像が作成できるので、「呪文」とも呼ばれています。
プロンプト(呪文)の基本的な法則は以下の通りです。
- 英語で書く
- 簡潔かつ具体的に書く
- カンマと半角スペースで連結して書く
- 順番が先のものほど優先度が高い
- 単語(トークン)数の上限は75まで
Stable Diffusionでよく使われている呪文集
人物画像を生成するときによく使われる呪文として、カテゴリ別にご紹介します。
品質:画像全体のクオリティを高めるための呪文
- masterpiece:傑作
- best quality:最高品質
- high quality :高品質
- ultra detailed:超詳細な
- high resolution:高解像度の
人物:誰をメインで描くか決める呪文
- cute girl:可愛い女の子
- high school student:高校生
- fashion model:モデル
- cute toy:可愛い人形
- fictional character:架空のキャラクター
特徴:髪型や服装、表情を決める呪文
- long flowing hair:長く流れる髪
- casual outfit:カジュアルな衣装
- formal dress:フォーマルなドレス
- surprised:驚いた表情
- thoughtful:考え深い表情
背景:場所や色を決める呪文
- blue sky background:青空
- urban cityscape:都市の風景
- sunset over the ocean:海に沈む夕陽
- mystical starry night sky:神秘的な星空
- winter wonderland mountain:冬の絶景雪山
スタイル:全体の画風を決める呪文
- anime style:アニメ風
- pencil drawing:鉛筆画
- oil painting:油絵
- Concept art:コンセプトアート
- hyperrealistic fantasy surrealist:リアルファンタジー
これらの呪文を組み合わせることで、自分が思い描く理想の画像が生成できます。
実際に生成したAI画像
それでは、実際に生成してみた画像をご紹介します。
プロンプト:(Cool hedgehog character),driving a car ,cozy indoor laighting, digital painting,character design by pixar and hayao miyazaki, octane render,unreal 5,dynamic angle,cinematic,unreal engine,
ネガティブプロンプト:ugly,EasyNegative
環境:Steps: 20, Sampler: DDIM, CFG scale: 7, Seed: 1972246794
プロンプト:city made out of glass,close shot, realism, octane render, cinematic, trending on artstation, realistic,unreal engine, hyper detailed, photo – realistic maximum detail, volumetric light, moody cinematic epic concept art, realistic matte painting, hyper photorealistic, concept art, volumetric light, movie concept art, octane render,
ネガティブプロンプト:easynegative,low contrast, underexposed, overexposed,article,letter
環境:Steps: 25, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 136546677
呪文を最適化して理想の画像を生成するコツ
簡単なプロンプトから始めて修正していく
最初に入力したプロンプトで、納得のいく画像はほぼ生成されないでしょう。シンプルなプロンプトから始めて、少しずつキーワードを追加して効果を確認していくことが大切です。
プロンプトの修正は、最初のプロンプトが複雑であるほど時間がかかるので、最初は簡単なプロンプトから試していきます。順番を変えてみたり、言葉を言い換えて修正しながら、より理想的な画像に近づけます。
プロンプトの優先度を調整していく
プロンプトのキーワードに特殊修飾をすることで、キーワードの影響力を増減できます。
- ()で囲うと1.1倍、2つで囲うと1.21倍・・・重みを1.1倍にする例:(shining)
- カッコと数値で直接倍率指定・・・重みを1.5倍にする例:(shining:1.5)
- [ ]で囲うと1.1倍弱める・・・重みを下げる例:[word]
ネガティブプロンプトで理想に近づけやすく
ネガティブプロンプトには、生成する画像とは反対の避けたいキーワードを入力します。
よく使われているネガティブプロンプトをいくつかご紹介します。
- ugly:醜い
- deformed and disfigured:歪んだ、変形した
- low contrast:低コントラスト、薄暗い
- underexposed:露出不足の、暗い
- blurry:ぼやけた、不鮮明な
- blurred:滲んだ、ぼやけた
- grainy:粗い
- draft:下書き
スタイルや望ましくない属性にも適用できるので、上手く活用すると生成される画像が、より理想に近づけやすくなります。
美しい画像を生成するためには
実際にStable Diffusionを使って画像を生成してみて、美しい画像が出来上がると満足感が味わえます。特に、人物やキャラクターを入れた画像生成は、難しいと感じるかもしれません。
ネガティブプロンプトやプロンプトの組み合わせを工夫しながら、何度も試行錯誤をすることで理想の画像が生成できます。
Stable Diffusionは、自分だけのオリジナル画像を作成できるツールです。ぜひ、呪文を修正しながら試してみて、自分だけの素晴らしい作品を作ってみてください。