こんにちは。aiartisfunです。
今回は感情表現をプロンプトに組み込むことで魅力的になるのではないかというコンセプトでプロンプトを作りました。
イラスト生成にはConoHa AI Canvasで起動したStable Diffusion XLを使用しています。解説記事を書いていますので、興味がある方は以下のリンクからぜひお読みください。

プロンプトと生成結果
今回使用したプロンプトと、生成されたイラストは以下になります。
[prompt]
1girl, full body,white background,
maid costume, cat ears,
black hair, bob cut,
embarrassed posing, blush, looking at viewer,
<lora:sdxl-boldline:-0.5>, masterpiece,
[negative prompt]
(worst quality:1.4), (low quality:1.4), open mouth, sit down, speach pubble
Steps: 20
Sampler: DPM++ 2M Karras
CFG scale: 7
Size: 960×1536

今回考えていたこと
最初はシンプルに、猫耳メイド少女のイラストを生成しようと考えていました。
よりイラストを魅力的にする要素として何があるかを考えたときに、感情表現をプロンプトに盛り込むと良いのではないかと考えました。
その際に、ただ感情を指定するのではなく、「感情+posing」とすることで、イラスト全体の雰囲気(表情・ポーズなど)が統一されるのではないかという仮定でプロンプトを作りました。
生成結果としては、単純に「smile」などを指定するよりも良いイラストになったのではないかと思います。ただサンプル数が少なすぎるので、汎用的に使えるかどうかは分かりません。
上手くいかなかった点
最初、以下のようなプロンプトを考えていました。
1girl, full body, white background,
maid costume, cat ears,
black hair, bob cut,
embarrassed blush, looking up,
wood floor,
<lora:sdxl-boldline:-0.5>, masterpiece,
[Negative prompt]
(worst quality:1.4), (low quality:1.4), open mouth,
looking upについては、単純に上目遣いにしたいと思って記述したのですが、実際にはカメラの位置が上寄りになりすぎるということで、私のイメージとは少し違ったので没としました。

あとwood floorですが、これはfull bodyを描写しながら、装飾として足元だけウッドフロアが描画されるようなイメージを持っていたのですが、実際には室内の描写がされてしまい、イメージと違っていたため没となりました。

個人的には「カフェの店員として働いている猫耳メイドが恥ずかしがっている」というイメージでプロンプトを書いたのですが、なかなか制御が難しいと感じます。
おまけ: sketch line art
手書き感を強めるプロンプトとして、sketch line artは割とありなのではないかと思っています。

主線が太くなり、アニメ塗りに近い雰囲気になります。Checkpointとの相性もあるので一概に言えませんが、これはこれで可愛くて好きです。
まとめ
今回は以下の点について考察しました。
感情+posingで、キャラクターイラストとしての魅力を高められないか。
生成結果としてはけっこう可愛くできて良かったです。
キャラクターを主題としたイラストであれば、感情表現を盛り込むというのはかなりありなのではないかと思います。
