【悪用厳禁】「勢い」を残したエロイラストをStable Diffusionで生成する方法の考察

NSFWコンテンツ(性的なコンテンツ)に嫌悪感のある方は、この記事の閲覧はお控えください。

最近またStable Diffusionでのエロイラスト生成のモチベーションが上がってきていて、色々新しい手法を試す中で、割と手ごたえがあったものを紹介します。

結論を最初に書くと、「t2iでエロ系Loraを高強度でかけて破綻しかけたイラストを生成して、それをi2iする」という方法です。

免責事項

この記事は、生成AIにおけるNSFW(Not Safe For Work)表現に関する情報を提供することを目的としています。記事内では、NSFW表現を生成する可能性のあるプロンプトを紹介していますが、これらのプロンプトの使用を推奨するものではありません。

当記事で紹介する情報を活用する際は、あくまで読者自身の責任において行ってください。当ブログおよび管理人は、以下について一切の責任を負いません。

  • 読者が、当記事の情報を利用したことによって生じたいかなる損害、損失、トラブル
  • 生成されたコンテンツが、第三者の権利(著作権、肖像権など)を侵害した場合
  • 生成されたコンテンツが、法令や公序良俗に反する場合
  • 読者が利用するプラットフォームの利用規約に違反した場合

特に児童ポルノを連想させる写実的なコンテンツは絶対に生成しないでください。

Stable Diffusionを使うにあたってConoHa AI Canvasを利用しています。Stable Diffusionを月額課金で使えるサービスです。解説記事を書いていますので、興味がある方は以下のリンクからぜひお読みください。

ConoHa AI Canvas アフィリエイトバナー

今回生成したイラストと生成方法の紹介

掲載にあたりモザイク加工を施しています。

過去に私は「t2iをLoraなしで生成して、それをLoraを適用させたi2iで再生成する」という方法を紹介しましたが、最近はむしろ逆なのでは、という気がしてきています。

つまり最初にLoraを高強度でかけて破綻しかけた「勢い」のある画像を生成して、それをi2iすることで整える、というアプローチです。

こうすることでLoraでの極端な体型やデフォルメといったものを比較的維持したままの生成結果が得られます。

1. エロ系Loraを高強度でかけてt2iをする

まず以下のようなプロンプトでt2iをしました。

[prompt]
2girls, explicit, (embarrassed, blush:1.4), very sweaty, white background, torogao, smile,
キャラクター①, キャラクター②,
looking at viewer, a-pose, standing, legs apart, hand on own hip,
nude, bowtie, ribbon, rabbit ears,
huge breasts, puffy nipples, cleft of venus,
作品名プロンプト, cowboy shot, <lora:style系:1>, <lora:Erotic_style_3:1>

[Negative prompt]
worst quality, bad quality, monochrome, sad, angry

Steps: 20
Sampler: Euler a
Schedule type: Automatic
CFG scale: 7
Size: 1050×1400
Model: waiIllustriousSDXL_v170

一部は表記をぼかしています。ごめんなさい。

使用モデルと lora:Erotic_style だけリンクでご紹介します。

そうすると以下のような画像が生成されました。

細部が破綻していますが、「エロの勢い」はあると思います。

この勢いを残すことを念頭にi2iをします。

2. Denoising strengthを低くしてi2iをする

Stable Diffusionのi2iのタブに行くと、Denoising strength(ノイズ除去強度)というスライダーがあります。これは簡単に言うと元画像をどれだけ崩すか、というスライダーで、低くすればするほどi2iに使用した元画像がそのまま生成されます。

最近UIが日本語化されたみたいです

これを利用して、「勢いを残して、破綻している部分を直す」ということを試みます。

今回はDenoising strengthを0.5にしてi2iをしました。個人的には0.4から0.5の間で調整するイメージです。

[prompt]
2girls, explicit, (embarrassed, blush:1.4), very sweaty, white background, torogao, smile,
キャラクター①, キャラクター②,
looking at viewer, a-pose, standing, legs apart, hand on own hip,
nude, bowtie, ribbon, rabbit ears,
huge breasts, puffy nipples, cleft of venus,
masterpiece, best quality, absurdres, <lora:style系:0.8>,

[Negative prompt]
worst quality, bad quality, monochrome, sad, angry,

Steps: 20
Sampler: DPM++ 2M
Schedule type: Karras
CFG scale: 7
Size: 1050×1400
Model: waiIllustriousSDXL_v170
Denoising strength: 0.5

t2iのプロンプトをコピペして、末尾の行だけ赤字の部分に差し替えます。

ミスってSamplerがDPMになってますが、Euler aの方が多分良いです(WAI-illustrious-SDXLの推奨がEuler aのため)。

これをすると冒頭で紹介した画像になります。横に並べてみます。

体型や雰囲気はかなりの部分で残したまま、細部のディティールが修正されているのが分かると思います。

他イラストの例

大量にあり掲載しきれない(モザイク処理が追い付かない)ので、二つほど例として紹介します。プロンプトは割愛しますがやり方は同じです。

まとめ

t2iで高強度Loraを適用して画像を生成し、Denoising strengthを低くしてi2iをすることでニュアンスを残したまま画像生成ができます。

なお念押しになりますが、当記事の内容を参考にして画像生成を行うと無修正の画像が生成されるため、モザイク加工を施さずにネットに上げたり、ましてや無修正画像を有料で配布したりなどすると本当に捕まりますので、悪用厳禁(ガチ)でお願いします。当ブログは何の責任も取れませんのでご了承ください。

取り扱いには気を付けて、楽しく遊びましょう。

もし当記事を読んでStable Diffusion(Conoha AI Canvas)を使ってみたいという方がおりましたら、以下のバナーを踏んでから利用開始して頂けると私にスタバのコーヒー代程度の報酬が入りますので、ぜひよろしくお願いします。

ConoHa AI Canvas アフィリエイトバナー