staff blog

AI画像生成ツールを使ってみる

大阪制作室の吉永です、今や当たり前になりつつある 生成AIについて調べてみようと思います。

と思ったのですが、AIツールはいろいろなサービスや情報が散在しており、 はじめるにもどれが良いかまったくわからないので 検索して最初に出てきた「Stable Diffusion」というツールを調べてみることにしました。


Stable Diffusionとは
Stable Diffusion(以下SD)は2022年8月にStabillity AI社からリリースれ、ソースやモデルなどが無償公開されたことで話題になったAI画像生成サービスで、今では多くの人に利用されています。無制限で使用できて、商用利用も可能。

バージョンや派生形、WebUI、モデルなどなど初心者にはまったくわからないことが盛りだくさんで
早くも挫折しそうです。ひとまず自分のPCで使えそうなバージョンとWebUIを探してみます。

バージョンについて
・SDの代表的なバージョンはSD1.5、SDXL、Flux1
・バージョンごとにモデルの性能や生成される画像の特徴が違う
・チェックポイントやLoRAは同一バージョンで揃える必要がある

SD1.5 (Stable Diffusion v1.5)
最初期の安定したバージョンで、多くのユーザーが利用しているモデル。 リアルな画像からアニメ調の画像まで、幅広く汎用性の高いバージョン。 画像サイズ(512×512)
メリット:軽量で初心者でも使いやすい。多くのチェックポイントやLoRAとの互換性が高い。
デメリット:単純な生成結果だと顔の品質が低い。指が崩れやすい。

SDXL (Stable Diffusion XL)
SD1.5よりも大規模で高解像度の画像を生成するために最適化されたバージョン。 細かいディテールや複雑な構図の画像を生成するのが得意。 画像サイズ(1024×1024)
メリット:使いこなせると質の高い画像を生成できる。
デメリット:計算量がSD1.5から増加している。指が崩れやすい

Flux1
Flux1の中にも生成スピード重視のschnell、高バランスのdev、とProの3種がある。 Proが最高品質、Local環境で使えるのはschnellとdevのみ。 画像サイズ(1024×1024)
メリット:簡単なプロンプトでも驚異的な品質での生成が可能。
デメリット:チェックポイントのファイルサイズが、通常で20GB程度にもなり非常に大きい。軽量化されたチェックポイントでも10GB程度は必要で、更に計算量も多く、生成には高いGPU能力とメモリが必要。

●WebUIの種類

生成作業を行うためのツールとして、使用されるWebUI(ユーザーインターフェース) 代表的なWebUIとしてAutomatic1111、WebUI Forge、ComfyUIの3つがある。
Automatic1111
最もポピュラーなWebUI、多くのカスタム機能や拡張が利用可能。初心者に使いやすい。

WebUI Forge
パフォーマンスの最適化、メモリ処理に優れたWebUIで、生成速度が早く、大量の生成や連続処理に強い。

ComfyUI
高度なカスタマイズが可能、細かい生成パラメータを視覚的に調整でき、プロフェッショナル向けの高度な生成に向いている。

ひとまず調べたところではこんな感じでしたが、派生形など調べるときりが無いので、そのあたりはまたの機会にします。 まずは自分の環境に応じて適切なものを選ぶことが重要なようです。
今回はここまで、なかなか始めるところまで行き着きません。

2025年1月
 12345
6789101112
13141516171819
20212223242526
2728293031  

category

Popular posts

ページの先頭へ移動