generative_ai:img
1_イメージ生成
コンテンツ
イメージ生成
┃
┣━ 1.イメージ生成環境(A1111, StabilityMatrix, etc.)
┃
┃ ローカルでの環境構築についての話です
┃
┣━ 2.モデル(Checkpoint, LoRA, VAE, etc.)
┃
┃ ダウンロード可能なモデル/不可能なモデルについての話です
┃
┣━ 3.拡張機能
┃
┃ 生成機能の拡張についての話です
┃
┗━ 4.プロンプト(呪文)
プロンプトが生成内容に与える影響と生成例です
主なイメージ生成AI
2025以降
・有象無象がにょっきにょきなので、主なもののみ
・トレンド:「商用利用の安全性」「ローカル実行とカスタマイズ」「映像・短尺コンテンツ」「デザインツールとの統合」「合成データの倫理・規制」
大手
サービス | 生成画像の得意分野 | 得意分野と現在のトレンドとの関連性 |
---|---|---|
Midjourney | アーティスティックでスタイリッシュなイラスト、幻想的/映画的表現 | アート寄りのブランディングやSNSコンテンツ需要が高く、ジェネレーティブアートの展示やNFT系表現とも親和性がある。ビジュアル表現の“作家性”志向と一致。 |
DALL·E 3(OpenAI) | 高解像度で多様なスタイルの合成写真・イラスト、テキスト指示の忠実再現 | テキスト→画像ワークフローの標準化が進行中。広告やプロトタイピングで指示通りの結果を短時間で得られる需要に合致。生成物の安全フィルタリングも注目トピック。 |
Stable Diffusion(Stability AI) | カスタマイズ可能なモデル、ローカル実行でのアート系・写真調合成 | ローカル推論・プライバシー志向の高まりとコミュニティモデルの拡張性トレンドに合う。プラグインやLoRAによる専門分野微調整が活発。 |
Adobe Firefly | 商用利用を意識したクリーンな素材、ブランド向けイラスト・テクスチャ | クリエイティブツールへの統合(Photoshop等)でデザインワークフローを変革。商用利用ライセンスや企業採用の流れと整合。 |
Google Imagen / Imagen 2 | 写実的・高品質な合成写真、自然・風景表現に強み | 研究寄りの高品質生成が、広告・ビジュアルリサーチ需要に響く。安全性と説明性の研究トレンドにも密接。 |
Runway Gen-2 | 動画生成および映像編集に最適化(フレーム連続性のある映像素材) | ショート動画コンテンツの爆発的需要(SNS向け)に直結。映像制作の自動化・効率化トレンドと一致。 |
Bing Image Creator | 日常的なイメージ作成、検索連携でのアイデアスケッチ | 検索→生成のシームレス体験が、ユーザーの即時ビジュアライゼーション需要に応える。検索主導のコンテンツ制作トレンドと整合。 |
Anthropic(Claude Image) | 指示に対する安全配慮と整合性を重視した画像生成 | 企業導入でのコンプライアンス重視や安全な出力へのニーズ増加に対応。倫理・規制対応トレンドと一致。 |
Craiyon(旧 DALL·E mini) | カジュアルで軽量なイラスト生成、試作的イメージ | 低コスト・低帯域でのプロトタイピング需要に合致。教育や実験利用の増加トレンドと親和性あり。 |
Stable Video / Synthesia(映像系サービス) | テキスト→映像やアバター動画生成(Synthesiaは人物アバターのプレゼン) | リモートプレゼン・eラーニング・マーケティング用の動画自動生成トレンドにマッチ。スケールする動画制作の需要に応える。 |
ニッチ
サービス | 生成画像の得意分野 | 得意分野と現在のトレンドとの関連性 |
---|---|---|
Artbreeder | 顔やキャラクター合成、遺伝的アルゴリズムによるスタイル混成 | キャラクターデザインやプロトタイプ作成で根強い人気。ゲーム・同人作家の共同制作トレンドに合う。 |
DeepDream / NeuralStyle系ツール | 既存画像へのアート的スタイル転写・幻想的強調 | レトロな「ニューラルアート」需要やビジュアル実験の流行と一致。ノスタルジック表現やエフェクト用途に利用される。 |
GauGAN / NVIDIA Canvas | スケッチ→写実風風景変換、地形や風景のプロトタイピング | 迅速な環境アート制作やゲーム開発でのラピッドプロトタイピング需要とマッチ。クリエイティブツールチェーン統合のトレンド。 |
This Person Does Not Exist / Generated Faces専用モデル | 高精度のフォトリアルな人物顔生成(合成ポートレート) | 個人画像のプライバシー配慮やテストデータ生成、マーケティング素材の匿名化ニーズと整合。フェイク顔の倫理議論も活発。 |
Medical-image-specific GANs(例:医療画像合成モデル) | CT/MRIなど医療画像の合成・増強(データ拡張) | 医療AIのデータ不足を補う手段として重要。規制・倫理・データ品質トレンド(合成データの検証)が焦点。 |
2024前期
Stable Diffusion
- ローカル環境構築可
- 費用について
- 無料(条件付き)
- 画像の利用について
- 無料(条件付き)
- その他
DALL-E3
- ローカル環境構築不可
- 費用について
- 有料でAPIの利用が可能
- ChatGPTの無料ユーザは、1日2枚まで生成可能
- Microsoft CopilotとBing Image Creatorでの利用は基本無料
- 画像の利用について
- 生成した画像は、商用利用可Q&Aへのリンク
- 画像の利用時は、AIによる生成の明示をすることが必要
- その他
- OpenAIが開発
Midjourney
- ローカル環境構築不可
- 費用について
- 無償版は、2023.3.28に停止
- 有償で、web版・Discord版の利用が可能
- 画像の利用について
- 条件付きで商用利用可能
- その他
generative_ai/img.txt · 最終更新: by chokai