※当記事の下線部はリンクが添付されています。(記事やSNSリンクなど)
当記事は5分程度で読めます。
このメルマガは、akiが独断と偏見で選んだニュースをお届けします。
今回は「Stable Diffusionで何が出来るのか?」について少しだけ紹介します。
最近のAIは進化が速いので、Stable Diffusionで何が出来るかの情報は日々更新されていきます。
今後もTwitterやメルマガ、stand.fmで発信をします。メルマガの登録、SNSのフォローをよろしくお願いします。
Twitter :@aki_039
stand.fm:AI | Web3 @あきラジオ
目次
1.Blenderで動作するAI搭載拡張機能
2. 脳の機能活動から、被験者が見た画像を再構築
3. ゲームの背景をAIが作成
4.終わりに
1.Blenderで動作するAI搭載拡張機能
Stable Diffusionの開発元であるStability AIが「Stability For Blender」を公開しました。Blenderで動作するAI搭載拡張機能です。
現在、無料で3つの機能が使えます。
①Blenderで作成した画像を元に好みの画像を生成
②テクスチャの画像からリアルなテクスチャを生成
③アニメーション生成
それぞれ見ていきましょう。
①Blenderで作成した画像を元に好みの画像を生成
Blenderで画像の下描きをサクッと作成し、その下描きを元に好みの画像を生成できます。
この時、画像生成はStability AIのサーバー上で実行されます。
つまり、高性能GPUを搭載していないPCでも画像生成機能を利用可能です。
引用:Gigazine
②テクスチャの画像からリアルなテクスチャを生成
Blender(ブレンダー)におけるテクスチャとは、3Dモデルを制作した後にモデル表面に接着する模様のことを指します。
粘土工作などをイメージするとわかりやすいです。粘土で何かを作った後の表面に、絵の具で色をつけるイメージですね。
生成されるテクスチャは、Stable Diffusionと同様にプロンプト(テキスト)によって変化させられます。
こちらのテクスチャ生成も、Stability AIのサーバー上で実行されます。高性能GPUの搭載は不要です。
Stability For Blenderを使えば、以下の画像左側のようなラフ画像から右側のようなリアルなテクスチャを生成できます。
引用:Gigazine
③アニメーション生成
通常、Blenderでアニメーションを作成するには、モデルの動きを手動で設定する必要があります。
Stability For Blenderは、再生時間とプロンプトを入力するだけでアニメーションを生成可能。素早くアニメーションを生成ができるので、アイデア出しに活用できそうですね。
余談
Stable Diffusionではありませんが、Blender用のChatGPT-4も出ています。
時代の変化の速さがとてつもないです。

2.脳の機能活動から、被験者が見た画像を再構築
脳の機能活動から画像生成AIのStable Diffusionを使い、被験者が見た画像を再構築することに成功
ぶっちゃけ、どの記事を読んでも内容が難しすぎました。専門家でない限りは多くの情報は不要なので、簡潔にまとめていきます。
磁気共鳴機能画像法(fMRI)を使用して脳の活動を画像化します。
fMRIは、脳内の活動部位を測定する方法です。
fMRIで測定した脳の機能活動から画像生成AIのStable Diffusionを使い、被験者が見た画像を再構築するという流れ。
簡単に言うと、
・脳の活動を捉える→活動を視覚化(装置を使用)→Stable Diffusionを用いて画像化
です。
実例を見てみましょう。
上→実験参加者に見せた画像
下→fMRI信号から拡散モデルが生成した画像
引用:AI+by ITmedia NEWS
思っていたよりもだいぶ画像化されていますよね。ぼくも実例を見たときに驚きました。
脳の活動から画像化までを簡単にまとめます。
①人間が目や耳で何か認識、イメージをする
②脳細胞の活動が活発になる
③その部位の血流が増加する
④fMRIで血流増加による磁気の変化を捉える
⑤脳の活動部位を視覚化できる装置で測定をする(外科手術は不要)
⑥Stable Diffusionを用いて画像化
上記のような流れで脳の活動から、情報を画像化します。
視覚体験は「映像特徴」と「文章的な意味特徴」で構成されています。
この2つを組み合わせ、Stable Diffusionを用いて画像化する感じです。
見ている夢を画像で視覚化できる可能性もあるそう。
研究者は、「今回の研究は人が考えていることをそのまま視覚化するような技術ではない」と念押ししています。
脳の情報を十分に解読する技術が「すぐに」実用化されることは考えにくいそうです。
まあ、自分の頭の中のイメージがすべて視覚化されたら怖いですよね。
プライバシーの問題もありますし。
参考記事👇
https://www.itmedia.co.jp/news/articles/2303/08/news059.html
3.ゲームの背景をAIが作成
Stable Diffusionで2DのRPGの背景を作成
こちらの内容は、Stable Diffusionだけでなく他のソフトも使用しています。
・AUTOMATIC1111
・alpaca(Photoshopで動かすプラグイン)
・Boosting Monocular Depth
・Adobe Substance 3D Designer
・URP(Unity Universal Render Pipeline)
・Amplify Shader Editor
一応リンクを付けていますが、すべてを見る必要はありません。
Stable Diffusionだけでなく、結構色々なソフト使用するから初心者にはハードル高いよって言うのをお伝えしたかったわけです。事例として紹介しました。
詳しく知りたい!という方だけ、下記の記事を読んでみてください👇
https://gigazine.net/news/20230303-how-develop-game-stable-diffusion/
4.終わりに
最後まで読んでいただき、ありがとうございました。
このメルマガは、akiが独断と偏見で選んだニュースを適宜お届けします。
今回は「Stable Diffusionで何が出来るのか?」について、いくつか事例を紹介しました。
akiからのお願いがあります。AIの最新情報を追いすぎないようにしてください。
ChatGPT、Stable Diffusion、Midjourneyぐらいで良いと思います。
このメルマガも興味があるところだけ見てもらえればいいです。
「AIの最新の情報が追えていない!」と焦りを感じるのは危険です。この焦りはFOMOといい、Cryptoの世界だと詐欺にあったりNFTなどを高値掴みする原因になります。
特にメルマガとかで「毎日○○の最新情報をお届け!」みたいなのは危険です。まだTwitterなら良いとおもいますが。
毎日系のメルマガは内容も薄くなるし、無駄に多くの情報が入ってくるので良くないです。
しかも、「記事を紹介するだけ」「前日の出来事の他人のツイートを貼っているだけ」とかのメルマガは終わってます。
口が悪いので、これ以上はやめておきますね。
こんなこと言いつつ、Twitterでは気になった情報を毎日シェアしています。
気まぐれで見に来てください(いいねとか喜びます)
Twitter :@aki_039
stand.fm:AI | Web3 @あきラジオ
ぜひ、メルマガをTwitterでシェアしてください!