画像生成AIでは沢山のGPUメモリがあったほうが有利だそうです。
最近?は使用メモリの最適化が行われており4GBのグラフィックボードでも生成が出来るようになったようです。
そして入門用途として「Stability Matrix」を使用することで環境構築の難易度は低くなりました。
参考:これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」
そろそろ情報が出揃い始めたと思うので、生成AIのお勉強をしようと思いました。
購入はY!オークションで未開封の新品中古です。
付属品がほぼ無い
外箱表
外箱裏
外箱開けると内箱
内箱開けると付属品の箱
付属品一式
本体表
本体横
本体裏
ゲーミングとしての性能はそれなり
使用しているディスプレイは古い・・・というか、ゲーミング用途ではないので垂直同期が遅いです。
そのようなディスプレイの場合は垂直同期の設定をオフにすることでパフォーマンスが改善されるようです。
まずはGPU-Zから。
PCIe x8 なのはマザーボードの仕様。実際は x16 対応なのかわからない。
Steamの3DMARK DemoからTIME SPYを実施。
ファイナルファンタジーXIV: 暁月のフィナーレ ベンチマーク(解像度は2k)
SCORE: 20902
平均フレームレート: 151.4541
最低フレームレート: 61
評価: 非常に快適
FINAL FANTASY XV WINDOWS EDITION ベンチマーク(解像度は2k)
Blender Benchmark v4.0.0
グラボのレンダリング速度をスコア化するベンチマークです。
下記画面のプルダウンでグラフィックボードを選択しないといけません。デフォルトはCPUが選択されています。
結果。
オンライン結果を見ると、12%付近の位置にいる模様。
0%が一番スコアが高い位置。100%がスコアが悪い位置。
グラフ表現が最小から最大になっていくのではなく、最大から最小になっている点に注意。
下の項目で生成AIを利用するとGPU使用率が100%使用になるのですが、温度は60℃~62℃付近で張り付きます。
ただ、その割に冷却ファンの音がとても静かな印象です。
CPUをぶん回したときのCPUクーラーのほうがうるさいくらい。
大きなヒートシンクと3連ファンで最大温度を一定に保ちつつ非常に良いです。
アイドル時のGPU温度は30℃付近ですが、そのときはファンが停止状態です。
なお、環境としてはPCケースを使用していません。検証用まな板で稼働させている状態でファンの音が静かと評価します。
ハローアスカベンチマーク(Hello Asuka Benchmark)の結果を出そうとしましたが、使用モデル「nai.ckpt」の取り扱いが怪しいと判断したため見送りました。
ベンチマークとする以上、使用モデルは統一しないと意味が無いと判断します。
参考1:https://chimolog.co/bto-gpu-stable-diffusion-specs/
自分用の専門用語などのメモ
初心者さんとして、ほぼゼロベースの知識で始めています。
・Stable Diffusionにおける「モデル」について
オリジナルの画像を生成するための学習済みファイル
モデルを切り替えることで得意分野となるジャンルや特性を変更可能。
ローカル環境(またはGoogle Colab等)を利用することで追加学習が可能。
・LoRA(Low-Rank-Adaptation)
特定のモデルに対して追加学習を行ったファイルまたはツール
・Step(Sampling Steps)はノイズ除去(画像の書き込み)を行う回数
・Scale(CFG Scale)はどの程度プロンプトに従うかの度合い。最適な値は一般的に「7~10」。
StepとScaleの参考:https://seesaawiki.jp/nai_ch/d/Step%a4%c8Scale%a4%cb%a4%c4%a4%a4%a4%c6
・Stable Diffusion WebUIを日本語化する手順
下記を参考にしました。
https://happy-shibusawake.com/webui-localinize_to_jp/1730/
・モデルの説明文を一覧化したもの
ローカル内で画像生成出来るStable Diffusionをやってみた
手軽に行いたいためWindows環境で「Stability Matrix」を使用しました。
参考:これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」
「Stability Matrix」からモデルの追加は出来るのですが、下記サイトから最新版や使いたいものを選んでダウンロード出来ます。
モデルデータによって異なりますが、1つあたり4~8GBくらいあります。
モデルデータ置き場はシンボリックリンクを作成しファイルコピーせず参照元を統一させるほうが効果的だと感じます。
モデル追加の際にはAPIキーが必要になります。
CivitAIにてユーザー登録してAPIキーを取得後、キーを貼り付けて連携させることになります。
ユーザー登録の際に利用規約が出るので、日本語翻訳などして必ず確認したほうがよいと思います。
プロンプト(呪文)の内容によっては性的な表現を含むものであったり、二次創作に近い元ネタがわかるようなものが生成されるため、 公開時には一定の知識やモラルが必要 だと考えます。(概ねはAI関連サイトの利用規約に書いてあるとおりかなと)
ただ、ローカル内でひっそりと楽しむのは自由だと思います。これ以上は言わずもがな。
参考3:【YOUTUBE】生成AIで芸能人の顔を使って新たな自分物画像を作るのは法的にあり?
最初は下記のグラフィックボードで生成していたのですが、1枚に3分くらいかかっていました。
このグラフィックボード(RTX 4060 Ti)で同じ条件だった場合、1枚2~3秒くらいで生成されました。
10枚くらいまとめて生成ガチャを行い良いものを選ぶ感じ、問題あればプロンプトの呪文を変更したりネガティブプロンプトを変更してみたりして生成を繰り返す感じになります。
まだ利用していないのでよくわかっていませんが、LoRAを使えばイメージに近い画像が生成しやすくなるのでしょう。
Stability AI公式の「768-v-ema.ckpt」モデルを使用して猫を生成してみた。
(何度も試行錯誤しているので、正直プロンプト内容を覚えていない)
結構リアル
本当にガチャなので、部位欠損していたり尻尾などの部位が複数あったりとか色々発生します。
このような画像が文字を与えただけで数秒で作成されてしまうので、物凄い時代です。
生成ワードの与え方や学習機能を併用すると高確率で精度の高いものが出来てしまうのでしょうね。
-
購入金額
65,780円
-
購入日
2024年03月22日
-
購入場所
Y!オークション
ZIGSOWにログインするとコメントやこのアイテムを持っているユーザー全員に質問できます。