最近の生成AIの進化はすごいです。調べ物もそうですが、直近では動画作成の機能アップも各社しのぎを削っています。
今年に入って、まずはGPUを積んでいるゲーミングPCがあるのでStable Diffusionをインストールして試してみたのですが、2年半前のミドル機(GALLERIA XA7C-R36T Core i7 13700F/RTX 3060Ti)だと画像作成もまともに動かすのが難しい処理速度だったため、早々に断念しました。
有料サイトのKLING AI、DeeVid AIを試していたところ、DeeVid AIがSora2に対応してきたため、こちらをメインに使っています。
というのも、Sora2以外のエンジンを選択して作成してみると、なかなかプロンプトに書いたことを正しく理解してくれず的外れな動画を作ったりと、作成クレジットを結構浪費したなと思ったからです。Sora2だと、そのあたりの意図も結構正確に読み取り+独自にも考えてくれます。
とはいえ、作成者側から見て失敗作もそれなりにありますので、クレジットを多めに持っておいて多少の余裕感がないと、作っていてストレスを感じてしまうかもしれません。
僕は思い切って年間契約にして、それなりのクレジットを月ごとに取得して、いろいろとトライをしてみてます。
クレジットは1か月で切れるように見えるので、「AI動画を作らねば」となる効果もあります。最近は写真を撮るときも、「AI動画で面白いものが作れるか」というのも少し基準に入ってきました。
感覚的には、銅像とかは面白い動画が作りやすいです。
先週に北海道に行ってきたので、その写真からいくつか動画を作ってみたので紹介します。
①エスコンフィールドHOKKAIDOホテル 北広島駅前のロビーのセリーグユニフォームが争う動画

プロンプトはこれくらいです。
「この野球チームのユニフォームたちが、仲良くけんかをしている動画を作成してください」
野球チームであることやカープが広島県のチームなので広島弁を使ってくるなど、想像していないことを読み取って動画にしてきました。恐るべしです。
②すすきののニッカウィスキーのおじさんがしゃべる動画
この写真をトリミングして何パターンか試してみました。

プロンプトは「この看板のおじさんがおいしそうにウィスキーを飲む動画を作成してください」です。
下の商品を読み取り、これに沿った話をするなどCMかと思うような内容になりました。こちらも恐るべしです。
商品名を隠したらどうなるのかと思ってやってみたところ、一般的なものにしてくれました。
トリミングせずに作るとこんな感じでした。
③登別地獄谷から鬼が出てくる動画
鬼の銅像がたくさん町にありましたので、奥から鬼が登場するような中身にしてみました。

プロンプトは「この地獄谷から、日本の青鬼赤鬼たちが現れて、観光客が驚いて逃げていく動画を作成してください」です、
最初にできたのがこの動画で、自然でよくできています。
ただ、その後の動画は結構不自然でいまいちなものだったので、なかなかうまく作るのも難しいところです。
④小樽のルタオの前にある犬の銅像が感動的なシーンを生む動画

これが生きている姿に戻って飼い主と再会するシーンがあれば感動的だなと思い、作ってみました。
これも1回目のが一番よくできてました。縦横比を間違えて指定したので縦長にしようと思ったのですが、2回目以降の作品はちょっといまいちでした。
犬の名前は何も指定しなかったので、「ワンワン」と名付けているようです。
⑤小樽の廃線から、ノスタルジックな昔を想像する動画

昔を思い出させるような動画があったら良いかもと思って作成してみました。
プロンプトは「この写真は昔汽車が走っていた小樽の廃線後です。 ここから昔の在りし日にSLが走っている様子に変わっていく動画を作成してください。 線路は単線で、昔の動画はセピア色にしてください。」です。
勝手に複線にしてみたり、途中からセピアの指示を出したりして、何回か作って作成できました。
⑥小樽の運河に、大きなアヒルの人形が流れる動画

プロンプトは「」です。
こちらはかなり失敗作が多くできました。流れている様子を作成したかったのですがうまく動かず、最初の作品が一番自然で良かったかなと。水面への反射など自然ですね。
流すのを強調するとこうなりました。建物が変わってしまっているのでなんだか。。
⑦運河を渡る橋の上にある銅像が演奏して踊る動画

プロンプトは「左側の銅像が音楽に合わせて左右に揺れながら笛を演奏し、真ん中にいる子供の銅像がそれを聞いて楽しく踊っている様子を作成してください。音楽はリズミカルに、周囲の車の流れはゆったりとしたものにしてください。」
銅像は動くだけでおっとなるので、作成しやすいです。が、なかなか演奏が楽しそうにならないので、何回かトライして、プロンプトも長くなりました。
ということで、いくつかAI動画を作ってみました。自然なものができるには、何回か作らせて指示を修正して取捨選択するということが必要になりそうです。(その分クレジットも必要)