文書生活 : TEXT LIFE

文書のある生活

midjourneryはヤバイ技術

最近話題のmidjourneyを使ってみた。Deep Learningを基盤とした技術/仕組みであることは分かる。使ってみると、単純に面白いし、すごいと思える。加えて中々にエポックメイキングな技術だと思う。Google翻訳が最初に世に出た時と同じぐらいの衝撃だった。概要説明は下記の記事が参考になる。

www.itmedia.co.jp

こういう新しい機能はとりあえず使ってみることが大事だと思う。早速登録して使ってみた。すると無料の利用枠(25images/month)をあっという間に超えてしまったので、$10/month MAX 200imagesを課金した。$30/month unlimitedは様子を見てから考えよう。

midjourneyに描いてもらった画像がこちら。与えたkeywordの概要も併記する。全て覚えていないので正確ではないし、midjourneyも日々変わっているので、同じkeywordを入れても同じ結果にはならないだろう。絵柄がAmericanなのは学習データがAmericanだからだと思われる。Deep Learningベースだと思われるので、学習データに依存する割合が大きいだろう。

なので、手塚治虫も画像を学習データに使うと、手塚治虫風の画像を生成することになる。すでに音声/歌声では同じような実験がなされている。例えば既に亡くなった人の音声/歌声を学習データにして「新曲」を歌わせるなど。作曲も同様にできるだろう。ベートーベンの旋律や和声を学習して「新曲」を作るとか。

著作権の問題はあるが)「いらすとや」の画像を学習すれば(データ量が少ない気もするが)新しい「いらすとや」のイラストがその場で生成されることになる。これは驚異的だ。

 

a short hair girl wearing leather jacket, cute Japanese, realistic, detail

 

skinhead Japanese man with round glasses wearing red leather jacket standing on Rocky Mountain old style

 

Kale salad on the table with large dish realistic detail

 

Japanese techno pop band, three people wearing red Chinese suits 

 

Japanese techno pop band, three people wearing red Chinese suits (variation)

 

Doraemon at times square in New York, cyber punk, rainy day under the cloudy sky

 

a beautiful young girl in Johannesburg with long green hair, realistic, detail

 

生成された画像を観ると得手不得手がありそうだが、日々学習データは追加されているだろうから、得手不得手は変化していくだろう。

今後の展開が非常に興味深いので、注目していく。というか、midjourneyを使い続けていこう。