第3回 AI・人工知能 EXPO を音楽関連に絞ってレビュー


本日第3回 AI EXPOに参加してきました。

本来レビューするつもりはなかったのですが、いくつかAI x 音楽の観点から気が付いた事を(誰も取り上げないと思いますので)書きたいと思います。

まずは、会場すごい人でした!
AIの注目度がわかる人、人、人、、、と。
これは相当な来場者があったのではないかと思います。
そして会場入り口に来年の出展の申し込み受付があったのですが、もうほとんど埋まっている状態、、、すごいです!

さて、各社の出展内容ですが、画像認識系と、チャットボット系が多くを占めている様に見受けられました。

画像認識系は各社それぞれが独自性を競う、チャットボット系はコモディティ化していくのか、低価格のサービスが早くも散見される状態だったと思います。
この辺りは他の専門メディアもお伝えすると思いますので我々は音楽系を。


Crimson Technology社のヒーリングミュージック生成サービスとvoidol

自動ヒーリングミュージック生成のサービスとリアルタイム音声変換ソフトのVoidolを発表したCrimson Technology社(東京都世田谷区)

ヒーリングミュージック生成は、以前ご紹介したEndel
https://canplay-music.com/2019/03/23/endel-warner/
などもあり、最近複数のサービスが立ち上がっています。

実は我々の研究でもその結果が出ており、講義でも研究会でも発表しているのですが、ヒーリングミュージックとAI自動生成の相性はかなり良く、現状一般向けの音楽としてはもっとも製品化に向いているジャンルだと思っております。

それは他社にとっても同様な様でまずは各社、ヒーリングから取り組んでいるという事なのでしょう。

今回のCrimson Technology社に関しては、生成のアルゴリズムに群知能
https://ja.wikipedia.org/wiki/%E7%BE%A4%E7%9F%A5%E8%83%BD
を活用しているとの事。
群知能で音楽生成というのは正直びっくりしたというか意外だったので非常に興味をそそられました。
私が群知能について知識不足(興味不足)だった事もあるかと思いますが、これを機会に研究してみたいと思います。

実は我々もヒーリングミュージックの生成AIアルゴリズムはある程度完成していて、制作自体はできているのです。
https://soundcloud.com/yoshihiro-saito/deep-blue-on-the-water-ai-generated-healing-music
アプリや、サービス展開は現状考えていませんが、4月の半ばまでにはAIで生成したヒーリングミュージックの音楽配信を計画しています。

我々の宣伝ではなく、AI EXPOのレポートでしたね、、、

次はリアルタイム音声変換ソフトのvoidolです。

数日前丁度、取り上げた記事をアップしておりますので是非ご一読を

リアルタイム音声変換ソフト、Voidol Mac版が本日より960円で発売開始!
https://canplay-music.com/2019/04/03/voidol/

会場のデモでは女性のアシスタントさんの声を鷹の爪団の吉田くんに変換!

ほぼ完璧に吉田くんの声になっていてびっくりしました。

レーテンシーは70msecとの事なので慣れや調整は必要だと思いますが、vtuber用途として非常に魅力的な商品だと思います。

我々も音声変換のプログラムを色々作成し実験していますが、製品化の難しさはしているので拍手を送りたいと思います。

今後音声変換はどんどん進化する要注目分野です。
実用化された際には音楽制作に与えるインパクトは絶大だと思います。



AIで架空のリアルなアイドルを作る事のできるサービスGENE A.I.DOLS

次はAIで架空のリアルなアイドルを作る事のできるサービス
GENE A.I.DOLSです。

https://gene-aidols.io

AIで実際には存在しないリアルなアイドル画像を作成できるサービス。
画像のアイドルは全てAIで作られた架空の女の子、なのだそうです。
実際にこれを自分で作成できたらすごいですよね!

この春にはローンチとなっておりますのでもうすぐでしょうか?

会場ではウェブサイトと簡単な紹介動画が展示されていたのみでまだ自分で試す事はできなかったのですが、ローンチしたら是非使って見たいと思っております。



超高性能GPU TESLA V100を複数搭載したディープラーニングワークステーション
次は多量の音楽データの学習に必須、未来の音楽機器の一つ?高性能GPU搭載のディープラーニング用のワークステーションです。
自動作曲など、未来の音楽制作を志す方はGPU関連の最新動向をチェックすべき時代が来ていると思います。

これも先日に記事にしたTESLA V100を複数搭載したNVIDIAのGDXシリーズ
https://canplay-music.com/2019/04/02/nvidia-gdx/
の実機を見て触ってきました。(学習はさせてません)


最上位機種のGDX-2(5500万円)は残念ながらありませんでしたが、画像のGDX-2。思ったより小さい。
しかしながら中身はTESLA V100を8基搭載で1600万円!
消費税や納品時のサービス料金を含めると2000万円!というディープラーニングモンスター。
目の前にあるこの機械は車のTESLA MODEL Sと同等の価格、、、と思うと触れる手が緊張してしまいます。

TESLA V100を4基搭載のGDX STATIONは中身をオープンの状態で展示。
1基100〜150万円のTESLA V100を4基搭載で価格は600万円以上!
なかなか見られないTESLA V100が4基搭載されている画像です。


目の前に見ると、価格関係なく導入してしまいたくなるのはディープラーニングに関わるものの夢のマシンだからでしょう!
いずれはTESLA V100を使用して音楽データの作成!、、、と成りたいところですが、その頃には日進月歩でさらなる高性能GPUが出ているのでしょう。


いかがだったでしょうか?

けっして音楽が中心のAI EXPOではないわけですが、この先の動向を予測するためにも見るべきものが多かったと思います。
レポートするつもりであれば、もっと詳細にインタビューなどもすべきだったと思うのですが、それはまた次回に。

今後も(おそらく唯一の)AI音楽情報発信メディアとしてを情報収拾&提供を頑張ります。