AI技術により超高精度な歌声合成を実現と発表

AI技術により超高精度な歌声合成を実現
~バーチャルシンガーの歌声は人と区別できない時代へ~


株式会社テクノスピーチ(所在地:名古屋市千種区、代表取締役:大浦 圭一郎、以下 テクノスピーチ)と国立大学法人名古屋工業大学 国際音声言語技術研究所(所在地:名古屋市昭和区、代表:徳田 恵一、以下 名古屋工業大学)が、人間の声質・癖・歌い方をこれまでになく高精度に再現できる歌声合成技術を開発したと発表しました。
(下記リリースページで歌声サンプルを聞く事もできます)

https://www.techno-speech.com/news-20181214a

発表によると、
テクノスピーチと名古屋工業大学は共同で音声合成・歌声合成技術の研究・開発に取り組んでおり、これまでに業務用カラオケ機器「JOYSOUND」や音声創作ソフトウェア「CeVIO Creative Studio」等に音声合成・歌声合成技術の導入を進めてきたそうです。

ディープラーニングの学習データとして、特定の歌唱者の約2時間の歌声データを使用したとの事。
これにより、歌唱者の声質・癖・歌い方を学習し、合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成できるとの事です。
どの様なデータを、どの様に学習させたのか、また汎用的にあらゆる歌唱者に対応できるものなのかなど、非常に興味が湧いてくるところです。


CeVIOウェブサイト
http://cevio.jp/
リアル度は上かもと感じますね。
しかもボカロよりも安価です。


これまでの代名詞と言えるヤマハのボーカロイドも5で劇的な進化を見せました。
下記に弊社作成のサンプル音源があります。



今夏にマイクロソフトが発表した
AI女子高生タレントりんなもすごかったです。
制作への応用がどれだけできるのかはこれからかもしれませんが。
リアル感は抜群です。
下記にてご視聴を。

今後歌声合成の分野の進化はAIにより加速していくのではないでしょうか。
この先は楽器分野でのモデリングや音色合成なども進化があるはずで、それもまた音楽制作には大きな革命と(自動作曲以上のインパクトがあるかもしれません)なりそうです。
引き続き最新情報を追い続けるとともに、活用方法についてもアイディア練って行きたいと思います。