音楽ディープラーニングライブラリー「Magenta」が1.1.2へバージョンアップ

自動作曲などを行うGoogleの音楽ディープラーニングライブラリー「Magenta」が1.1.2へバージョンアップしました。

変更内容は
・必須のTensorflowバージョンが1.13以上へ
・onsets_frames_transcriptionのバグ修正
あたりの様です。

PIPインストールは
Magenta 1.1.2
https://pypi.org/project/magenta/

Magenta GPU 1.1.2
https://pypi.org/project/magenta-gpu/

onsets_frames_transcriptionとは

onsets_frames_transcriptionとは、ピアノ演奏のオーディオデータからAIにより音符データを取り出しMIDIデータを生成するモデルです。

今回その中で発生していたいくつかのバグが修正された様です。
データ生成に重要であろう推論を担当する部分にtf.expand_dimsという新たなメソッドが追加使用されています。
これが1.13から新たに追加されたメソッドと思われ、そのためのtensorflow必須バージョン変更だったのかなと考えられます。

tf.expand_dimsはtensorに次元を1つ加えるtensorflowの関数です。
https://www.tensorflow.org/api_docs/python/tf/expand_dims

現在ある引数のうちdimに関しては廃止予定との事ですね。
onsets_frames_transcriptionでもその引数は指定されていませんでした。
将来を見越しての事でしょう。

onsets_frames_transcriptionについてはcanplayの講義や研究会でもすでに発表しておりますが、また何か実践してみようと思います。

投稿日:2019/6/8

コメントを残す

メールアドレスが公開されることはありません。