DAW悪戦苦闘記

DAWやMIDIを通じてちまちまとDTMを楽しむ記録+MIDI検定1級到達記

AI活用楽曲をプロがリリースの時代

先週の下記 The Verge の記事は、今偶然にも私自身が色々と自動作曲ツールを渉猟している最中でのニュースだったので、ついに来たかという感慨を深めた一件であった。

www.theverge.com

要は、AIによる楽曲生成ツールを使って曲の断片を作り、独自の工夫によりそれらをつなぎ合わせて完成品に仕上げる手法を採用したとのこと。ご自身はピアノが多少弾ける程度のスキルで、ゼロからメロディを編み出すことはあまり得意ではない、というかそもそもそのようなメロディや作詞ありきのアプローチは以前から採っていないらしく、そのあたりのスキルレベルや自動作曲ツールの使い方に関する基本スタンスは私とよく共通している印象があった。方法論としては今後のAI作曲ツールを使った自主制作で参考にできるかと思う。

数あるツールの中でも本作で中心的な役割を果たしたのは Amper Music なるWeb サービスで、これはどうも以前私が試した Jukedeck とモロ被りするサービスのように見受ける*1

www.ampermusic.com

 

Amper Music については、かのDTMステーションでも3月上旬にレビューされているが、かなり辛口の評価が下されている。このレポートによれば、残念ながらWAVもしくはMP3のみダウンロード可能で、MIDIデータ(SMF)は落とせないようである(この制約はJukedeckと同様)。

www.dtmstation.com

半年経過後の現在でどの程度改良が加えられたか検証する意味でも、後日自分自身で実際に試した上で雑感などを少々書き記すことにしたい。

*1:Jukedeckの試用記事については次の過去記事を参照: AI作曲家のJukedeckに頼む

Magentaによるメロディ生成 (2) Magenta実行環境

前回の続き(かなりマニアックです)。

daw-jones.hatenablog.com

前回記事の最後で触れたように、Magentaの実行環境を構築する方法はいくつか存在するが、私は今回はDockerを使った導入方法を選んだ*1。というのも、これが最も単純明快で、かつ既存環境とのコンフリクト等技術的な罠にはまるリスクが小さいからである。迷っているならばこの方法を推奨したい。

Dockerを使うことによるメリット

Dockerを使えば、Magentaに関わるPython絡みの環境をMac本体の既存環境から完全に分離できるため、導入することによる副作用の心配をしなくて済む。たとえば、新たにPython 2.7系をMac本体に下手に入れると、macOS付属のPython 2.7系と干渉するおそれがあるのだが、Dockerを介したコンテナ環境であればそのような懸念はない。

なので、お手本にするつもりである以下のチュートリアルは、最初の0章(導入章)はスキップして1章からなぞることにする。

qiita.com

Dockerによる導入方法

ラッキーなことに、Magentaの実行環境一式はDockerイメージとしてそのまま落として即利用可能になっている。しかも、本コンテナのダウンロードと起動はdockerコマンド一発でできる。詳細は以下の記事資料を参照されたい(「Dockerを起動する」の節)。 蛇足ながら、本コンテナのイメージサイズは約2.4GBであり、Magentaの起動環境OSはLinux (Ubuntu 16.04.2 LTS) となっていた。

qiita.com

なお、楽曲生成コマンドは現バージョンでは改訂されていることに注意する。上記記事の「作曲してみる」のところは情報がやや古いため、下記本家サイトの最新解説を参照して再確認した方がよいだろう(melody_rnn_generateコマンドを使うシンプルな方式に改善されているようである)。当ブログの主眼であるMIDIデータの生成テストについては次回以降に試そうと思う。

github.com

*1:Dockerはコンテナ技術の代表的な(というかデファクトの)ソフトウエアで、Community Edition は無償利用可能である。詳細については本ブログの守備範囲を大きく逸脱するので割愛する。

Magentaによるメロディ生成 (1) 資料など

夏休みの自動作曲探求シリーズの終章として、AIベースの楽曲生成モデルをできる範囲で実際に試してみたいと思う。これまでは、アプリやWebサービスの形態でお手軽にすぐ使えるツールのみを少々漁ってきたが、ここから先はMIDIの基本や(若干の)Pythonプログラミングの知識が必要とされる。

daw-jones.hatenablog.com

上記記事の予告通り、今回動かしてみるモデルは Magenta とする。環境構築など前準備などが必要になるため、何回かに分けてゆっくり順を追いながらトライしようと思う。

github.com

資料やチュートリアルなど

MagentaはGoogle発のプロジェクトという出自も手伝ってか、おそらくこの手の音楽生成AIでは一番メジャーで、かつ開発も活発であるようだ。そのため、入門資料も比較的数多く転がっており、ここ1年内でも良質な日本語解説記事がQiitaを中心にいくつか投稿されている。なので、細かいテクニカルな話はこれらの優れた記事を引用するにとどめ、このブログではあまりくどくならないように配慮したい。

qiita.com

一番新しい記事では、以下の参考資料がかなり有益そうなので、基本はこれに沿って試行錯誤してみようかと思う。

qiita.com

Pythonの環境に関して

ちょっと厄介なことに、Magentaは今のところ Python 2.7 系しかサポートされておらず、私が普段使っているMac上の3.6系では動かせない。解決策としては、virtualenvを使うか、Dockerコンテナを入れるかして2.7系環境を別途構築する方策がいくつかあるが*1、これについては次回触れる。

*1:macOS付属の Python 2.7.10 環境は下手に弄って破壊すると困るので使わないでおく。

自動作詞作曲ツールのOrpheusプロジェクト

夏休みの自動作曲探求シリーズ第5弾。お手軽ツール編の最後を飾るのは、東大発祥の国産プロジェクトであるオルフェウス (Orpheus) である。

daw-jones.hatenablog.com

オルフェウスはあくまで学術研究プロジェクトであるため、いつまで公開が継続するか未知数であるという不安を抱えるが、もっとも同様の懸念は他のWebサービスでも免れない。

他ブログなどによるレビュー記事も多く、国産日本語ツールゆえに使い方は自明で特段説明を要しないと思うので、逐一操作ステップの解説は省略し、個人的に気づいた注意点と感想だけを述べる*1

www.orpheus-music.org

利用の前準備

利用にあたっては若干の関門がある。すなわち、ユーザ登録が必須で、その際にプロフィールを100文字以上入力しなければならないこと、また人力による承認審査を受けるせいで登録完了・利用開始までに最低1日を費やすこと、である。どうも過去に2chユーザから目を付けられ散々嬲られた経緯があり、荒らし・濫用対策に神経を使っているようである。

あと、同サイトはSSL/TSLによる暗号化をサポートしていないなど、セキュリティ面で不安がある人は使わない方がいいかもしれない。あくまで学術研究サイトだから商用サイトほどの厳密なセキュリティ管理は期待できないので念のため*2

作詞ありきのツール

このツールの最大の特徴は、自動作曲のための主たるインプットが日本語歌詞であるという点だ。すなわち、歌詞を言語解析した結果を作曲合成のための下地として用いる。しかし、一からオリジナルの詞を作るのはなかなか難しいので、言語処理精度に限界はあるものの、キーワード指定による自動作詞も可能となっている(ユーザによる編集可)。

なお、歌詞は楽曲生成時に初音ミクばりの合成音声でそれなりの抑揚を付けて歌ってくれる。内外の数ある自動作曲ツールでもここまでやってくれるのはおそらくオルフェウスだけであろう。

自動作曲

作詞が完了したら、あとはもう「自動作曲」のボタンを押下するだけとなるが、まともな結果を得るにはやや面倒な手順を踏む必要がある。

初期設定スタイル

基本の作曲モチーフとして、「初期設定スタイル」を指定する必要があるが、これが実に500種類ほどもあって判断に迷う。とりあえずシステム側で自動的に(おそらくランダムに)設定されるスタイルをそのまま選択してもよかろう。

楽曲構成の決定

スタイル設定後に、楽曲の大まかな構成をパラメータとして指定する必要があるが(下例参照)、これはある程度以上の音楽理論等の知識を要求するため、ズブの素人だと無理とは言わずとも、結構煩雑かつハードルが高いように感じるかもしれない。完全にシステムお任せでもいいのだが、たぶんそれだと一定レベル以上の品質*3の楽曲は生成できないようである。

f:id:daw_jones:20170819200250p:plain

MIDIデータ

公開共有した楽曲に関しては、他同種のサービス同様にマルチトラックのSMFをダウンロード可能である。珍しいことに、チャネル10のリズム・トラックについては、各楽器パーツごとにパラアウトして別個のトラックに書き出している。 

私的雑感: これは案外上級者向けか

作詞から入るというモデルはなかなかユニークとは思うが、個人的にはかえって複雑化したという印象がある。作曲だけでさえ難しいのに、全然別のスキルである作詞までもわざわざ呻吟せねばならぬとはキツイ。たとえば、技術点をクリアできない等生成楽曲に満足できない場合、楽曲の構成パラメータのみならず、結局のところ元の作詞からやり直しを迫られるという厳しい一面もある。

あと自明なこととして、学習データがNHK紅白歌合戦で演奏された楽曲であることから、生成結果は大なり小なり典型的な歌謡曲っぽいものばかりになるという傾向というか限界がある。それを承知の上ならば、歌謡曲生成機としては使える。または、もう旬は過ぎたかもしれないが、ボカロ曲生成ツールとしても使い道はありそうだ。

しかしどう使うにせよ、自動作曲と言いつつも、ユーザ側にある程度の作曲の素養がないと使いこなすのが難しいというちょっと矛盾した性格を持つツールであるように感じられた。

*1:機能詳細はマニュアル・ページを参照。

*2:登録番号 (ID) を申請する際に指定した返信用メールアドレスの管理や扱いがどうなっているのかやや心配ではある(捨てアカ使用が無難か)。

*3:技術点1.0以上で公開可能と判断される作品。ちょっと触ったぐらいではなかなか超えられない。

AI作曲家のJukedeckに頼む

夏休みの自動作曲探求シリーズの第4弾。

daw-jones.hatenablog.com

今回は、真打登場というべきか、AIを駆使した最新技術による自動作曲サービスのJukedeckを試すとする。

www.jukedeck.com

使い方

まずユーザ登録が必須で、サイト訪問時に最初に表示される画面の右上"Make"ボタンよりサインアップ(登録)する。IDは任意のメールアドレスを指定する。

f:id:daw_jones:20170813163036p:plain

楽曲生成のためのパラメータ指定

ユーザ登録完了後、右端の"Create a track"ボタンを押すと、新規に楽曲を生成するためのパラメータ設定画面に遷移する。

f:id:daw_jones:20170813163521p:plain

指定パラメータは、下図の通りにほとんど自明なものだけなので説明を要しないと思うが、一点特徴的なのは"Climax"ボタンで、これは一番盛り上がるサビの部分をどのタイミングで挿入するか、を決めるための機能である。動画用BGMの編集に重宝するパラメータだと思われる(詳細は解説ページを参照)。

f:id:daw_jones:20170813163749p:plain

生成された楽曲のダウンロード

高々1分程度待つと生成完了となり、"My Tracks"ページにサムネイルが追加される(下図参照)。あとは"Download"ボタンを押下するだけでダウンロードが終了する。ただし、落とせるフォーマットは基本的にはMP3のみである(後述)。現バージョンではMIDIデータは利用できない。

f:id:daw_jones:20170813164728p:plain

権利関係について

ライセンスについては下図に示すような3プランが用意されている。または、ライセンス案内ページを参照されたい。

f:id:daw_jones:20170813160917p:plain

生成された楽曲の使用ロイヤルティは無料だが、著作権はJukedeck側が保有している点に注意する必要がある。著作権ごと入手したい場合は、今のところ$199を支払うことになる(一番右の"Copyright"プラン)。

また、お友達紹介でゴールド・メンバーの権利を確保しない限りはWAVでは落とせず、MP3*1のみとなる。

以上は、システムで生成された2ミックスの音源丸ごと使う場合であるが、耳コピで主要モチーフだけを流用し、DAWで独自に換骨奪胎アレンジした場合はもはや出所もわからず、かなり曖昧である。穿った見方をすれば、MIDIを書き出さないのはそうしたタダ乗り流用のハードルを上げるため、とも解釈できなくはない。

いずれにせよ個人ユースでは一切無料で楽しめるから別段不満はないが、果たしてプロがお金を落としてくれるかどうかはまた別問題である。

個人的な印象と残念なところ

生成楽曲は、若干単調ではあるにせよ意外にも音質は悪くなく、動画BGM程度であればそのまま使えそうである。もう既に方々でレビューされているのでここにサンプル楽曲を掲載することは控えるが、あまり悪い評価は目にしたことがない。

ただし、個人的にはドラム・パーカッションがちょっと弱いという印象を受ける。シンセもありがち、というか割と常識的な音色で物足りず、独立した音楽作品としてはもう一歩二歩の編集を加える必要性を感じる。むろんプロであれば、おそらくもっと突っ込みどころはあるだろう。しかし一方、上述のように目立たないBGMならばこれで十分かと思う。ある意味YouTuber御用達とでも言おうか。

楽曲自体はともかく、私が非常に落胆した点は、やはりMIDIデータを落とせないというところである。上で少し触れたようにビジネス上の深謀遠慮があるのかもしれないが、せめて有料プランではMIDIデータのダウンロードもできるようにして欲しいと思う。現時点では耳コピしてDAWで編集するしかないが、そんな面倒なことをやるぐらいならばMIDIを落とせる他のアプリやサービスを使う方が手っ取り早い。

技術的には最先端で正に音楽業界のdisruptorだが、しかしJukedeckのビジネス・モデルに関しては少々危うさを感じなくもない。というのも、オープンソースの流れもあって、AI機能自体は些かコモディティ化の傾向が見えてきており、Jukedeck同様の機能を搭載した比較的安価なプラグインなどが登場したらひとたまりもないからである*2。あるいは、それこそオープンソースのプロジェクトが競合してきたらどうなるだろう。Magentaプロジェクトはその筆頭格だが、これについてはまた追って取り上げたい。

*1:私が試しにダウンロードしたものをチェックした限りではビットレート192kbpsであった。

*2:AIというわけではないにせよ、Waveformのコード進行ヘルパーなどにはその萌芽が見られるように思う。

MIDIとMIDI検定に想いを馳せる盆休み

昨日掲載の「DTMステーション」の以下記事は、しみじみしながらも興味深く読んだ。

www.dtmstation.com

 

過去にも書いたことだが、DAW隆盛の現在でもMIDIは依然として楽曲制作の上で中核を成す技術であることに変わりはない。DAWの登場でMIDIは過去の遺物と化した、といったごとき論調もごくたまに目にすることはあるが、もちろんこのような認識は単なる誤解に過ぎない。

しかし、主たる表現手段がDAWのオートメーション機能などに移ったことや、GM音源の活用が廃れたこともあって、かつてのDTM打ち込み全盛期に比べれば影が薄くなったことは否めないと思う。

ただし近年になって再び脚光を浴びるチャンスが到来している。すなわち、AIによる自動作曲の研究が盛り上がりを見せているという状況である。インプット学習用のデータとして、または生成結果や再生用の標準フォーマットとしてMIDI(正確にはSMF)がよく使われているようである。なので、枯れて安定した技術仕様としての強みを発揮しつつ、さらに活躍の場を拡げる余地はまだまだあると思う。

またAMEIといえばMIDI検定だが、世間一般の人は次のような感想を抱いて当然だろうと思う(以下引用):

MIDI検定のような公的なものを通じて情報共有されているのはちょっと意外で面白く感じました。MIDI検定は20年近く実施されていると伺いましたが、これがMIDIの発展にどう寄与するのかというのも気になるところです

皮肉にも、DAWをも取り込んだ2012年の試験制度改訂以降に受験者があまり増えていないのは気になる。所詮は業務独占資格ではないので、実利性がないことを敬遠されている節もあろう。逆に旧制度下で今では考えられないほど多くの受験者数を誇っていた理由はよくわからないが。

しかし、MIDI規格を系統的に習得する学習課程としては、MIDI検定のカリキュラム以上のものは現状ないと思われる。そこはさらに強く押し出してもいいメリットのはずで、もっとアカデミア(音大や専門学校のみならず音響工学系の大学学部なども含む)とその学生にアピールした方がいいだろう。私のようなごく少数の物好きな趣味人を除けば、社会人は実益が見込めない資格など見向きもしないわけで、一般向けに広く浅くアピールしても認知度アップには結びつかないと思う。

とりあえず命拾いのSoundCloud

昨日来TechCrunchなどでちらほらと報じられていたように、SoundCloudがVCや投資ファンドから追加資本を得て当面はなんとか食いつなげる道筋をつけたようである。

jp.techcrunch.com

 

マネタイズのための仕組み化と販促が最大の経営課題だろうが、40%解雇という大規模リストラの直後なので、残った社員の士気やモチベーションをどう維持していくかという組織運営上の問題もあり、なかなか前途多難だろうと思う。

新CEOは元VimeoのCEOということで動画分野への進出も憶測として取り沙汰されているように見受けるものの、それをやると経営リソースを分散させてしまう上にYouTubeと真っ向勝負になって勝ち目がないので、たぶんないだろう。

私のようなカジュアル・ユーザが一番懸念するのは、収益化重視に伴って有償プランがどこまで拡大されるか、という一点に尽きる。無償プランの許容範囲がまともに使えないほどに狭まると、じゃぁYouTubeでいいや、ということになってしまい、ユーザが離散してしまうジレンマを抱える。