DAW悪戦苦闘記

DAWやMIDIを通じてDTMを楽しむ記録。MIDI検定試験にもチャレンジするなり。

AI作曲家のJukedeckに頼む

夏休みの自動作曲探求シリーズの第4弾。

daw-jones.hatenablog.com

今回は、真打登場というべきか、AIを駆使した最新技術による自動作曲サービスのJukedeckを試すとする。

www.jukedeck.com

使い方

まずユーザ登録が必須で、サイト訪問時に最初に表示される画面の右上"Make"ボタンよりサインアップ(登録)する。IDは任意のメールアドレスを指定する。

f:id:daw_jones:20170813163036p:plain

楽曲生成のためのパラメータ指定

ユーザ登録完了後、右端の"Create a track"ボタンを押すと、新規に楽曲を生成するためのパラメータ設定画面に遷移する。

f:id:daw_jones:20170813163521p:plain

指定パラメータは、下図の通りにほとんど自明なものだけなので説明を要しないと思うが、一点特徴的なのは"Climax"ボタンで、これは一番盛り上がるサビの部分をどのタイミングで挿入するか、を決めるための機能である。動画用BGMの編集に重宝するパラメータだと思われる(詳細は解説ページを参照)。

f:id:daw_jones:20170813163749p:plain

生成された楽曲のダウンロード

高々1分程度待つと生成完了となり、"My Tracks"ページにサムネイルが追加される(下図参照)。あとは"Download"ボタンを押下するだけでダウンロードが終了する。ただし、落とせるフォーマットは基本的にはMP3のみである(後述)。現バージョンではMIDIデータは利用できない。

f:id:daw_jones:20170813164728p:plain

権利関係について

ライセンスについては下図に示すような3プランが用意されている。または、ライセンス案内ページを参照されたい。

f:id:daw_jones:20170813160917p:plain

生成された楽曲の使用ロイヤルティは無料だが、著作権はJukedeck側が保有している点に注意する必要がある。著作権ごと入手したい場合は、今のところ$199を支払うことになる(一番右の"Copyright"プラン)。

また、お友達紹介でゴールド・メンバーの権利を確保しない限りはWAVでは落とせず、MP3*1のみとなる。

以上は、システムで生成された2ミックスの音源丸ごと使う場合であるが、耳コピで主要モチーフだけを流用し、DAWで独自に換骨奪胎アレンジした場合はもはや出所もわからず、かなり曖昧である。穿った見方をすれば、MIDIを書き出さないのはそうしたタダ乗り流用のハードルを上げるため、とも解釈できなくはない。

いずれにせよ個人ユースでは一切無料で楽しめるから別段不満はないが、果たしてプロがお金を落としてくれるかどうかはまた別問題である。

個人的な印象と残念なところ

生成楽曲は、若干単調ではあるにせよ意外にも音質は悪くなく、動画BGM程度であればそのまま使えそうである。もう既に方々でレビューされているのでここにサンプル楽曲を掲載することは控えるが、あまり悪い評価は目にしたことがない。

ただし、個人的にはドラム・パーカッションがちょっと弱いという印象を受ける。シンセもありがち、というか割と常識的な音色で物足りず、独立した音楽作品としてはもう一歩二歩の編集を加える必要性を感じる。むろんプロであれば、おそらくもっと突っ込みどころはあるだろう。しかし一方、上述のように目立たないBGMならばこれで十分かと思う。ある意味YouTuber御用達とでも言おうか。

楽曲自体はともかく、私が非常に落胆した点は、やはりMIDIデータを落とせないというところである。上で少し触れたようにビジネス上の深謀遠慮があるのかもしれないが、せめて有料プランではMIDIデータのダウンロードもできるようにして欲しいと思う。現時点では耳コピしてDAWで編集するしかないが、そんな面倒なことをやるぐらいならばMIDIを落とせる他のアプリやサービスを使う方が手っ取り早い。

技術的には最先端で正に音楽業界のdisruptorだが、しかしJukedeckのビジネス・モデルに関しては少々危うさを感じなくもない。というのも、オープンソースの流れもあって、AI機能自体は些かコモディティ化の傾向が見えてきており、Jukedeck同様の機能を搭載した比較的安価なプラグインなどが登場したらひとたまりもないからである*2。あるいは、それこそオープンソースのプロジェクトが競合してきたらどうなるだろう。Magentaプロジェクトはその筆頭格だが、これについてはまた追って取り上げたい。

*1:私が試しにダウンロードしたものをチェックした限りではビットレート192kbpsであった。

*2:AIというわけではないにせよ、Waveformのコード進行ヘルパーなどにはその萌芽が見られるように思う。

MIDIとMIDI検定に想いを馳せる盆休み

昨日掲載の「DTMステーション」の以下記事は、しみじみしながらも興味深く読んだ。

www.dtmstation.com

 

過去にも書いたことだが、DAW隆盛の現在でもMIDIは依然として楽曲制作の上で中核を成す技術であることに変わりはない。DAWの登場でMIDIは過去の遺物と化した、といったごとき論調もごくたまに目にすることはあるが、もちろんこのような認識は単なる誤解に過ぎない。

しかし、主たる表現手段がDAWのオートメーション機能などに移ったことや、GM音源の活用が廃れたこともあって、かつてのDTM打ち込み全盛期に比べれば影が薄くなったことは否めないと思う。

ただし近年になって再び脚光を浴びるチャンスが到来している。すなわち、AIによる自動作曲の研究が盛り上がりを見せているという状況である。インプット学習用のデータとして、または生成結果や再生用の標準フォーマットとしてMIDI(正確にはSMF)がよく使われているようである。なので、枯れて安定した技術仕様としての強みを発揮しつつ、さらに活躍の場を拡げる余地はまだまだあると思う。

またAMEIといえばMIDI検定だが、世間一般の人は次のような感想を抱いて当然だろうと思う(以下引用):

MIDI検定のような公的なものを通じて情報共有されているのはちょっと意外で面白く感じました。MIDI検定は20年近く実施されていると伺いましたが、これがMIDIの発展にどう寄与するのかというのも気になるところです

皮肉にも、DAWをも取り込んだ2012年の試験制度改訂以降に受験者があまり増えていないのは気になる。所詮は業務独占資格ではないので、実利性がないことを敬遠されている節もあろう。逆に旧制度下で今では考えられないほど多くの受験者数を誇っていた理由はよくわからないが。

しかし、MIDI規格を系統的に習得する学習課程としては、MIDI検定のカリキュラム以上のものは現状ないと思われる。そこはさらに強く押し出してもいいメリットのはずで、もっとアカデミア(音大や専門学校のみならず音響工学系の大学学部なども含む)とその学生にアピールした方がいいだろう。私のようなごく少数の物好きな趣味人を除けば、社会人は実益が見込めない資格など見向きもしないわけで、一般向けに広く浅くアピールしても認知度アップには結びつかないと思う。

とりあえず命拾いのSoundCloud

昨日来TechCrunchなどでちらほらと報じられていたように、SoundCloudがVCや投資ファンドから追加資本を得て当面はなんとか食いつなげる道筋をつけたようである。

jp.techcrunch.com

 

マネタイズのための仕組み化と販促が最大の経営課題だろうが、40%解雇という大規模リストラの直後なので、残った社員の士気やモチベーションをどう維持していくかという組織運営上の問題もあり、なかなか前途多難だろうと思う。

新CEOは元VimeoのCEOということで動画分野への進出も憶測として取り沙汰されているように見受けるものの、それをやると経営リソースを分散させてしまう上にYouTubeと真っ向勝負になって勝ち目がないので、たぶんないだろう。

私のようなカジュアル・ユーザが一番懸念するのは、収益化重視に伴って有償プランがどこまで拡大されるか、という一点に尽きる。無償プランの許容範囲がまともに使えないほどに狭まると、じゃぁYouTubeでいいや、ということになってしまい、ユーザが離散してしまうジレンマを抱える。

バッハ気分に浸るツール

夏休みの自動作曲探求シリーズの第3弾。

daw-jones.hatenablog.com

今回は、アルゴリズム作曲ツールの変わり種である Abundant Music を試してみる。これは一言で言えば、バロック音楽生成機である。

最初にサンプルを聞いた方が雰囲気が伝わると思うので、以下に私がアレンジしたサンプル小品を掲載しておく。Abundant Music から書き出したMIDIデータをベースに*1、Studio One でミックス加工したものである。

使い方

上記URLにアクセスして所定のコンテンツ*2がロード完了すると、以下のようなメイン画面が表示される。

f:id:daw_jones:20170811195532p:plain

最も基本的な操作手順としては、

  1. "Song Settings" で生成パラメータを適当に調整・設定する。
  2. "Compose" ボタン押下で楽曲を生成する。
  3. 生成結果を "Player" にて再生確認する。
  4. 気に入ったら "Export" メニューよりMIDIデータをダウンロードする。

パラメータの設定と楽曲生成

このモデル*3はやたらにパラメータが多く、中でも擬似乱数発生のシード値を多数要求するが、基本的にはボタン一発のランダム生成によるお任せでよい(下図参照)。適当に設定したら、メイン・メニューの一番右端にある "Compose" ボタンを押してシステムに楽曲を生成させる。

f:id:daw_jones:20170811200910p:plain

再生確認

楽曲の生成が完了したら、再生確認してみる。非常に原始的なものだが内臓プレイヤーが付いているので、とりあえずそれで再生してみるとよい(下図参照)。インストゥルメントはデフォルトのままで問題ない。

f:id:daw_jones:20170811201625p:plain

再生音色はとてつもなくチープなピコピコ・サウンドだが、曲調は概ね確認できると思う。これはこれで味わい深いものがあり、ほとんど Switched-On Bach の世界を彷彿とさせる。もっとゴージャスなクラシック風楽曲に仕上げるのであれば、MIDIを書き出してクラシック用の音源音色を使うべきだろう(後述)。

MIDIデータの書き出し

気に入ったら "Export" メニューより "Export Midi" ボタンを押下してMIDIデータを書き出す。その際、下部のパラメータ群は特に触る必要はなく、デフォルトのままでよい。

f:id:daw_jones:20170811202503p:plain

サーバ側での書き出し処理後、下図に示すようなダウンロード用リンクが出現したら、そこをクリックして落とす。

f:id:daw_jones:20170811204945p:plain

生成されるMIDIデータ

本システムより書き出したMIDIデータに見られる特徴あるいは特異なところは、私が気づいた範囲では以下の3点である:

  • テンポ表現が細かく、メタイベントのテンポ設定メッセージ (Set Tempo) が多数書き込まれる。ただし、これはDominoでは反映されるが、Studio One に読み込んでも無視されるため、DAW側のテンポ・トラックで別途設定が必要となる。
  • コントロール・チェンジでコーラス(CC#93)やフィルター・レゾナンス(CC#71)といった音色調整メッセージが曲中でも書き出されるが、これに対応したGM音源を使用しない限りは効果を発揮しない。
  • 生成楽曲は十中八九クラシックなのに、律儀にも漏れなくリズム・トラック(チャネル10)が付いて来るのは奇異な感じがする。これはどう考えてもマッチしないので、削除するかミュートしてしまう方がいいと思う。

なお、生成された曲やデータはCC0著作権放棄)でライセンスされるため、ユーザが自由に使用または加工しても支障はない。

個人的な印象

面白いことに、何回トライしてもバロック音楽、あるいは、なんちゃってバッハな曲しか生成されない。おそらく、その種の音楽の分析データだけを集めて、各構成要素をマルコフ・チェーン的に合成しているのだろうと想像もできるが、和声、というか対位法のロジックがかなり厳密に適用されているようで、全体として不思議と違和感がない。いや、ひょっとしたら学習データは皆無で、初期値を乱数で与えて後はロジックだけで生成しているのかもしれない。

ジャンルの限界はあるが、出来栄えがそれほど悪くはないので、音色さえ上手くアレンジすれば、案外と劇伴とかゲーム音楽に使える可能性はある。少なくとも、私のように作曲技法の専門教育を受けていない者は絶対に自力で制作できない領域の音楽ではある。

*1:ごく一部でオクターブ調整やコードの微修正、補完パートの追加をやった以外はオリジナル・データそのままである。

*2:FlashとかJavaではなく、JavaScriptの塊のようである。特定のプラグインは不要。

*3:残念ながら生成アルゴリズムに関する解説資料は見当たらず。

本年度のMIDI検定1級試験がスタート

本日より11日間の締め切り日程で、第9回MIDI検定1級の実技試験がスタートした。私は来年受験予定のため今年は傍観者を決め込むしかないが、今回受験される方は猛暑に負けずに是非頑張ってください。

毎年盆休み連休に当てて実施してくれるが、休暇を取ったとしても実質10日間の制作期間をフルに使える受験者はそう多くはいないだろうと思う。今年のカレンダーでは15日までの5日間程度という人が大多数かもしれない。5日だと楽曲によってはちょっとギリギリな感じもする。

そういえば今年は受験者数は多少は増えたのだろうか。例年通りだと40〜50人という水準だろうが、小岩井ことりさん効果で激増、なんてことはないか(苦笑)。

以下記事でも書いた通り、昨年度の課題曲はクラシック調であったため、おそらく今年はポピュラーのジャンルで攻めてくると予想されるが、その分音数が格段に増えてノート打ち込みの労苦が増す可能性がある。昨年はリズム・セクションがなかったということも比較的打ち込み自体は楽であった一因だ。しかし今年はそうも行かないだろう。

daw-jones.hatenablog.com

いずれにせよ、年度毎のジャンル等に起因した難易度のブレは避けられず、またヤマを張ることもできないので、受験者としてはどのジャンルが来ても対応できるようにしておくぐらいしか有効策はない。そういう意味でも過年度課題曲の制作練習あるのみ、ということになる。個人的には難解なジャズ曲はできれば避けたいところだが。

WolframTonesの不思議な世界

夏休みの自動作曲探求シリーズの続き。

daw-jones.hatenablog.com

 

自動作曲とかアルゴリズム作曲と呼ばれる分野では、近年はニューラルネットをベースにした機械学習モデルが主役に躍り出た感があるが、それ以外の手法を使ったモデルも結構昔から多数存在している。

その中でもモデルが比較的単純明快で、なおかつWebサービスの形で気軽にお試しできるものとしてWolframTonesをちょっと検証してみる。

tones.wolfram.com

 

これの考え方の基本はセルラーオートマトンで、予測可能な何らかの規則性を持ったパターンと、完全なランダムとの中間の複雑性を持つため、音楽との相性が良いと期待される。

かなり雑駁に言ってしまえば、各楽曲ジャンルに特徴的な進行パターンを、隣接するセルの塗りつぶし推移規則に置き換えることでメロディやリズムの時系列を生成しているようである(当たらずといえども遠からず?)*1

アルゴリズムの詳細については本ブログの趣旨を大幅に逸脱してしまうのでこれ以上の深掘りは避ける。そこは別に知らなくとも触って楽しんだり実験したりすることは可能である。

使い方

誰でも直感的に使えるインターフェースなので操作法は自明だと思うが、参考までに下図を参照されたい。

f:id:daw_jones:20170805153158p:plain

基本操作は、"Music Style"セクションのジャンル・ボタンを押す毎にセルラーオートマトンを生成し、GM音源再生でその適否を耳で確かめる。この繰り返しである。生成パラメータや再生音色などはシステム側で適度に設定してくれるため、原則としてユーザが細かく調整をする必要はないように思う。

その他私が気づいた注意点としては、

  • 実際のところ生成パラメータを変えても、多くの場合はあまり大きな変化は生まれないようだ。
  • デフォルトは15秒の長さで非常に短い。概ね4小節前後の長さである。最大30秒まで設定できるが、さほど目立ったバリエーションは付け足されない。ただ単にリズム・パターンをそのまま延長しているだけのことが多い。
  • MIDIデータ (SMF) のダウンロードは可能である。上部のダウンロード・ボタンをクリックすると、MIDIおよびMP3、WAV、FLACの4種からファイル形式を選択できる。
  • 私の理解が間違っていなければ、利用規約上、本サイトの生成物の著作権Wolfram Research, Inc. に帰属する。私的利用と非商用利用は自由のようだが、加工した作品を公表したりするのは厳密には無理なようである。しかし、この点は事実上有名無実化しているようにも思う。なぜなら、オーディオであれMIDIであれ、ミックス加工してしまえば出自はまったくわからないからだ。

生成されるMIDIデータ

Chordana Composer 同様にマルチトラックのSMFが書き出される。ただし、1小節目は特にセットアップ用に確保されているわけではなく、冒頭のプログラム・チェンジと楽曲データは渾然一体となっている(下図Domino読み込み例を参照)。一応ベロシティもある程度細かく調整されてはいる。チャネル10はMIDIの標準規定通りにリズム・トラックに割り当てられている。

f:id:daw_jones:20170805183903p:plain

個人的な印象

このツールは楽曲ジャンルの指定が最大のキモだが、私が試した限りでは、Rock/Popと Hip Hop はモチーフとして使えそうなパターンを生成することが多い。結論としては、少なくともループ素材の生成ツールとして活用できそうである。リズムとメロディだけ頂くという手もありだろう。

しかし一方で、他ジャンルはほとんどランダム(デタラメ)な感じが強く、正直言って楽曲活用は厳しいのではなかろうか。むろん、現代音楽ばりに敢えて実験的な作品制作を狙うのであれば使えなくはないだろう。組み合わせる音源音色によってはかなりユニークな楽曲に仕上がる可能性を秘める(好意的に解釈すれば)。

*1:生成ロジックの概要については解説ページを参照。大元の考え方は、Stephen Wolfram の名著 A New Kind of Science が原点である。なお、セルラーオートマトン全般に関してはWikipediaの解説などを参照。

Chordana Composer よりMIDIデータ生成

前回記事を受けて、Chordana ComposerMIDI書き出し機能を試してみたので概要や特徴などをまとめておきたい。

daw-jones.hatenablog.com

なお、MIDI書き出しを含めたアプリ全体の機能概要については、2年前の記事だが下記「DTMステーション」のレビューも参照。

www.dtmstation.com

MIDIデータのエクスポート

手順はいたって簡単で、書き出されたSMFをメールに添付して送受信するだけである。

右上の共有アイコンをタップして「メールで送る」を選ぶと、添付ファイルの形式選択メニューが表示されるので、ここで「MIDI」を指定する。すると、該当のSMFがすでに添付された状態でメール送信画面が開くので、適当な送信先アドレスを入力して「送信」をタップすれば指定のメールアドレスで受信ダウンロードできる。

f:id:daw_jones:20170802153131p:plain

f:id:daw_jones:20170802153306p:plain

f:id:daw_jones:20170802153353p:plain

Studio One に取り込んでみた結果

意外なことに、メロディのみならず伴奏を含めたマルチトラックのSMFがエキスポートされる。どうせ申し訳程度にメロディだけだろうと期待していなかったので、ちょっとびっくりである。

下図のように、各トラックのMIDIイベント名にはチャネル番号が付いており、一応MIDIの標準規格に準拠してチャネル10("CH10")はリズムに割り当てられている。ただし、チャネル番号はあくまで名称レベルであって、後述するDominoと異なり Studio One では実際にMIDIチャネルの設定はされない*1。チャネル9はベースとなり、それ以外はユーザ側で適当な音色を設定すればよい。

f:id:daw_jones:20170802153836p:plain

下図ピアノのMIDIエディター例を見れば一目瞭然だが、楽器パートによってはベロシティが相当細かく設定されている。また微妙にタイミングをズラしてヒューマナイズを適用していることに驚愕する。本例は選択ジャンルがジャズだったので、たぶんスイングさせているのだろうと推測するが、意外なほど芸が細かい。他ジャンルでも後日確認してみたいところである。

f:id:daw_jones:20170802154035p:plain

ピアノは驚くべきことに Sustain (CC#64 Hold1) のデータも書き出している(下図参照)。ちなみに Presence XT は Sustain には対応している。ここまで来ると、ほとんど手弾き演奏をリアルタイム入力したのかと見紛うほどのデータで、これはなかなか侮れないクオリティだと思う。

f:id:daw_jones:20170802154134p:plain

ドラムについては、GM音源配列に準拠しているようで、ここでもベロシティはかなり細かく設定されている。

本例のようなジャズ曲は素人には難しいので、伴奏だけでも結構使えるかもしれない。たとえば、メロディは適当に入れてとりあえず伴奏を生成させ、その伴奏に合ったメロディを再度作り直すという逆運用も効果的な使い方の一つである。

なお、一生成物の曲長は40小節弱と短い。多くの場合これだけでは到底物足りず、楽曲を膨らますための追加の加工編集が必要となろう。一番安直なのは、同じメロディに対していくつかの異なる自動作曲結果を生成し、これらを適当にくっつけてしまうことである。

Dominoに取り込んでみた結果

SMFを取り込んでも Studio One では無視されるデータがあるため、Dominoに取り込んでもう少し詳細を覗いてみる。

まず、各トラック冒頭1小節目はセットアップ・データ用に確保されており、楽曲それ自体は2小節目から始まる。ここは標準的なMIDIデータの作成ルールをきちんと踏襲しているようだ。

f:id:daw_jones:20170802223647p:plain

ユーザによる加工編集用に重宝すると思われるのは、Conductor(メタイベント)トラックに調性やコード表記がマーカーとして書き込まれていることである。これらは Studio One には反映されないので、確認したい場合はChordana本体か、Domino取り込み結果を参照する必要がある。

f:id:daw_jones:20170802223958p:plain

Chordanaは伴奏生成用

曲長が短いこと以外に、Chordanaを使うにあたっての最大のハードルは、鼻歌レベルでもよいから何らかのモチーフのメロディを自分で入力(または録音)する必要があるということ。贅沢を承知で言えば、実際はこれとてかなり面倒臭い。なぜなら、それなりの鼻歌すら思い浮かばず七転八倒するのが素人の素人たる所以だからだ。

上で指摘したように、実はこれは伴奏(あるいはコード進行)生成機として割り切って使うのがベスト、というのが私個人の結論である。というのも、多くの場合は生成されたメロディーが聞くに耐えない珍奇な結果になっているからである*2。逆に皮肉なことに、伴奏だけはなぜか分不相応(?)なほどのクオリティで書き出してくれる。この点は上例のMIDIデータを見ても頷けると思う。

*1:Studio One の内蔵音源 Presence XT はマルチチャネル音源ではないので、いずれにせよMIDIチャネルは無関係。

*2:私が入力した元の鼻歌データがデタラメだということは差し置いておく。