DAW悪戦苦闘記

DAWやMIDIを通じてちまちまとDTMを楽しむ記録+MIDI検定1級到達記

Technodon Remastered 2020

つい先日制作者のオンライン・インタビュー動画がYouTubeに上がっていたので大変興味深く拝見したが、しかし一体何度目のリマスター盤かは知らないけど、4月末に出てたんですね。全然知らなかった、というか不幸なことにちょうど新型コロナ自粛経済の影響もあってあんまりプロモーションされてなかったか。

www.universal-music.co.jp

"BGM" がベスト・アルバムだと思い込む自分だから "Rydeen" みたいな80年代テクノを期待していたわけではなかったが、正直 "Technodon" には戸惑いと落胆の「これじゃない」感が大きかったことははっきり覚えてる。同じような感想を持った人は多かったように思う。

上記インタビューの最後の方でHotoda氏が、多少の社交辞令を含むにせよ、YMOの再生復活を期待する旨の発言をしていたが、個人的には今更それはないな、と思った。だってもう70歳前後のお爺さん達だというのに、我々はいいかげん乳離れしないといけませんよ(苦笑)。

AWS Machine Learning Specialty を取得

以下記事の続きになるが、AWS関連資格として個人的には3つ目の認定である Machine Learning Specialty に先日合格したので、ちょっとした体験記やアドバイスめいたことなどを書いておきます。

daw-jones.hatenablog.com

本資格は昨年発足したばかりでAWS認定の中では新顔であるが、ググると合格体験記の類はそこそこ多く発見される。ここではそれら他の体験記となるべく重ならない視点で書いておこうと思う。

受験動機について

機械学習 (ML) はDAW/DTMといった音楽の世界とは無関係のように見えて、実際のところ昨今では自動作曲の研究プロジェクトやプロダクトがかなり進展してきており(Magenta Project が典型で本ブログでも何度か取り上げた)、DTM趣味人としても完全にブラックボックス視せずに基本原理ぐらいは知っておいて損はなかろうとの思いでAI/MLの学習を進めてきた。その進捗度をこの辺である程度見える化しておきたかったので受験してみた次第である。

ぶっちゃけ仕事には直接のインパクトがないし、またAWS資格でありがちな五冠とか全冠制覇といった資格マニア的動機も特になく、純然たる知的好奇心と趣味の範囲で受けたのだが、ベンダー資格の中では受験料が比較的最安の部類なので(discount coupon 使えば税込¥16,500で済む)、そういうお試しが気軽にできるのはありがたい。またAI/ML関連でグローバルに通用するIT資格は今のところこれしかないのが実情である(と思う)。

前提となる下地 - ML基礎理論とAWSデータ処理体系

他の受験体験記でもよく書かれているように、本認定はAWS固有サービスについての問題のみならず、機械学習に関する基礎理論的な設問も多く出題される。したがって、MLの基礎学習についてはAWSのトレーニングとは別に前準備しておく必要があり、あるいは逆にその素養がすでにあるのであれば、受験対策はかなり楽に進められる。これについては、このブログでも過去に触れた Coursera の機械学習講座を履修するか、数多く出版されている日本語テキストで自分に合ったものを取捨選択して地道に学習するほかない。

daw-jones.hatenablog.com

あともう一つの下地要件として、AWSのデータ処理関連サービスをざっとおさらいする必要がある。具体的には Kinesis Data Analytics や EMR、Glue、Redshift、Athena などであるが、これらについては、Data Analytics (旧 Big Data) Specialty の認定を事前に通過していると概ね目星はつく。そういう意味でも、Data Analytics の認定は横着せずに事前ステップとして踏んでおくことを推奨する(ちょっとシンドイですが)。

本筋の学習 - Udemyが無難だが...

これまで同様に今回も結局Udemyの講座にお世話になった。しかし、振り返ってみれば、これはあまり必要なかったかもしれないとも思う(hands-onデモも混ぜてはいるが全体に事実の羅列で結構退屈だった)。

www.udemy.com

というのも、本試験は結局のところ SageMaker についての試験であるといっても過言ではなく、SageMaker のホワイトペーパー等公式ドキュメントや公式チュートリアルを一通り走破することで大方の学習は可能であると思うからだ。

aws.amazon.com

www.youtube.com

ただ、練習模擬試験については公式だけではどうしても不足するため、こちらもUdemyで補ってはいる(以下は私が利用した比較的高評価のもの)。

www.udemy.com

私の試験結果

合格基準750/1000のところ、838で合格となった。前回スレスレで通過した Big Data Specialty (難解で苦労した)よりは随分とましな結果である。本認定は理論知識でカバーできる領域が大きいので、ある意味簡単というか準備しやすい一面があったように思う。

出題分野は4つに分かれるが、そのうち「データエンジニアリング」と「機械学習の実装と運用」については「再学習の必要あり」の判定を受け、一方で「探索的データ解析」と「モデリング」は「十分な知識を有する」との評価を受けた。ざっくり言えば、理論面は問題ないが、AWSの実際の運用の観点では知識や経験が不足する、という個人的には反論のしようがない妥当な判定である。白状すれば、想定外の課金が怖かったので、SageMakerも実際にはほとんど動かしておらず、このような内訳になったのは当然至極である。しかし一応座学だけでも総合判定で合格はできるということではある。

AWS認定チャレンジはもうこれで打ち止めにしようかなと考えているが、気が向いたら Solutions Architect Professional は受けるかもしれない(来年以降であれば)。いや、どうせ半分趣味だし音楽関係ないし、そこまでやるこたぁないか...*1

*1:AWS認定は3年毎に再受験更新しないと資格が失効する。なので、Solutions Architect Associate の更新時期に復習も兼ねつつ Professional を受験して乗り換える、というのも一つの手である。私の場合は2019年8月に Associate を取ったため、更新時期となる2022年8月ごろを目処に Professional へ乗り換え受験するのが合理的ということになる。

How Pop Music Lost the Melody

なぜ今頃になって思い出したのかもわからぬほど、これもほとんど偶然な私的発見をこの場で共有しておこうかと思う。

1995年にNHK教育テレビEテレ)で放送していた「ソリトンSide-B」で坂本龍一がゲスト出演した際に、氏が言及していた The New York Times の記事がずっと心の片隅のさらに奥の方に引っかかっていたのだが、件の記事を長年突き止められずにいた。

note.com

だが最近某巨大動画共有サイト(苦笑)に番組のsnippetが上がっていたおかげで、記事の見出しが正確に判明し、これを手掛かりにNYTのアーカイブ・サイトから同記事を丸々参照することができた。足掛け四半世紀(!)にしてやっと。生きていればいいこともある、ということか。

www.nytimes.com

ただ残念なことに、この記事自体はあまり大したことは書いていなくて、ちょっと期待外れであったことは否めない。どちらかというと饒舌で気取った叙事詩的エッセイであって、もう少し緻密な社会分析を期待していた自分にとっては肩透かしもいいところだった。タイトル通りにHowは書いているけどWhyを知りたかった私には物足りず。

あと映画の方に目を向ければ明らかなように歴史イベントとしてはベトナム戦争の影響は多大であったはずだが一言も触れていないのはどうかと思ったし、ヒップホップの現代ポップカルチャーに対する計り知れないインパクトを知るにはそれ自体をもっと深掘りする必要があるだろう、という感想を持ったが、50年代の漂白されたお伽話的世界の化けの皮が剥がされて、明け透けの肉体剥き出しになっていくポップスの様を概観するには参考になるかもしれない。

やっぱり宇多丸師匠の本は一読しておくべきか...

ライムスター宇多丸の「ラップ史」入門

ライムスター宇多丸の「ラップ史」入門

 

 

Logic Pro X 10.5 のメジャー更新

ここ数日DAW関連でMacユーザをザワつかせていたニュースとして、Logic Pro X の大型アップデート10.5版の登場があった。

ポイントを押さえた解説読み物としては、以下の記事が的確で読みやすい。

av.watch.impress.co.jp

細かい実演チュートリアルは以下記事+動画が詳しい。

sleepfreaks-dtm.com

今回追加または更新された機能詳細をいちいちこの場で列挙することは控えるが、要するに、現時点で業界標準的なプロ仕様DAWとして搭載されてしかるべき機能はすべて盛り込み尽くした、という印象が強い。

しかも洗練されたUIに税込¥24,000という破格な値段である。事実上 Logic Pro X が上級DAWの bare minimum みたいな位置付けになってしまい、上記藤本氏の記事で指摘されるように競合潰しというか、Apple以外のサード・パーティーのメーカーは、ユニークなシンセとかAI作曲支援やら強力なコード・ヘルパーといったもっと他の付加価値で勝負しないと差別化が難しい段階に入っていると思う。

あとはもう私のようなGarageBandユーザであれば、上級DAWの移行先としてはとりあえず Logic Pro X で決まり、という結論が出てしまった感もある。少なくとも1本目のメイン・ツールとしては十分お釣りがくるほどである。

個人的には、本ブログでも無償Prime版を度々取り上げた Studio One が結構気に入っていたのだが(MIDI/トラック編集画面が抜群に使いやすい)、Pro版は結構なお値段がするため、費用対効果を考えたら Logic Pro X に敵わない。

オーディオ・サンプルで学習した自動作曲ツール

MIDIのようなシンボリック・データを学習インプットとして自動作曲する研究は割とありふれているのだが、いっそのことオーディオそれ自体をモデルに食わせて学習させるといったアプローチもありではないか、と思っていたら、先ごろOpenAIからそのものずばりな研究成果が "Jukebox" の名の下に公開されていた。これはインプット、アウトプット双方ともにオーディオとするモデルである。

openai.com

venturebeat.com

想像に難くはないが、生のオーディオ・サンプルは情報量が膨大なために、autoencoderの工夫によっていかに効率よく圧縮するかが学習促進・楽曲生成のキーとなっているようである。それでも1分尺の新たなオーディオを生成するのに9時間掛かるというから、まだまだ実用にはほど遠い。データ圧縮しているせいで生成アウトプットにノイズが多いのも問題である。

公開されている生成サンプルをいくつか聴いてみたところ、これはまるでサンプリングとかマッシュアップで合成した楽曲のようだ、という印象が強かった。つまり、特にこのツールに頼るメリットはあまりないのかも(今のところは)、という身もふたもない結論だった。

ポリリズムの設定方法 (Studio One)

本記事は一応 Studio One を前提にして書いてはいるが、他のDAWであってもおそらく編集プロセスは同様であろうと思われる。すなわち、簡単なポリリズムの展開方法について、である。

こんなシンプルな原理が今の今までなぜ気づかなかったのか、自分でも不思議な気持ちなのだが、わかってしまえば実に簡単な話である。例えば3拍子と4拍子のポリリズムは、要するに1小節を12個(またはその倍数)のグリッドに分けてしまえば、簡単に編集できる。どうやって12個に分かつかといえば、3連符のクオンタイズ入力グリッドを利用すればよい(下例参照)。

f:id:daw_jones:20200504221548p:plain

これに関して大いなるヒントを与えてくれたのは、以下に掲げる菊地成孔氏講座「モダンポリリズム」の講義であった(いくつか抜粋してYouTube上で公開されている)。音楽関連のビデオをYouTubeで渉猟していた最中にまったくの偶然に出会ったチュートリアル動画であるが、これがなかなかわかりやすい上に深く掘り下げた勉強になる。

www.youtube.com

DAWには必ず拍子設定(Studio One の場合は Time Signature)の機能が付いているはずで、これで変拍子などは簡単に編集・挿入できるわけだが、トラック横断的にすべてが一律に変更される。なので、この拍子設定機能を使って、例えばあるトラックは4拍子で、また別のトラックでは3拍子で、といったポリリズムの展開はできない。しかし特にこの機能を使用する必然性はないわけであって、上述のようにクオンタイズのグリッドを自由自在に切り替えれば小節単位であっけなく簡単に編集できてしまう。正にコロンブスの卵である。

f:id:daw_jones:20200504222231p:plain

応用すれば、4拍子と5拍子といったポリリズムも難なく実現する(下例参照)。

f:id:daw_jones:20200504223224p:plain

菊地氏が指摘するように、現代ポピュラー曲ではほぼ100%と言ってよいぐらい4/4拍子が圧倒的多数を占めていると思われるが、リズムパターンがありきたりになりがちなので、それを打破する一つのアプローチとしてポリリズムは結構創作欲を刺激するのではなかろうか。グルーブ感に豊かな多面性を持たせるテクニックとしても有用だろうと思う。ただし、あんまりやり過ぎるとアフリカ民謡みたいになってしまう罠はあるが。

最近気になった音楽やDTM関連記事など (2020年Q1)

突然降って湧いたようなコロナ禍で右往左往しているうちに今年は早くも第一四半期が終わろうとしているが、この3ヶ月で個人的に気になったDTMや自動作曲、音楽業界などの関連記事をまとめて振り返っておこうかと思う。

www.vice.com

著作権ゴロへの対抗上、単純に順列組み合わせですべてのメロディ・パターンをMIDIデータとして生成、著作権化して一般公開したという話。生成自体はニューラルネットの高級技に頼らずともPythonのmidoパッケージとか使って簡単にできそうな気はする、技術的には。これの背景には、近年音楽業界で著作権パクリ訴訟が相次いでいるという世知辛い動きがある(以下 Rolling Stone 誌の記事)。

www.rollingstone.com

さて、本ブログでも1年ほど前から随時追跡していた MIDI 2.0 の仕様がついに正式規格としてグローバルに展開し始めた。

www.dtmstation.com

DAWユーザの観点では、ベロシティやコントロール・チェンジの制御値の解像度が格段に上がる点が影響大であろう。それ以外のエンハンスメントはどちらかというとステージ実演家向けといった印象が強い。一方でMIDI検定への影響だが、学習課程や試験内容の一部が変更になる前に、まず公式ガイドブックの改訂を通じてアナウンスされるはずなので、少なくとも今年の現段階では特に浮き足立つ必要はなかろう。

次に、自動作曲といえばGoogle主導の Magenta プロジェクトであるが、Music Transformer というMIDIデータ生成ツールが公開された。ピアノ曲を右手左手両部込みでそれなりに生成してくれるという優れもの。DAWに取り込んで音源をピアノ以外に差し替えれば如何様にでもアレンジできる。

magenta.tensorflow.org

クオリティ面を考えると、プロの現場では生成データを無改変でそのまま楽曲として採用するわけにもいかず、取捨選択のプロセスが必須のようである。自動作曲全盛の時代となっても、結局のところこうした目(耳)利き能力でプロとアマの差が顕著に現れるのかもしれない。逆に言うと、それ以外の制作過程においてはますます level playing field になってきている。

magenta.tensorflow.org

自動作曲ではMicrosoftも頑張ってます、という取り組みの中でBjörkとコラボ。「NYの時間帯や、季節、そして景観の変化に応じて曲が作られ続けていく」という仕掛けだが、現代美術のインスタレーションっぽく、ちょっと手垢がついた感がある自動生成表現のような気がした。

www.gizmodo.jp

初音ミクのブーム沈静化以降ボカロはもうオワコンになってしまったのかとあまり気には留めていなかったのだが、歌声合成は知らない間に格段の進歩を遂げてまだまだ進化中と知り驚愕。これ、究極的には自分の歌声をリアルタイムでキャラクター音声に変換できるところまで行けば理想かなと。

www.dtmstation.com

次はかなりテクニカルな話。FM音源アルゴリズム選択やパラメータの設定は難度が高くて思い通りの音色編集がなかなか困難であるという欠点は Yamaha DX-7 の頃から散々揶揄されていた。であれば、表現したい楽器音色からパラメータをリバース・エンジニアリングしてしまおうという発想。

speakerdeck.com

その心はわかるがかなり難解。そもそも生楽器の再現であればサンプリング音源の技術で十分事足りると思うので、このようなアプローチは費用対効果に疑問符が付くのだが、研究題材としては面白い。

最後に、意外な事実。コロナ禍で在宅勤務や自宅ひきこもりを余儀なくされる人が全世界的に多数に上る中、Spotifyなどのstreaming再生回数は減少を見せているとのこと。逆かと思っていたらそうではなかった。理由は複合的。

www.bbc.com