DAW悪戦苦闘記

DAWやMIDIを通じてちまちまとDTMを楽しむ記録+MIDI検定1級到達記

Technodon Remastered 2020

つい先日制作者のオンライン・インタビュー動画がYouTubeに上がっていたので大変興味深く拝見したが、しかし一体何度目のリマスター盤かは知らないけど、4月末に出てたんですね。全然知らなかった、というか不幸なことにちょうど新型コロナ自粛経済の影響もあってあんまりプロモーションされてなかったか。

www.universal-music.co.jp

"BGM" がベスト・アルバムだと思い込む自分だから "Rydeen" みたいな80年代テクノを期待していたわけではなかったが、正直 "Technodon" には戸惑いと落胆の「これじゃない」感が大きかったことははっきり覚えてる。同じような感想を持った人は多かったように思う。

上記インタビューの最後の方でHotoda氏が、多少の社交辞令を含むにせよ、YMOの再生復活を期待する旨の発言をしていたが、個人的には今更それはないな、と思った。だってもう70歳前後のお爺さん達だというのに、我々はいいかげん乳離れしないといけませんよ(苦笑)。

AWS Machine Learning Specialty を取得

以下記事の続きになるが、AWS関連資格として個人的には3つ目の認定である Machine Learning Specialty に先日合格したので、ちょっとした体験記やアドバイスめいたことなどを書いておきます。

daw-jones.hatenablog.com

本資格は昨年発足したばかりでAWS認定の中では新顔であるが、ググると合格体験記の類はそこそこ多く発見される。ここではそれら他の体験記となるべく重ならない視点で書いておこうと思う。

受験動機について

機械学習 (ML) はDAW/DTMといった音楽の世界とは無関係のように見えて、実際のところ昨今では自動作曲の研究プロジェクトやプロダクトがかなり進展してきており(Magenta Project が典型で本ブログでも何度か取り上げた)、DTM趣味人としても完全にブラックボックス視せずに基本原理ぐらいは知っておいて損はなかろうとの思いでAI/MLの学習を進めてきた。その進捗度をこの辺である程度見える化しておきたかったので受験してみた次第である。

ぶっちゃけ仕事には直接のインパクトがないし、またAWS資格でありがちな五冠とか全冠制覇といった資格マニア的動機も特になく、純然たる知的好奇心と趣味の範囲で受けたのだが、ベンダー資格の中では受験料が比較的最安の部類なので(discount coupon 使えば税込¥16,500で済む)、そういうお試しが気軽にできるのはありがたい。またAI/ML関連でグローバルに通用するIT資格は今のところこれしかないのが実情である(と思う)。

前提となる下地 - ML基礎理論とAWSデータ処理体系

他の受験体験記でもよく書かれているように、本認定はAWS固有サービスについての問題のみならず、機械学習に関する基礎理論的な設問も多く出題される。したがって、MLの基礎学習についてはAWSのトレーニングとは別に前準備しておく必要があり、あるいは逆にその素養がすでにあるのであれば、受験対策はかなり楽に進められる。これについては、このブログでも過去に触れた Coursera の機械学習講座を履修するか、数多く出版されている日本語テキストで自分に合ったものを取捨選択して地道に学習するほかない。

daw-jones.hatenablog.com

あともう一つの下地要件として、AWSのデータ処理関連サービスをざっとおさらいする必要がある。具体的には Kinesis Data Analytics や EMR、Glue、Redshift、Athena などであるが、これらについては、Data Analytics (旧 Big Data) Specialty の認定を事前に通過していると概ね目星はつく。そういう意味でも、Data Analytics の認定は横着せずに事前ステップとして踏んでおくことを推奨する(ちょっとシンドイですが)。

本筋の学習 - Udemyが無難だが...

これまで同様に今回も結局Udemyの講座にお世話になった。しかし、振り返ってみれば、これはあまり必要なかったかもしれないとも思う(hands-onデモも混ぜてはいるが全体に事実の羅列で結構退屈だった)。

www.udemy.com

というのも、本試験は結局のところ SageMaker についての試験であるといっても過言ではなく、SageMaker のホワイトペーパー等公式ドキュメントや公式チュートリアルを一通り走破することで大方の学習は可能であると思うからだ。

aws.amazon.com

www.youtube.com

ただ、練習模擬試験については公式だけではどうしても不足するため、こちらもUdemyで補ってはいる(以下は私が利用した比較的高評価のもの)。

www.udemy.com

私の試験結果

合格基準750/1000のところ、838で合格となった。前回スレスレで通過した Big Data Specialty (難解で苦労した)よりは随分とましな結果である。本認定は理論知識でカバーできる領域が大きいので、ある意味簡単というか準備しやすい一面があったように思う。

出題分野は4つに分かれるが、そのうち「データエンジニアリング」と「機械学習の実装と運用」については「再学習の必要あり」の判定を受け、一方で「探索的データ解析」と「モデリング」は「十分な知識を有する」との評価を受けた。ざっくり言えば、理論面は問題ないが、AWSの実際の運用の観点では知識や経験が不足する、という個人的には反論のしようがない妥当な判定である。白状すれば、想定外の課金が怖かったので、SageMakerも実際にはほとんど動かしておらず、このような内訳になったのは当然至極である。しかし一応座学だけでも総合判定で合格はできるということではある。

AWS認定チャレンジはもうこれで打ち止めにしようかなと考えているが、気が向いたら Solutions Architect Professional は受けるかもしれない(来年以降であれば)。いや、どうせ半分趣味だし音楽関係ないし、そこまでやるこたぁないか...*1

*1:AWS認定は3年毎に再受験更新しないと資格が失効する。なので、Solutions Architect Associate の更新時期に復習も兼ねつつ Professional を受験して乗り換える、というのも一つの手である。私の場合は2019年8月に Associate を取ったため、更新時期となる2022年8月ごろを目処に Professional へ乗り換え受験するのが合理的ということになる。

How Pop Music Lost the Melody

なぜ今頃になって思い出したのかもわからぬほど、これもほとんど偶然な私的発見をこの場で共有しておこうかと思う。

1995年にNHK教育テレビEテレ)で放送していた「ソリトンSide-B」で坂本龍一がゲスト出演した際に、氏が言及していた The New York Times の記事がずっと心の片隅のさらに奥の方に引っかかっていたのだが、件の記事を長年突き止められずにいた。

note.com

だが最近某巨大動画共有サイト(苦笑)に番組のsnippetが上がっていたおかげで、記事の見出しが正確に判明し、これを手掛かりにNYTのアーカイブ・サイトから同記事を丸々参照することができた。足掛け四半世紀(!)にしてやっと。生きていればいいこともある、ということか。

www.nytimes.com

ただ残念なことに、この記事自体はあまり大したことは書いていなくて、ちょっと期待外れであったことは否めない。どちらかというと饒舌で気取った叙事詩的エッセイであって、もう少し緻密な社会分析を期待していた自分にとっては肩透かしもいいところだった。タイトル通りにHowは書いているけどWhyを知りたかった私には物足りず。

あと映画の方に目を向ければ明らかなように歴史イベントとしてはベトナム戦争の影響は多大であったはずだが一言も触れていないのはどうかと思ったし、ヒップホップの現代ポップカルチャーに対する計り知れないインパクトを知るにはそれ自体をもっと深掘りする必要があるだろう、という感想を持ったが、50年代の漂白されたお伽話的世界の化けの皮が剥がされて、明け透けの肉体剥き出しになっていくポップスの様を概観するには参考になるかもしれない。

やっぱり宇多丸師匠の本は一読しておくべきか...

ライムスター宇多丸の「ラップ史」入門

ライムスター宇多丸の「ラップ史」入門

 

 

1961年東京銀座の鮮明な街角動画

たまたま偶然に遭遇した動画だが、60年前に撮影したとは信じられぬほどに、まるで今日その場で撮ってきたかのような生き生きとした臨場感あふれる滑らかなアーカイブ映像。何度も再生しては感嘆の声を上げる。DAWとは関係ないけどあまりに素晴らしかったので備忘録がてら共有することにした。画質設定 "720p60" で再生すると一気にタイムスリップできる。

www.youtube.com

50年代や60年代の動画は圧倒的にくすんだ白黒が多い中で、これほど鮮やかなカラー映像はなかなか珍しい。上記動画は画像加工技術によってHD化されているが、ネタ元の Getty Images のオリジナル映像もそのままで十分にvividで驚嘆させられる。

最近ではAIを活用してモノクロ映像に着色する技術も急速に進歩しつつあるが*1、音楽の場合だと大昔の雑音混じりなモノーラル録音を自然な感じでステレオ化してリマスター版を制作するようなものだろうか(これはもうどこかでやってそうだが)。

*1:映画「彼らは生きていた / They Shall Not Grow Old」が典型例。

Logic Pro X 10.5 のメジャー更新

ここ数日DAW関連でMacユーザをザワつかせていたニュースとして、Logic Pro X の大型アップデート10.5版の登場があった。

ポイントを押さえた解説読み物としては、以下の記事が的確で読みやすい。

av.watch.impress.co.jp

細かい実演チュートリアルは以下記事+動画が詳しい。

sleepfreaks-dtm.com

今回追加または更新された機能詳細をいちいちこの場で列挙することは控えるが、要するに、現時点で業界標準的なプロ仕様DAWとして搭載されてしかるべき機能はすべて盛り込み尽くした、という印象が強い。

しかも洗練されたUIに税込¥24,000という破格な値段である。事実上 Logic Pro X が上級DAWの bare minimum みたいな位置付けになってしまい、上記藤本氏の記事で指摘されるように競合潰しというか、Apple以外のサード・パーティーのメーカーは、ユニークなシンセとかAI作曲支援やら強力なコード・ヘルパーといったもっと他の付加価値で勝負しないと差別化が難しい段階に入っていると思う。

あとはもう私のようなGarageBandユーザであれば、上級DAWの移行先としてはとりあえず Logic Pro X で決まり、という結論が出てしまった感もある。少なくとも1本目のメイン・ツールとしては十分お釣りがくるほどである。

個人的には、本ブログでも無償Prime版を度々取り上げた Studio One が結構気に入っていたのだが(MIDI/トラック編集画面が抜群に使いやすい)、Pro版は結構なお値段がするため、費用対効果を考えたら Logic Pro X に敵わない。

オーディオ・サンプルで学習した自動作曲ツール

MIDIのようなシンボリック・データを学習インプットとして自動作曲する研究は割とありふれているのだが、いっそのことオーディオそれ自体をモデルに食わせて学習させるといったアプローチもありではないか、と思っていたら、先ごろOpenAIからそのものずばりな研究成果が "Jukebox" の名の下に公開されていた。これはインプット、アウトプット双方ともにオーディオとするモデルである。

openai.com

venturebeat.com

想像に難くはないが、生のオーディオ・サンプルは情報量が膨大なために、autoencoderの工夫によっていかに効率よく圧縮するかが学習促進・楽曲生成のキーとなっているようである。それでも1分尺の新たなオーディオを生成するのに9時間掛かるというから、まだまだ実用にはほど遠い。データ圧縮しているせいで生成アウトプットにノイズが多いのも問題である。

公開されている生成サンプルをいくつか聴いてみたところ、これはまるでサンプリングとかマッシュアップで合成した楽曲のようだ、という印象が強かった。つまり、特にこのツールに頼るメリットはあまりないのかも(今のところは)、という身もふたもない結論だった。

ポリリズムの設定方法 (Studio One)

本記事は一応 Studio One を前提にして書いてはいるが、他のDAWであってもおそらく編集プロセスは同様であろうと思われる。すなわち、簡単なポリリズムの展開方法について、である。

こんなシンプルな原理が今の今までなぜ気づかなかったのか、自分でも不思議な気持ちなのだが、わかってしまえば実に簡単な話である。例えば3拍子と4拍子のポリリズムは、要するに1小節を12個(またはその倍数)のグリッドに分けてしまえば、簡単に編集できる。どうやって12個に分かつかといえば、3連符のクオンタイズ入力グリッドを利用すればよい(下例参照)。

f:id:daw_jones:20200504221548p:plain

これに関して大いなるヒントを与えてくれたのは、以下に掲げる菊地成孔氏講座「モダンポリリズム」の講義であった(いくつか抜粋してYouTube上で公開されている)。音楽関連のビデオをYouTubeで渉猟していた最中にまったくの偶然に出会ったチュートリアル動画であるが、これがなかなかわかりやすい上に深く掘り下げた勉強になる。

www.youtube.com

DAWには必ず拍子設定(Studio One の場合は Time Signature)の機能が付いているはずで、これで変拍子などは簡単に編集・挿入できるわけだが、トラック横断的にすべてが一律に変更される。なので、この拍子設定機能を使って、例えばあるトラックは4拍子で、また別のトラックでは3拍子で、といったポリリズムの展開はできない。しかし特にこの機能を使用する必然性はないわけであって、上述のようにクオンタイズのグリッドを自由自在に切り替えれば小節単位であっけなく簡単に編集できてしまう。正にコロンブスの卵である。

f:id:daw_jones:20200504222231p:plain

応用すれば、4拍子と5拍子といったポリリズムも難なく実現する(下例参照)。

f:id:daw_jones:20200504223224p:plain

菊地氏が指摘するように、現代ポピュラー曲ではほぼ100%と言ってよいぐらい4/4拍子が圧倒的多数を占めていると思われるが、リズムパターンがありきたりになりがちなので、それを打破する一つのアプローチとしてポリリズムは結構創作欲を刺激するのではなかろうか。グルーブ感に豊かな多面性を持たせるテクニックとしても有用だろうと思う。ただし、あんまりやり過ぎるとアフリカ民謡みたいになってしまう罠はあるが。