Report
【連載】TECH-MAG 研究室レポート
この研究が未来を創る vol.23
取材日:2022.1.24
耳コピで実用に近いレベルの楽譜を作成。音楽研究・教育の発展に貢献する『自動採譜研究』
京都大学 大学院情報学研究科 吉井和佳准教授、
白眉センター 中村栄太特定助教
好きなことを極め、
人とAIの協調に
寄与したい
vol.
23
OPENING
音楽を聴いてその楽譜を書き起こすことを「耳コピ」といいますが、高度な専門知識が必要です。こうした高度な技術をコンピュータで再現しようという研究を、京都大学の吉井和佳准教授、中村栄太特定助教らのグループが行っています。今回は、本研究の内容や今後の展望などを吉井先生、中村先生に伺いました。
Profile
右:吉井 和佳(よしい かずよし)
先生
京都大学 大学院情報学研究科 准教授。
2008年、京都大学大学院情報学研究科博士課程修了。産業技術総合研究所メディアインタラクション研究グループの研究員を経て、2014年に京都大学大学院情報学研究科講師に着任。2018年より現職。
左:中村 栄太(なかむら えいた)
先生:左
京都大学 白眉センター特定助教。
2012年、東京大学大学院理学系研究科物理学専攻博士課程修了。国立情報学研究所特任助教、明治大学研究・知財戦略機構研究推進員などを経た後、2015年より京都大学大学院情報学研究科研究員。2019年より現職。
京都大学 大学院情報学研究科 知能情報学専攻 音声メディア分野
http://sap.ist.i.kyoto-u.ac.jp/
音楽データから楽譜を自動で生成
まず、吉井先生の研究室でどのような研究を行っているのかを教えてください。
吉井先生私たちが取り組んでいるのは、機械学習(マシンラーニング)を用いた「自動採譜」です。現在は「ピアノ演奏の自動採譜」と「ポピュラーミュージックの自動採譜」の2つを軸に研究を進めています。
枠組みとしては音声認識と同じです。音声認識では、大量の「音声信号」と「文字列」とのペアデータから対応関係を学習させることで、音声信号を文字列に変換することができます。自動採譜も同じで、「音楽信号」と「楽譜」とのペアデータから対応関係を学習させることで、音楽信号を楽譜に変換することができます。
「採譜」は、演奏を正確に聴き取って譜面に書き起こす作業ですが、誰でも簡単にできることではありません。もし、音楽データをコンピュータに読み込ませるだけで、自動的に楽譜になれば、音楽を演奏する人にとってはうれしいですよね。「夢をかなえる研究」なのかなと思っています。
2021年6月には、世界で初めて、「ピアノ演奏から実用に近いレベルの楽譜の自動作成」に成功されました。本研究についても教えてください。
中村先生先ほど吉井先生が話された「ピアノ演奏の自動採譜」の研究成果です。そもそもピアノ演奏の採譜は非常に難易度が高く、世界中で研究が行われているものの、実用レベルの楽譜生成はできていない状況でした。
課題はピアノ演奏ならではの複雑な音の組み合わせやピッチの認識です。そこで私たちは、数百曲に上る演奏データの「音の波形」や「和音パターンの関係性」を調べ、楽譜データからは「リズムパターン」の特徴を解析。これらを機械学習させることで、従来は難しかった音の認識精度を向上させることに成功しました。
生成した楽譜を音楽高校の生徒に試してもらったところ、93%の生徒が「部分的に演奏に用いられる」、74%が「採譜に役立ちそう」と高い評価を得ました。
人が採譜したものに近い精度に仕上がっているのですね。
中村先生とはいえ、まだ完璧でないので、より実用レベルに近い楽譜が生成できるようにしたいと考えています。例えば、ピアノの楽譜は右手と左手のパートに分かれています。さらにそれぞれの手の中でも異なるパートに分かれていたり、メロディーと和音に分かれていたりと複雑です。こうした、「音楽の構造」を反映した楽譜にすることが課題になっています。また、アルペジオなどの装飾音の認識、強弱記号といった、楽譜に記されている音楽要素を正しく認識していくことが次のチャレンジだと考えています。
音楽産業・文化の発展に貢献する研究
吉井先生、中村先生の研究は、私たちの生活にどのような影響をもたらしますか?
中村先生そもそも本研究の背景にあるのが、楽譜の入手のしづらさと採譜難易度の高さです。現在において、楽曲自体は安価で聴けるようになったものの、楽譜は高価でそう何度も買えるものではありません。かといって採譜するにも、多くの時間と専門知識を要します。
もし自動化できれば、楽譜を買う必要がなくなり、音楽を楽しむハードルが下がるのではないでしょうか。音楽の楽しみ方も大きく変わる可能性があります。例えば、「カラオケ」で採点機能がありますが、同じように自分で弾いた楽曲を楽譜データにできれば、元の楽譜との比較もできるようになります。音楽教育という分野での活用も考えられます。
吉井先生どんな演奏でも自動で楽譜化できるようになれば、有名なシンガーがアドリブで弾いた楽曲など「楽譜のない楽曲」に対してもアプローチできるようになります。また、楽曲の検索にも影響を与えるかもしれません。従来は楽曲名やアーティスト、歌詞の一部で検索しますが、メロディーやコード進行で曲を探したいというニーズもあります。単に音楽データを楽譜にするだけでなく、編曲や楽曲解析、自動作曲などへの応用も期待されています。
音楽文化の発展にもつながりそうですね。
中村先生そうですね。自動採譜は必ずしも音楽産業だけでなく、古い楽曲の分析や民族音楽の解析など、音楽に関わる様々な学術分野での「基盤技術」としても求められています。
吉井先生特にヨーロッパは文化の積み上げを重要視し、音楽のアーカイブ化を進めていますので、文化への貢献にもなるとうれしいです。とはいえ、ただ音源をデータとしてアーカイブするだけでは、保存されたまま日の目を見ないかもしれません。昔の紙の楽譜に関しても、画像としてスキャンして保存するだけでは意味がありません。「使える形」として、記号としての楽譜を蓄積していくことで、音楽や文化への理解が深まるのではないでしょうか。
映像や画像において、AIによるフェイクが問題になるなど、人が中心になって行っていたサイクルにAIが入ることで、問題が起こることもあります。音楽においては今後どうなるか分かりませんが、「人とAI」が良い形で協調できるよう、私たちの研究が寄与できればうれしいです。
新しい世界を研究し、切り開く
「自動採譜の研究」の面白い点を教えてください。
中村先生従来、音楽は人文学や芸術学といった分野で研究されていました。しかし、現在は機械学習など、科学的な分析技術が発達し、これまでと異なる形での研究が可能になりました。科学的な視点で、定量的に音楽という「文化」を調べることができるのは、シンプルに面白いと感じています。音楽情報学はここ数十年で広がってきた新しい研究分野なので、新しい世界を研究し、切り開くという面白さもありますね。
吉井先生もともと「人間がなぜ音楽を楽しめるのか」という疑問を持っていました。多くの人は、音楽の専門教育を受けているわけではないのに、音楽を聴いて楽しめています。音を聞いて、これは音楽だ、いや音楽じゃないという線引きも人や国によって違います。音楽における文化的な背景や、音楽を理解する能力の先天・後天性の境界など、自分の興味を研究を通して理解できるのが面白いと思います。
そもそも研究者になった理由は何でしょうか?
吉井先生音楽に限らず、人が聴覚を通じて環境を理解する能力がどうなっているのか、この能力を計算機上で実現するにはどうすればいいのかを考えることに興味があったからです。そのため、大学時代から音楽を研究していました。当時はまだディープラーニングはなく、音を計算機上で解析するのも難しい時代でしたね。
中村先生私は音楽にも科学にも興味があったので、「両方につながる研究を」ということで今の道に進みました。ただ、大学時代から音楽の研究をしていたのではなく、博士課程までは素粒子物理の研究が専門でした。まずは物理を学んで、先々に音楽の研究をしようと、少し一般的ではない考え方でした。
吉井先生博士で研究したことを専門にするケースが一般的ですが、中村先生はダークマターなどの素粒子物理の研究から音楽という、珍しいパターンです(笑)。
中村先生ですので、学生の皆さんはあまり参考にならないかもしれません(笑)。
お二人は「研究すること」の魅力はどんな点だと感じていますか?
中村先生何に興味があるかは人それぞれですが、自分が興味を持っていることを、さまざまな視点で突き詰められるのが研究の面白い点だと思います。物の見方、視点が増えますし、視点が増えることでより深い理解につながるのも楽しいと感じる点ですね。
吉井先生自分がしたいと思うことを自分で決め、自分の手で進められること、ですね。とはいえ、お金をもらって研究しているわけですから、いくら興味があってもどうしようもないものを作っていては意味がありません。本当に科学に貢献するものなのかを考えて研究することも大事です。
ただ論文を出すために研究することはよくありません。
論文を出すことを目標にすると楽しくないですからね。自分の興味と社会とのつながりを意識しながら研究し、その結果として新しい発見ができれば、世界全体の知識が増えた、世界に貢献できたという感覚が得られます。
音楽における普遍的な真理を発見したい
今後の展望があれば教えてください。
吉井先生自動採譜の研究は中村先生のご尽力もあり、一気に花開きました。学生たちの努力、機械学習の進化もあり、非常に「良いところ」まで進んでいます。今後はさらにもう一段上に押し上げられるよう取り組んでいきたいと思います。特に私たちの研究分野は学習データの量を簡単には増やせないということもあり、単なる物量作戦では突破できません。現在、GAFA(「Google」「Apple」「Meta(旧Facebook)」「Amazon」の4社)も研究を進めていますが、こうした世界の巨人と戦っても負けないような技術を生み出すのも、トップランナーの役目だと感じています。
中村先生私も音楽の「知能」や「文化」といった部分に可能性を感じています。物理のように、知能や文化の研究が自然科学の一つとして発展すればうれしいですし、自分がそこに貢献できるよう、今後も研究に取り組みたいと思います。
最後に、今後を担う若い世代にメッセージをお願いします。
吉井先生ありがちですが「知的好奇心を持つこと」が大事かなと思います。研究において大事なのは「なぜこれができないのか」という、難しさの原因を導き出すことです。現代社会では、「できなくてあたりまえ」と思考停止してしまっていることも多く、普段から問いを重ねる訓練をしないと、いざという場面で問題解決ができず、新しい発見もできません。普段から「なぜそうなるのか」という背後の原理を、答えがあってもなくても、まずは自分なりに考えるようにしてほしいです。その積み重ねが、将来役に立つのではないかと思います。
中村先生数学や英語といった基礎的な学習も大事ですが、やはり「好きなことを極める」ことが重要だと思います。そのためにも「何が好きなのか」を知ることにも努力してほしいです。普段から何気なく生活していると、自分が好きなことに意外と気付けないものです。吉井先生の「問いを重ねる」ことと同じになりますが、何が好きなのか、何が面白いと思ったのか、意識してほしいですね。また、自分が興味のないことでも調べてみるなど、幅広く興味を持つことも大事なことです。
吉井先生研究者になるといっても、自分がしたいと思ったことができるとは限りません。実際に着手してみると、「思っていたのとは違う」と感じることも多々あります。考えや興味の幅が狭いと、いざというときに困ってしまいます。いろんなことに興味を持ち、自分の考えを広げる度量が大事になります。
ありがとうございました。
NEW GENERATIONS INTERVIEW
吉井先生の研究室で学ぶ平松祐紀さん(修士2回生)に、担当している研究の面白い点や、大学の研究室の魅力を伺いました。
現在どんな研究に取り組んでいるのかを教えてください。
私は中村先生が主導されている「ピアノ採譜」の研究に携わっています。具体的には、ニューラルネットワークを用いた採譜技術の向上で、例えばピアノの音価や両手パート、声部(それぞれのパートが受け持つ部分)を推定する技術を研究しています。
先ほど中村先生の話にもあったように、ピアノの楽譜は右手と左手の2段に分かれています。また、ピアノは同時に複数の音が鳴っているため、楽譜にするには、その中から1段目の音と2段目の音を正確に判定する必要があります。どのようにすればこの推定技術を高めることができるのかを考えています。
普段はどのような形で研究に取り組んでいるのでしょうか?
基本的にずっとパソコンでプログラムを書いています(笑)。
担当している研究の面白い点、難しい点を教えてください。
私自身ピアノを弾きますし、自分で耳コピする難しさを知っているので、「自動で楽譜が作られるようになる技術」には興味がありますし、面白いと感じています。研究をする上でも、思ったとおりの成果が出たときはうれしいです。一方で、前例のない研究なので、正解が分からない中で物事を進めないといけない難しさもあります。
大学の研究室で学ぶ魅力を教えてください。
「自分がしたいこと」に取り組める点ですね。私の場合はピアノが好きなので、ピアノの自動採譜の研究をしていますが、同じように興味がある分野を研究している人が多いです。もちろんどの研究も難しく一筋縄ではいきませんが、先生のサポートでうまく進められています。手厚いサポートを受けながら好きなことに取り組めるのは、大学で研究する魅力かもしれませんね。
ENDING
吉井先生、中村先生の話にもありましたが、音楽の自動採譜は音楽産業だけでなく、音楽文化の発展にも大きな影響を与えるかもしれません。音源しか残っていない過去の名音楽家の演奏が楽譜化されたり、即興演奏がその場で楽譜になったりと、面白い活用方法が生まれるかもしれません。
文:中田ボンベ@dcp
写真:宇佐美 宏