« 茨城・常総学院野球部元監督 木内幸男氏の「ラジオ深夜便」での話 | トップページ | 胃カメラでノドを痛めた話 »

2013年8月28日 (水)

SONYの音源から楽曲情報を取得する仕組み~グレースノート

何度も書いているが、自分はFM放送からSONYのPCMレコーダ(NAC-HD1)で「歌謡スクランブル」などを録音して、歌集めをしている。このNAC-HD1は、放送されたアナログ音源から楽曲情報を検索してくれるので非常に便利。
自分の良く聞くNHK FMの「歌謡スクランブル」という番組では、毎月最終週に「話題のホットミュージック」として(月)(火)は演歌・歌謡曲、(水)~(土)はJポップの新しい曲が放送される。今月(2013年8月)は、今週放送中だ。
それが今週、状況が激変した。つまり、突然(月)(火)の演歌・歌謡曲の放送で、曲名取得が出来ていないのだ。普通は、曲が始まると「検索中」の表示が出て、ほどなく曲名が表示されるが、軒並み「該当する情報がありませんでした」という表示。前月までの同じ番組では、幾ら新しい曲でも表示されていたのに・・・
楽曲名が取得出来たのは、(月)は1勝11敗、(火)は0勝12敗、そして今日(水)のJポップは、5勝8敗(内2曲は別の曲を取得)だった。

これはヤバイ。SONYが“エニーミュージック”とかいうサービスを終了したので、その影響で、今後未登録の新曲の楽曲情報が取れない??と要らぬ心配をして、問い合わせてみた。
まずSONYの回答は、「このサービスは、グレースノートという会社が行っているサービスを、SONYは単に利用しているだけなので、分からない。」
それで、Netで検索してグレースノートに問い合わせたら、非常に親切に色々と教えてくれた。そして勉強になった。それをメモしておく。
まず音源から楽曲情報を検索する原理だが、Netで調べたら10年近く前の2004年の記事だが、下記に詳しい。

音声から音楽情報を検索
 多くのジュークボックスソフトは、音楽CDから音楽をPCに取り込むとき、自動的に曲名やアーティスト名などのデータをデータベースから検索して、IDタグやファイル名に入力してくれる機能を持つ。一般には「CDDB」として知られるこの検索サービスを提供しているのが、米Gracenote社である。

 現在Gracenoteでは、CDDBとして楽曲で約3000万曲、CDにして約280万枚分の音楽IDデータを保有している。例えばiTunesにCDを突っ込んで音楽情報を検索するとしよう。CDDBのエンジンはまず、音楽CDのTOC(Table Of Contents)のデータを読み取る。そのデータを使ってデータベースを検索し、特定のCDの情報を返す、という仕組みだ。
 お気付きのように、このサービスの限界は、音楽CD以外のメディアからはデータベースの検索ができない、という点にある。例えばLPレコードを録音したものであったり、ダウンロードしてバラで買った曲などに対しては、検索する方法がないわけだ。特に米国では楽曲のダウンロード販売が本格的に立ち上がったこともあって、“音楽の入れ物”が必ずしもCDではないという現象が一般化しつつある。
 Gracenoteの「MusicID」は、音楽の波形データを元に、楽曲の情報を検索できる技術だ。波形データとはいっても、それをそのままデータベース化したのでは、曲データそのものを保有することと変わりない。これではデータ量が膨大になりすぎる。
 そこでMusicIDでは、まず音楽の波形データから、その特徴的な要素のみを抽出する。言わば音楽のガイコツみたいな、ユニークでありながら軽いデータを作り出すわけである。これを彼らは「FingerPrint(指紋)」と呼んでいる。そのFingerPrintの情報を、CDDBと同期させるというわけだ。
 だがFingerPrintを作り出すためには、元となる楽曲の波形が必要だ。自社でそれをやるということは、世界中の音楽をいったん自社で買うということになる。しかしそれではビジネスにならない。そこで彼らはうまい方法を考えた。
 CDDB検索エンジンの中に、FingerPrint生成機能を埋め込んだのである。つまりCDDBのユーザーがCDを突っ込んでIDを検索するときに、その楽曲のFingerPrintをユーザーのPC内で作り、CDDBに送信するという仕掛けだ。
 そもそも初期のCDDBでは、検索しても見つからなかったCD情報をユーザーが自分で入力し、それをCDDBに登録するという機能を持っていた。言わばCDDBは、ユーザー自身が成長させていったデータベースなのである。FingerPrintは、それと同じことをユーザーが気が付かないうちにやってしまう。こうして集められたFingerPrintは、現在400万曲。現在も週2~3万曲といったペースで増え続けている。」
(2004年03月08日付の(ここ)より)

<グレースノートから教えて頂いたこと>
・楽曲は最初の10~20秒ほどをデータ化している。(ここによると、「1曲分のサウンド指紋の容量はたったの64byteとのこと」)
・SONYのHDD機器には、予めデータベースが収納されており(NAC-HD1では約35万枚分)、そこに合致しないとNetで探しに行く仕組み。⇒なるほど、古い楽曲は、LANケーブルを外しても検索出来た。
・グレースノートのデータベースには、今週検索NGになったNHKの番組の楽曲は全て登録してある。
・ただし、その全曲にフィンガープリント(音楽の指紋)が登録されているかどうかは分からない。
・楽曲情報は、レコードメーカーから情報が提供される場合もあるが、人気のある曲はグレースノートが情報を登録している。
・音源の波形情報であるフィンガープリントの情報を登録しているサーバーは、容量が限られているため、人気のある楽曲が優先され、マイナーな曲は落とされて行く。
・グレースノートとしては、何ら変化は無い。よって、(月)(火)の曲名取得が出来なかったのも、たまたま人気のないマイナーな曲(特に演歌は・・・)だったのでは? しばらく日にちが経てば、登録される可能性もある。
・今日放送された人気楽曲「ピースとハイライト」 (サザンオールスターズ)が「該当する情報がありません」という表示になった理由は分からない。
・もちろん音源にノイズが乗っていたりして、音質に問題がある場合は検索出来ない。

結局、これと言った原因は分からなかった。グレースノートとは「来月の同じ番組でどうなるか、長い目で見ていきましょう」となった。まあ仕方がないな・・・。
しかし、ひょんなことで、今まで不思議に思っていた音源による楽曲情報の検索システムの仕組みが、少し理解出来たような気がした。何よりも、SONY単独のシステムだとばかり思っていたこの検索システムが、実は世界的な仕組みなので、今後無くなることはない事が分かり、ホッとした。オシマイ。

(2013/09/28追)
9月のNHK FM「歌謡スクランブル」「話題のホットミュージック」では、ほぼ完璧に曲名取得が出来ていた。前月の曲名も日を経る毎に取得できるようになったので、先月だけ、グレースノートでの新曲の登録作業が遅れていたのかも知れない。まずはホットした。

130827kaunoka <付録>「ボケて(bokete)」より


« 茨城・常総学院野球部元監督 木内幸男氏の「ラジオ深夜便」での話 | トップページ | 胃カメラでノドを痛めた話 »

コメント

こんにちは。

64byteのFingerPrintで照合、大変、勉強になりました。

不調原因のひとつに「SONY/NAC-HD1は自己データベースと照合し、合致しないとNetで探しに行く仕組み」の『Netで探しに行く仕組み』が、起動していない(破損した)可能性もあるかも?ですね。

ところで、自動曲名取得不能ファイルについて、NAC-HD1への手動曲名付与(修正)はできませんか?もし付与(修正)可能なら、「歌手 - 曲名.mp3」のスタイルで、三日分(すべて話題のホットミュージックでしたね)の放送曲名(放送日別、放送順)をメール連絡できますので、必要ならどうぞ。

【エムズの片割れより】
ありがとうございます。実は、NAC-HD1を予備も含めて2台で録音してみました。すると2台とも全く同じ動きでした。取得できるのもは出来るし、出来ないものは両方とも出来ない。それに、先月発売の新譜も、取得できるものは、ちゃんと音楽情報を取得していますので、動作はOKのようです。
取得できないものは手動で名前を付けてます。

投稿: はうろ | 2013年8月29日 (木) 07:26

コメントを書く



(ウェブ上には掲載しません)




« 茨城・常総学院野球部元監督 木内幸男氏の「ラジオ深夜便」での話 | トップページ | 胃カメラでノドを痛めた話 »