spotifyAPIを使ったヒット予測1:過去データの日付ランキング作成

spotifyのAPIを使ってヒット予測を作ってみました。 今回はまず取り掛かりの第一回目として、 1.過去のランキングデータを取得 2.取得したランキングデータをまとめてグラフ化 をやっていきます。


1.過去のランキングデータを取得

https://spotifycharts.com/regional

から日本の日別トップ200ランキングを取得しました。 過去数日ないとランキングの推移が出せないので、ここでは2020年7月1日〜7月13日のデータを取得しています。
取得したファイル一覧がこちら


このcsvを元にランキングのグラフを作っていきます。



2.取得したランキングデータをまとめてグラフ化

jupyter Notebookを使って作業していきます。 細かい詳細は省きますが、csvを一つのフォルダに入れてfor文で「pd.read_csv」で読み込みをファイル文ループ。 2回目以降のヘッダーは読み込まずにそのまま縦方向に追加していく。読み込みが終わったらdataFrameで扱いやすいようにリストを作ります。
ひとまず確認。 X軸に日付、Y軸に再生回数を積んだグラフですが、なんとなくは思っているような出力ができそうです。

csvからのリストは膨大な楽曲数になるため、そのままランキンググラフ化するとカオスになります(笑) そこで、必要な(知りたい)楽曲だけを抜き出し、ランキング推移を表示する方法を取りました。
なぜか目に入ったNiziUにしてしまった(笑)

ここまでくればもう一息。あとはグラフ化するだけです。 多少細かい調整が必要ですが、このようなグラフで表示させることができました。

NiziUは7月1日〜13日の期間、上位にはいますが、7月9日から少し順位を下げているのがわかりますね。
次回はより高度にランキングデータを取り、ランキング予測をしたいと思います。
ではまた!



コメントを残す

メールアドレスが公開されることはありません。