by Andrew Hitchcock

映画を見ようと思ったとき「誰が監督なのか」「誰が主演なのか」など、いろいろな判断基準がありますが、その1つに「どんな評価を得ているのか」があります。じっくりといろいろなサイトのスコアを見比べて、レビューなども参考にするのが一番良いのですが、「とりあえずサクッと知りたいときにはどのサイトを見ればいいのか?」、要するに忙しい人はどの映画批評サイトを参考にすればいいのかというのをデータ科学者のアレクサンドゥル・オルテアヌ氏が調査しています。

Whose ratings should you trust? IMDB, Rotten Tomatoes, Metacritic, or Fandango?

https://medium.freecodecamp.org/whose-reviews-should-you-trust-imdb-rotten-tomatoes-metacritic-or-fandango-7d1010c6cf19



オルテアヌ氏は選定にあたって「どのサイトのスコアが正規分布に最も近いのか」ということを基準にしました。これは、オルテアヌ氏が何百本も映画を見てきた経験で、いい方でも悪い方でも強く印象に残る作品はそう多くはなく、大多数はプロットすらも思い出せなくなる「平均的」作品だったことに基づいています。



候補としたサイトは「IMDb」、「Fandango」、「Metacritic」、「Rotten Tomatoes」の4サイトです。サンプルには2016年〜2017年公開の214作品のデータが使用されました。

ちなみに、この区切り方の理由はFandangoのスコア方式が2015年に変更されていることも一因ですが、調査の中でIMDbの4917作品のスコアデータが見つかり、214作品のデータと同様の分布を見せたことから、オルテアヌ氏は214作品でもサンプルとしては十分だと語っています。

4サイトのスコア分布を示したのがこのグラフです。4サイトはそれぞれにスコアの満点が異なりますが、オルテアヌ氏は「ひどい映画」をスコア下位3割未満、「平均的映画」をスコア3割以上7割未満、「いい映画」をスコア7割以上と定義していて、グラフ上にも線が引かれています。



IMDbは形は正規分布のように中央が高い山型ですが、オルテアヌ氏定義の「ひどい映画」に属する作品が出なかった(低スコアが少ない)のが特徴。

FandangoもIMDbに似ていますが、さらに高スコアなのが特徴。Fandangoは過去に明らかにスコアが高めに寄りすぎていると指摘を受けたことがあります。これがその時の比較グラフ。Fandangoでは2.5以下のスコアがついていません。もともとスコアが0.5刻みな上に端数処理が切り上げなので、「平均すると4.1」のスコアが「4.0」ではなく「4.5」になることもその一因でした。



なお、指摘を受けて係数に変更が加えられたようなのですが、今回のオルテアヌ氏の調査でわかるように、まだ十分ではないようです。

Metacriticも正規分布型なのですが、一方で、他3サイトとは異なる傾向が出たのがRotten Tomatoes。Rotten Tomatoesには批評家らによる肯定的なレビューの割合を示す「Tomatometer」と、観客がスコアを付ける「Audience Score」があり、ここではTomatometerが使用されていますが、上から下まで平らに近く、抜けたスコアはありませんでした。オルテアヌ氏は、多くの映画ではポジティブなレビューとネガティブなレビューが7:3ぐらいになるものだと考えていたので、この結果は不適当だと考えました。

こうした結果から、オルテアヌ氏は「さっと1サイトでスコアを確認したいなら『Metacritic』」と結論を出しました。ただし、Metacriticのメタスコアは加重平均によるスコア算出を行っていて、それぞれのレビューに対して、Metacritic運営チームからレビューの質や他に書いたレビューをもとに0〜100の範囲で重み付けが行われているのですが、その重み付け係数が非公開なため、どのレビューがどうスコアに影響を与えているのかわからない点が欠点だと指摘。また、Metacriticができる1999年以前の映画だと極端にレビュー数が減るほか、英語以外の作品だとリストにすら挙がらないことも難点だとのことです。