ウェブサイトの解析ツール・SparkToroとTwitter向けの解説ツール・Followerwonkが、共同でTwitter上で公開されている4万件超のアカウントを分析し、その結果をまとめたレポートを公開しました。この調査によると、Twitter上での活動が確認されている「アクティブなTwitterアカウント」のうち、19.42%がスパム・偽アカウントであることが明らかになっています。

SparkToro & Followerwonk Joint Twitter Analysis: 19.42% of Active Accounts Are Fake or Spam - SparkToro

https://sparktoro.com/blog/sparktoro-followerwonk-joint-twitter-analysis-19-42-of-active-accounts-are-fake-or-spam/

Twitterを買収したイーロン・マスク氏が2022年5月13日に「『スパムや偽アカウントがユーザーの5%未満である』というTwitterの試算を裏付けるデータが出てくるまで、Twitterの買収を一時的に保留にします」とツイートしました。





これを受け、複数のメディアや関係者がSparkToroの提供するFake FollowersというTwitter分析用の無料ツールを使用して、Twitterについての調査を実施しています。しかし、SparkToroは「Fake Followerはあくまで非公式の無料調査をサポートするためのツールであり、ビジネス向けには別の調査ツールを提供しています」と記し、Fake Followerを用いた分析では調査結果が不十分なものとなる可能性を危惧しています。

そこで、SparkToroはFollowerwonkと共同で、Twitterにおける「スパム・偽アカウントの割合」を分析したそうです。なお、今回の調査における「スパム・偽アカウント」は、「定期的に人間の手でツイートコンテンツが作成されたり、タイムライン上でアクティビティ(他者のツイートをチェックするなど)が確認されたり、Twitterのエコシステムに関与したりといった行動が確認されないアカウント」だそうです。

SparkToroによると、偽アカウントの多くは悪意のない問題のないアカウントだそうです。偽アカウントの具体例としては、ウェブサイトの投稿を自動でTwitter上に投稿する@newsycombinatorや、Googleマップ上で発見した任意のレストランについてツイートする@_restaurant_botが挙げられています。こういった自動投稿型のTwitterアカウントはTwitter上に多数存在しており、ユーザーにとって有意義なアカウントとなっているため、「悪意も問題もない」とSparkToroは指摘しています。

一方で、スパムアカウントは宣伝・偽情報の捏造・フィッシング詐欺・マルウェアの配布・株式や仮想通貨の操作・ユーザーへの嫌がらせや脅迫などに利用されており、ユーザーにとって望ましくない迷惑な存在であると述べられています。

なお、今回の調査におけるスパム・偽アカウントは比較的保守的な解釈に偏っており、「企業アカウントのように複数の人間により不規則に運用されているアカウント」や「半自動的に運用されているアカウント」は、偽アカウントに分類されないそうです。



以下が今回の調査結果をまとめたグラフ。水色が直近90日間で1回以上ツイートしているアクティブアカウントのスパム・偽アカウント率を、赤色がTwitterアカウント全体のスパム・偽アカウント率を、緑色がTwitterが2021年第4四半期に公開したデータで記されていた「Twitterのスパム・偽アカウント率」を示しています。



上記グラフの左端にある「Followerwonk Sample」は、Followerwonkにインデックスされている10億4700万件のTwitterアカウントのうち、「公開アカウント」であり「アクティブアカウント(直近9週間で1件以上のツイートを投稿しているアカウント)」であるという条件を満たす1億3000万件のアカウントうち、ランダムに選出したアカウント4万4058件を分析したもの。なお、アクティブアカウントを重視している理由は「Twitterが収益化の指標としているmDAU(Monetizable Daily Active Usage:広告表示可能な収益につながるアクティブユーザー)に近い数字がアクティブアカウント数であるため」とSparkToroは説明しています。分析の結果、アクティブアカウントのうち8555件(19.42%)がスパム・偽アカウントであると分類されました。SparkToroは「このデータはTwitterのアクティブユーザーのスパム・偽アカウント率を示す最良のデータ」と記しています。

グラフの左から2番目にある「SparkToro Fake Followers」は、SparkToroのFake Followerが収集した50万1532件のTwitterアカウント(アクティブアカウントであるか否かについては考慮せず)のスパム・偽アカウント率を分析したもの。SparkToroは「このデータはTwitterで取得できるアカウントの最大データセットを分析したものですが、過去90日間でツイートしたか否かについては考慮していません」と記しています。これによると、Twitterアカウントのスパム・偽アカウント率は22.35%です。

グラフの左から3番目にある「Followers of @Twitter」は、イーロン・マスク氏のTwitterアカウントのフォロワー9340万件を分析したもの。これによると、マスク氏のTwitterアカウントのフォロワーの16.0%がスパム・偽アカウントだったそうです。

グラフの左から4番目にある「@ElonMusk Active Followers」は、マスク氏のTwitterアカウントをフォロワーしているアクティブアカウント(2680万件)のスパム・偽アカウント率を分析したもの。分析の結果、スパム・偽アカウント率は23.42%です。

グラフの左から5番目にあるデータは、マスク氏のTwitterアカウントをフォローしているユーザーをランダムに100人抽出し、スパム・偽アカウント率を分析した結果。この場合のスパム・偽アカウント率はなんと驚異の70.23%でした。

SparkToroはマスク氏のTwitterフォロワーをランダムに抽出した場合のスパム・偽アカウント率が70%を超えた理由について、「人気の高いアカウントは他のアカウントよりもスパム・偽アカウントによるフォローが多い傾向にある」「マスコミによる報道や公益に関わるアカウントは他のアカウントよりも多くスパム・偽アカウントにフォローされる傾向にある」「マスク氏のアカウントはTwitterが新規ユーザーに推奨するアカウントであり、これらのアカウントではスパム・偽アカウントによるフォローが増える傾向がある」といったものを挙げています。



SparkToroによるスパムアカウント特定モデルは、同社が2018年7月に業者から購入した3万5000件のスパムアカウントと5万件の非スパムアカウントを合わせた8万5000件分のアカウントデータセットを用いた機械学習プロセスによりトレーニングされています。これによると、スパムアカウントには「プロフィール画像が設定されていない」「フォロワー数が異常に少ない」「ツイート数が少ない」「アカウント名が特定のキーワードとパターンにより構築されている」などの特徴があるそうです。なお、SparkToroのスパムアカウント特定モデルは65%以上の精度でスパムアカウントを正しく識別可能で、スパム・偽アカウントを通常のアカウントと誤識別することはあっても、通常のアカウントをスパム・偽アカウントと誤識別することは「ほとんどない」とSparkToroは記しています。