ツイッターのつぶやき、人間と「ボット」識別する技術
つぶやきの内容を複数の数値に変換して、深層学習にかけて人間のつぶやきかボットのつぶやきか識別する。基本事項としてフォロワーの数やフォロー数、プロフィル、アカウント数などを学習させるが、これだけでは偽装されたボットも存在する。そこで単語を数値ベクトルに直すほか、ボットのつぶやきとの類似度、文字列を分割した文字の長さの統計など、つぶやき自体の内容を学習に利用した。
SNSではボットからフォロー要求がきても、どんな相手か確認して、ボットを友人にしないと信じられてきた。
だが相手を確認する人は2割程度という報告もある。ボットの高度化や巧妙化は進んでおり、選挙に向けてフェイクニュースなどを拡散する手段になっている。
