1

Google Analyticsはスパマーのターゲットとなっていて、ユーザーがどこからやってきたのかチェックしている人をアクセス元であるかのように見せかけてスパムサイトへ誘導するという手口が存在します。そのアクセス元が「ɢoogle.com」となっていると「googleで何かの検索フレーズが引っかかったのだろうか」などと思ってしまいそうですが、この「ɢoogle.com」は「Google.com」ではないスパムサイトなので絶対にアクセスしないようにしてください。「G」が違います。

Here’s a secret: ɢoogle.com is not google.com - Analytics Edge

http://www.analyticsedge.com/2016/11/heres-a-secret-%C9%A2oogle-com-is-not-google-com/

「ɢoogle」の存在を報告したのは分析用途のソフトウェアアドオンを開発しているAnalytics Edge。ちょうどアメリカでは大統領選挙が行われたことで「Vote for Trump」という検索フレーズを使う人が少なからずいたのですが、多くの人のアクセス解析に「ɢoogle.com」というドメインが出現しました。

一例がこんな感じ。「secret.ɢoogle.com」は一見するとGoogleの何かだろうか?と思ってしまうところですが、Googleであれば「secret.google.com」となるはず。



ここで用いられている「ɢ」はラテン文字で用いられる、小文字と同じ高さで作られた大文字「スモールキャピタル」のGで、Unicodeの0262に割り当てられています。



Unicodeは世界の全ての文字を共通したコードで利用できるようにと考えられたもので、「基本ラテン文字(0000-007F)」「ヘブライ文字(0590-05FF)」「ひらがな(3040-309F)」「カタカナ(30A0-30FF)」など種別ごとにまとめて割り当てられています。スモールキャピタルはひとくくりではなく「音声記号拡張」「IPA拡張(国際音声記号)」「ラテン文字拡張D」とバラバラに割り当てられていますが「ᴀ、ʙ、ᴄ、ᴅ、ᴇ、ꜰ、ɢ、ɪ、ᴊ、ᴋ、ʟ、ᴍ、ɴ、ᴏ、ᴘ、ʀ、ꜱ、ᴛ、ᴜ、ᴠ、ᴡ、ʏ、ᴢ」の24文字が利用可能(QとXは割り当てなし)。

通常はドメイン名というとアルファベット・数字・ハイフンが用いられますが「非英語圏のインターネットユーザにとって、 よりわかりやすい文字を使用したドメイン名を利用することができるように」ということで実現した国際化ドメイン名(IDN)のおかげで、このような記号を利用したドメイン名が使えるようになっています。

IDNはNameprepでの正規化、Punycodeでの変換を経て、従来のドメイン名と同様に扱える形に変換されます。例えば、日本語ドメイン名を使っているサイトとしてわかりやすい、秘密結社鷹の爪のポータルサイト「鷹の爪.jp」の場合は「xn--u9j429qiq1a.jp」に変換されます。冒頭部分の「xn--」がこのドメイン名がIDNであることを示しています。

「ɢoogle.com」はこのIDNをうまく悪用してGoogleっぽく見せていると言えます。実際にアクセスすると「money.get.away.get.a.good.job.with.more.pay.and.(中略)buy.me.a.football.team.money.get.back.i.am.alright.jack.ilovevitaly.com」というサイトにたどり着くとのこと。なおAnalytics Edgeとこの件を報じたThe Next Webではコンピューターに損害を与える恐れがあるのでアクセスしないことを推奨しています。