Bleeping Computerは1月26日(米国時間)、「Yandex denies hack, blames source code leak on former employee」において、ロシアの最大手検索エンジンである「Yandex」のソースコードリポジトリが漏洩したと伝えた。元従業員によってリポジトリデータの漏洩が行われたと説明されている。

Yandex

漏洩したリポジトリには、次の製品に関する技術データおよびコードが含まれていると指摘されている。

Yandex検索エンジンおよびインデックスボット

Yandex Maps

Alice (AIアシスタント)

Yandex Taxi

Yandex Direct (広告サービス)

Yandex Mail

Yandex Disk (クラウドストレージサービス)

Yandex Market

Yandex Travel (旅行予約プラットフォーム)

Yandex360 (ワークスペースサービス)

Yandex Cloud

Yandex Pay (支払い処理サービス)

Yandex Metrika (インターネット分析)

研究者のAlex Buraks氏は。分析した結果をYandex検索エンジンのランキングファクタとしてTwitterで指摘している(参考「Alex Buraks / Twitter」)。

指摘されている主な内容は次のとおり。

クロールの深さがランキング要素。メインページから1クリックがトップページ、3クリック以下が重要なページ

メインページからのバックリンクは、内部ページからのバックリンクよりも重要

検索クエリの数がランキング要素

Wikipediaからのトラフィックはランキング要素

URLが検索セッションの最後の場合にはランキングに影響を与える

ブックマークはランキング要素

ショートビデオ(Tiktok、Shorts、Reels)は別途ランキング要素

ページにおけるMaps js-apiはランキング要素

URLのキーワードはランキング要素(検索クエリから最大3単語まで含めるとよい)

リピーターはランキング要素

大文字の割合はランキング要素

直接トラフィックの割合はランキング要素

組み込みビデオはランキング要素(壊れた組み込みビデオは悪い)

ソーシャルネットワーク上の検証済みアカウントはほかのURLとは異なるランキング付け対象

キーワードのすべての単語がバックリンクアンカーに含まれている方がSEOに効果的

よい被リンクと悪い被リンクの比率がランキング要素

ドメイン上のテキストの品質がランキング要素

ページ上の広告の量がランキング要素(広告が少ない方がランクが高い)

Google AnalyticsのJavaScriptがランキング要素(Google Analyticsを使っているサイトの方がよい)

PageRankによるトップ100 Webサイトからのバックリンクはランキングに影響する

漏洩したデータからはYandex検索エンジンが行っているページランキングの仕組みを見ることができるとし、SEO関係者から注目を集めている。