Утечка исходного кода "Яндекса" имеет политические мотивы и является крупнейшим SEO-событием

31 января 2023, 18:31
Читати новину українською

Источник:

ArsTechnica

Об утечке исходного кода большинства сервисов "Яндекса" стало известно 25 января. Компания принялась за расследование и теперь назвала этот случай политически мотивированным. Тем временем эксперты говорят, что это самое большое событие в мире SEO, ведь оно раскрыло важные детали работы поисковой системы.

Напомним, неизвестный слил в сеть 45 гигабайтов файлов с исходным кодом таких сервисов "Яндекса", как "Поиск", "Почта", "Карты", "Алиса", "Диск", "Облако", "Маркет" и другие. Архивы не несут прямой опасности для систем, но помогут хакерам в поиске уязвимостей. Утечка также раскрыла ключевые факторы ранжирования для поисковой системы, которые почти никогда не раскрываются публично.

Раньше Начальный код большинства сервисов российского "Яндекса" слили в сеть

Кто слил данные

  • Автор слива получил файлы в июле 2022 года, но созданы они были 24 февраля 2022 года – в тот же день, когда Россия начала полномасштабное вторжение в Украину.
  • Анализ показывает, что некоторые архивы "точно содержат современный исходный код сервисов", хотя сама компания заявляет, что слитая версия кода не совпадает с текущей.
  • Издание Bleeping Computer, которое пишет об инцидентах с кибератаками, побеседовало с представителем "Яндекса" и тот еще раз подтвердил, что серверы компании не были взломаны в ходе хакерской операции. По его словам, утечка произошла от бывшего сотрудника и является "политической". Он не пытался продать код конкурентам.

До конца не ясно, что он имел в виду. Вероятно, речь идет о том, что кто-то из работников таким образом выразил свое несогласие с вторжением российской армии в Украину, хотя непонятно, как этот "протест" должен был повлиять на решения Кремля.

Кроме того, ранее эксперты, первыми анализировавшие утечку, заявили, что архивы были тщательно вычищены от данных пользователей (или не содержали их с самого начала), и критически важной информации, сделав этот набор файлов бесполезным для любых попыток взлома компании. Он даже не позволяет "собрать" с этого готовый сервис.

В компании, которая, безусловно, является одним из спонсоров российского терроризма и пропаганды, занимаясь распространением вымышленных новостей и платя миллиарды в виде налогов, говорят, что "не видят никакой угрозы для данных пользователей или производительности платформы".

Ранжирование

Под ранжированием подразумевается порядок размещения ответов на запросы пользователей. То есть, какой сайт поисковая система покажет вам первым, а какой опустит в выдаче ниже.

Параметры, по которым поисковые системы анализируют ресурсы, обычно не раскрываются вообще или раскрываются частично. SEO-специалисты порой должны фактически угадывать и путем проб и ошибок исследовать те или иные параметры, чтобы понять, какой вариант распространения публикаций наиболее удачен. Эта утечка 1 922 факторов ранжирования в поисковом алгоритме Яндекса дает понимание того, как работает поисковик "Яндекса".

Он предпочитает следующие страницы:

  • Не слишком старые.
  • Есть много органического трафика (уникальных посетителей) и меньше поискового трафика.
  • Имеют меньше цифр и косых штрихов в URL-адресе.
  • Имеют оптимизированный код, а не "жесткую пессимизацию" из "PR=0".
  • Размещены на надежных серверах.
  • Являются страницами Википедии или на них ведут ссылки из Википедии.
  • Размещаются или на них ведут ссылки со страниц высшего уровня в домене.
  • Имеют ключевые слова в URL (до трех).

Источник отмечает, что в "Яндексе" якобы работают несколько человек из Google, а это может означать, что как минимум некоторые из факторов ранжирования актуальны и для американской поисковой системы. Исследователь Алекс Буракс в своем треде в твиттере отмечает, что первым фактором в списке факторов ранжирования "Яндекса" является "PAGE_RANK", который связан с основным алгоритмом, созданным соучредителями Google.