Нам врали: Google случайно опубликовал 2500-страничный документ о своем алгоритме поиска
Источник:
WccftechЕсли вы интересовались, почему ваш сайт не поднимается в поиске Google, несмотря на то, что все озвученные компанией требования соблюдены, то теперь у нас есть ответ: эти требования не соответствуют тому, как на самом деле устроены алгоритмы компании. Это было обнаружено в случайно слитых документах об этих самых алгоритмах.
Слит документ, в котором подробно описывается, как работает поисковое ранжирование
Только Google всегда знал, какие факторы он принимает во внимание при работе системы ранжирования в Поиске. Компания давала пользователям лишь мелкие намеки на то, каким характеристикам должны соответствовать их сайты, чтобы подняться на первые позиции в выдаче. Предположительно, корпорация скрывает детальные инструкции, во избежание злоупотребления со стороны мошенников и недобросовестных ресурсов. К сожалению, это часто приводит к тому, что вполне приличные и порядочные сайты проседают и не показываются пользователям, а мошеннические и спекулятивные – наоборот взлетают выше.
Смотрите также Клей в пиццу и диета из камней: ИИ Google вдруг начал генерировать катастрофические результаты
Что ж, теперь мы можем пролить больше света на этот вопрос, поскольку внутренний документ компании появился в интернете. Похоже, что произошла непреднамеренная утечка большого файла – Google сам случайно опубликовал его на GitHub 27 марта, а разработчик Рэнд Фишкин успел его просмотреть, прежде чем файл исчез из сети 7 мая. Однако поскольку индексация осуществлялась сторонним сервисом, копия документа все еще доступна.
Имея опыт в сфере поисковой оптимизации, Фишкин утверждает, что каждый, кто работает в этой области, должен ознакомиться с ним. Документ под названием "Google API Content Warehouse" содержит информацию, связанную с внутренними API, и объясняет, какие факторы и компоненты влияют на результаты поиска. Это явно означает, что документ является своеобразным чит-кодом для ранжирования в Google, но он не так прост, как кажется на первый взгляд.
Общий объем документа составляет 2 500 страниц, и хотя некоторые компоненты более старые и могут быть уже неактуальны, другие можно классифицировать как современные. Владельцы сайтов и маркетологи могут получить приблизительное представление о том, что работает или не работает в их настройках SEO, работе самого сайта и качестве контента, и какие факторы являются решающими для ранжирования в поисковой выдаче.
Фишкин в своем отчете пишет, что "документы были подтверждены как аутентичные бывшими сотрудниками Google".
Нас обманули
Представители SEO-индустрии, которые уже успели ознакомиться с документом, утверждают, что некоторые прошлые заявления Google противоречат тому, что указано в документе. Например, об авторитетности домена и о том, как он может влиять на результаты поиска.
Кроме того, из документа следует, что содержимое и ссылки в вашей статье на сайте являются вторичными, а больший вес играет поведение пользователей. Например, если много людей в районе ищут какое-то событие, прокручивая страницы со ссылками, а потом нажимают на одну из ссылок внизу, то Google увидит это и быстро поднимет именно этот линк выше, понимая, что именно это интересно людям по конкретному запросу. Даже если бы статья в Википедии об этом событии была более информативной, или кто-то вложил значительные средства в создание ссылок и оптимизацию содержания в другом материале, маловероятно, что они смогут превзойти сигналы намерений пользователей, рассчитанные на основе запросов и кликов.
Это во многом означает, что заголовки страниц очень важны, ведь люди реагируют именно на них, когда гуглят что-то.
Важны также узнаваемость вашего бренда за пределами Google (так, компания имеет специальные инструменты для отслеживания вашего присутствия в сети, распознавая логотипы или другой визуальный контент), публичность, доверие, навигационный спрос, репутация и ряд других категорий, о которых компания никогда не упоминала.
Компания не сделала никакого заявления в ответ на утечку документов. В марте Google выпустил большое обновление Поиска, которое ставит "полезный" контент выше стандартного. Алгоритмы в основном работают таким образом, что оценивают и определяют, была ли конкретная страница на сайте создана для того, чтобы удовлетворить поисковую систему или людей.
Открытие Фишкина содержит подробную информацию о документе и ключевые выводы, которые могут помочь владельцам страниц подняться выше в поиске.