Внутренние документы «противоречат» публичным заявлениям о том, как работает поисковик.
В сети появились внутренние документы, описывающие, как Google ранжирует результаты поиска. Вероятно, утечка произошла в результате случайной публикации документов ботом Google. Материал, по-видимому, был непреднамеренно передан в общедоступный репозиторий на GitHub собственным автоматизированным инструментом веб-гиганта.
Эта автоматизация прикрепила к коммиту лицензию Apache с открытым исходным кодом, как это стандартно применяется для публичной документации Google. Последующий коммит попытался отменить утечку.
В просочившейся документации дается представление о внутренней работе поиска Google. Файлы примечательны тем, что они раскрывают информацию о вещах, которые Google считает важными при ранжировании веб-страниц по релевантности. Это представляет неизменный интерес для всех, кто занимается SEO-продвижением сайтов и бизнесом в интернете, надеясь, что Google поможет им привлечь трафик.
Некоторые SEO-специалисты считают, что документы содержат примечательные детали, поскольку они отличаются от публичных заявлений представителей Google, сделанных на протяжении многих лет.
В частности, в Google неоднократно отрицали, что используют сигналы пользователей, ориентированные на клики, а также, что поддомены рассматриваются отдельно при ранжировании. Отрицалась также «песочница» для новых веб-сайтов, и то, что учитывается «возраст» домена.
Однако в документах раскрывается, что в рамках сжатых сигналов качества, которые Google хранит для документов, может быть рассчитан показатель «siteAuthority».
Еще одна просочившаяся в сеть откровенность — важность кликов (и различных типов кликов (хороших, плохих, длинных и т. д.), которые определяют, как ранжируется веб-страница.
Другое признание заключается в том, что Google использует просмотренные в Chrome веб-сайты в качестве сигнала качества, который отображается в API как параметр ChromeInTotal . Один из модулей, связанных с показателями качества страниц, включает измерение просмотров на уровне сайта из Chrome.
Кроме того, в документах указано, что Google учитывает и другие факторы, такие как свежесть контента, авторство, соответствие страницы центральной теме сайта, соответствие заголовка страницы содержанию и «средний размер шрифта термина в тексте документа».
После такой публикации документов, компания Google сообщила, что «всем следует успокоиться и помнить, что в случайно раскрытых файлах может отсутствовать важный контекст».
Изображение: ИИ