Утечка документации Google: 12 важных выводов для линкбилдеров и цифровых пиарщиков

По поводу произошедшей на прошлой неделе утечки документации Google Content API Warehouse уже было высказано множество идей и мнений, в том числе фантастические рецензии от:

Рэнд Фишкин

Майк Кинг (на сайте iPullRank и здесь, в Search Engine Land)

Эндрю Энсли

Но что могут узнать из этих документов линкбилдеры и цифровые пиарщики?

После того, как стало известно об утечке, мы с Лив Дэй, руководителем SEO компании Digitaloft, потратили много времени на изучение того, что документация говорит нам о ссылках. 

Мы приступили к анализу документов, пытаясь получить представление о нескольких ключевых вопросах:

Ссылки все еще имеют значение?

Являются ли некоторые ссылки более вероятными для успеха SEO, чем другие?

Как Google определяет ссылочный спам?

Для ясности: утекшая документация не содержит подтвержденных факторов ранжирования. Он содержит информацию о более чем 2500 модулях и более чем 14 000 атрибутах.

Мы не знаем, как они взвешиваются, какие используются в производстве, а какие могут существовать в экспериментальных целях.

Но это не значит, что информация, которую мы получаем в результате этих исследований, бесполезна. Пока мы считаем, что любые результаты — это то, что Google может вознаградить или понизить в должности, а не то, что они являются, мы можем использовать их для формирования основы наших собственных тестов и прийти к нашим собственным выводам о том, что является или не является фактором ранжирования. 

Ниже мы нашли в документах то, на что линкбилдерам и цифровым пиарщикам следует обратить пристальное внимание. Они основаны на моей собственной интерпретации документации, а также на моем 15-летнем опыте работы в области SEO. 

1. Google, вероятно, игнорирует ссылки, которые не взяты из соответствующего источника

Релевантность долгое время была самой горячей темой в цифровом PR, и ее всегда было нелегко измерить. В конце концов, что на самом деле означает релевантность? 

Игнорирует ли Google ссылки, которые не относятся к релевантному контенту?

Утечка документов определенно указывает на то, что это так.

Мы видим явную ссылку на anchorMismatchDemotion в модуле CompressedQualitySignals:

Хотя у нас мало дополнительного контекста, из этого мы можем сделать вывод, что существует возможность понизить (игнорировать) ссылки в случае несоответствия. Мы можем предположить, что это означает несоответствие между исходной и целевой страницами или исходной страницей и целевым доменом.

В чем может быть несоответствие, кроме релевантности?

Особенно если учесть, что в том же модуле мы также видим атрибут topicEmbeddingsVersionedData.

Внедрение тем обычно используется в обработке естественного языка (NLP) как способ понимания семантического значения тем в документе. В контексте документации это означает веб-страницы. 

Мы также видим атрибут webrefEntities, на который есть ссылка в модуле PerDocData.

Что это? Это сущности, связанные с документом. 

Мы не можем точно знать, как Google измеряет релевантность, но можем быть вполне уверены, что anchorMismatchDemotion предполагает игнорирование ссылок, которые не взяты из релевантных источников.

Вывод?

Релевантность должна быть в центре внимания при получении ссылок, а не над любыми другими показателями или показателями.

2. Местные ссылки (из той же страны), вероятно, более ценны, чем ссылки из других стран

Модуль AnchorsAnchorSource, который дает нам представление о том, что Google хранит об исходной странице ссылок, предполагает, что локальная релевантность может способствовать повышению ценности ссылки.

В этом документе есть атрибут localCountryCodes, в котором хранятся страны, для которых страница является локальной и/или наиболее релевантной.

В сфере цифрового PR уже давно ведутся споры о том, ценны ли ссылки с сайтов в других странах и на других языках. Это дает нам некоторое представление об ответе.

Прежде всего, вам следует уделять первоочередное внимание получению ссылок с сайтов, релевантных для вашего региона. И если мы подумаем о том, почему Google может придавать большее значение этим ссылкам, это имеет смысл. 

Ссылки, релевантные на местном уровне (не путайте это с местными публикациями, которые часто обеспечивают ссылки и освещение с помощью цифрового PR; здесь мы говорим об уровне страны) с большей вероятностью повысят узнаваемость бренда, приведут к продажам и будут более точными. одобрения. 

Однако я не считаю, что ссылки из других регионов вредны. Больше, чем те, где совпадения релевантности на уровне страны имеют больший вес. 

3. У Google есть рейтинг авторитета для всего сайта, хотя они утверждают, что не рассчитывают такие показатели авторитета, как DA или DR

Возможно, самым большим сюрпризом для большинства оптимизаторов, читающих документацию, является то, что у Google есть показатель «авторитетности сайта», несмотря на то, что они снова и снова заявляют, что у них нет таких показателей, как авторитет домена Moz (DA) или рейтинг домена Ahrefs (DR). ).

В 2020 году Джон Мюллер из Google заявил:

«Для ясности: Google *вообще* не использует авторитетность домена, когда дело доходит до сканирования, индексирования или ранжирования в поиске».

Но позже в том же году намекнул на меры по всему сайту, сказав об авторитете домена:

«Я не знаю, можно ли назвать это таким авторитетом, но у нас есть некоторые показатели, которые больше относятся к уровню сайта, некоторые показатели, которые больше относятся к уровню страницы, а некоторые из этих показателей на уровне всего сайта могут своего рода карта похожих вещей». 

Ясно как день: в просочившихся документах мы видим оценку SiteAuthority

Однако мы не знаем, соответствует ли это хотя бы отдаленно DA или DR. Вероятно, поэтому Google обычно отвечает на вопросы по этой теме именно так.

DA Moz и DR Ahrefs — это оценки на основе ссылок, основанные на качестве и количестве ссылок. 

Однако я сомневаюсь, что siteAuthority Google основан исключительно на ссылках, поскольку он ближе к PageRank. Я был бы более склонен предположить, что это некая форма расчетной оценки, основанной на показателях качества на уровне страницы, включая данные о кликах и другие сигналы NavBoost. 

Вероятность состоит в том, что, несмотря на схожее соглашение об именах, оно не соответствует DA и DR, особенно с учетом того, что мы видим ссылку на это в модуле CompressedQualitySignals, а не в модуле, специфичном для ссылки. .

4. Ссылки на новых страницах, вероятно, более ценны, чем на старых

Один интересный вывод заключается в том, что в некоторых случаях ссылки с новых страниц имеют больший вес, чем ссылки со старого контента. 

Мы видим ссылку на sourceType в контексте привязок (ссылок), где качество исходной страницы ссылки записывается в зависимости от уровня индекса страницы. 

Однако здесь выделяется то, что ссылка на недавно опубликованный контент (свежие документы) представляет собой особый случай и считается тем же, что и ссылки «высокого качества». 

Мы ясно видим, что тип источника ссылки можно использовать в качестве индикатора важности, что предполагает, что это связано с весом ссылок. 

Однако мы должны учитывать, что ссылка может быть определена как «высококачественная», не являясь новой страницей, просто они считаются одинаковыми по качеству. 

На мой взгляд, это подтверждает важность постоянного получения ссылок и объясняет, почему оптимизаторы по поисковой оптимизации продолжают рекомендовать, чтобы создание ссылок (в любой форме, это не то, что мы здесь обсуждаем) требует постоянного выделения ресурсов. Это должно быть постоянное действие.

5. Чем больше Google доверяет главной странице сайта, тем более ценными будут ссылки с этого сайта

В документации (опять же, в модуле AnchorsAnchorSource) мы видим ссылку на атрибут homePageInfo, что предполагает, что Google может помечать источники ссылок как ненадежные. , частично или полностью доверено.

Это определяет, что этот атрибут относится к случаям, когда исходная страница является домашней страницей веб-сайта, а другим страницам присваивается значение not_homepage.

Итак, что это может значить?

Это предполагает, что Google может использовать в своих алгоритмах какое-то определение «доверия» к домашней странице веб-сайта. Как? Мы не уверены.

Моя интерпретация: внутренние страницы, скорее всего, унаследуют надежность главной страницы.

Чтобы внести ясность: мы не знаем, как Google определяет, является ли страница полностью доверенной, не доверенной или частично доверенной. 

Но вполне логично, что внутренние страницы наследуют надежность домашней страницы и что это в некоторой степени используется при взвешивании ссылок, а также что ссылки с полностью доверенных сайтов более ценны, чем ссылки с ненадежных.

>

6. Google специально помечает ссылки, поступающие с высококачественных новостных сайтов

Интересно, что мы обнаружили, что Google сохраняет дополнительную информацию о ссылке, когда она идентифицируется как исходящая с «новостного, высококачественного» сайта. 

Означает ли это, что ссылки с новостных сайтов (например, The New York Times, The Guardian или BBC) более ценны, чем ссылки с сайтов других типов?

Мы не знаем наверняка.

Но если взглянуть на это (помимо того факта, что сайты такого типа, как правило, являются наиболее авторитетными и заслуживающими доверия публикациями в Интернете, а также теми, которые исторически имели PageRank на панели инструментов 9 или 10), это действительно заставляет задуматься.

Однако несомненно то, что использование цифрового пиара в качестве тактики получения ссылок из новостных изданий, несомненно, невероятно ценно. Этот вывод только подтверждает это.

7. Ссылки с исходных сайтов или ссылки на них, вероятно, являются наиболее ценными ссылками, которые вы можете заработать

На мой взгляд, начальные сайты и ранжирование ссылочной массы — это тема, о которой не так часто говорят, как следовало бы. 

Однако в этом нет ничего нового. Фактически, об этом писал покойный Билл Славски в 2010, 2015 и 2018 годах.

Утечка документации Google предполагает, что PageRank в его первоначальной форме уже давно устарел и заменен на PageRank-NearestSeeds, на что указывает тот факт, что он определяет его как используемое производственное значение PageRank. Пожалуй, это одна из вещей, которые в документации наиболее ясны.

Если вы не знакомы с исходными сайтами, хорошая новость заключается в том, что это не такая уж сложная для понимания концепция.

Статьи Славского на эту тему, пожалуй, лучший ориентир для этого:

В патенте приведены два примера [начальных сайтов]: каталог Google (он существовал еще во время первой подачи патента) и New York Times. Нам также говорят: «Наборы исходных данных должны быть надежными, достаточно разнообразными, чтобы охватывать широкий спектр областей общественных интересов, и быть хорошо связанными с другими сайтами. Кроме того, они должны иметь большое количество полезных исходящих ссылок, чтобы облегчить идентификацию других полезных и качественных страниц, выступающих в качестве «концентраторов» в сети.

“Под В соответствии с патентом PageRank страницам присваиваются рейтинговые баллы в зависимости от того, насколько далеко они могут находиться от исходных наборов, а также на основе других характеристик этих страниц».

– Билл Славски, обновление PageRank (2018 г.)

8. Google, вероятно, использует «надежные источники», чтобы определить, является ли ссылка спамом

Глядя на модуль IndexingDocjoinerAnchorSpamInfo, который, как мы можем предположить, относится к обработке спам-ссылок, мы видим ссылки на «доверенные источники».

Похоже, что Google может рассчитать вероятность ссылочного спама на основе количества надежных источников, ссылающихся на страницу.

Мы не знаем, что представляет собой «доверенный источник», но если рассматривать его в целом вместе с другими нашими выводами, мы можем предположить, что это может быть основано на доверии к «домашней странице».

Могут ли ссылки из надежных источников эффективно разбавить спам-ссылки?

Это определенно возможно.

9 . Google, вероятно, выявляет негативные SEO-атаки и игнорирует эти ссылки, измеряя скорость ссылок

Сообщество SEO в течение некоторого времени разделилось во мнениях относительно того, являются ли негативные SEO-атаки проблемой. Google твердо уверен, что способен выявить такие атаки, хотя многие оптимизаторы утверждают, что эта проблема негативно повлияла на их сайт.

Документация дает нам некоторое представление о том, как Google пытается идентифицировать такие атаки, включая атрибуты, которые учитывают:

Период времени, в течение которого были обнаружены спам-ссылки.

Среднесуточный уровень обнаруженного спама.

Когда начался спайк.

Возможно, сюда также относятся ссылки, предназначенные для манипулирования системами ранжирования Google, но ссылка на «анкорный всплеск спама» предполагает, что это механизм выявления значительных объемов, что, как мы знаем, является распространенной проблемой, с которой сталкиваются негативные SEO-атаки. .

Вероятно, существуют и другие факторы, влияющие на то, как игнорируются ссылки, полученные во время всплеска, но мы можем, по крайней мере, начать собирать воедино головоломку о том, как Google пытается предотвратить негативное влияние таких атак на сайты. 

10. Штрафы или корректировки на основе ссылок, скорее всего, могут применяться как к некоторым, так и ко всем ссылкам, ведущим на страницу 

Похоже, что у Google есть возможность налагать штрафы за ссылочный спам или игнорировать ссылки по каждой ссылке или по всем ссылкам. 

Это может означать, что при наличии одного или нескольких неподтвержденных сигналов Google может определить, следует ли игнорировать все ссылки, указывающие на страницу, или только некоторые из них.

Означает ли это, что в случае чрезмерного количества ссылочного спама, указывающего на страницу, Google может игнорировать все ссылки, включая те, которые обычно считаются качественными?

Мы не можем быть уверены. Но если это так, это может означать, что спам-ссылки не единственные, которые игнорируются при обнаружении.

Может ли это свести на нет влияние всех ссылок на страницу? Это определенно возможно.

11. Токсичные ссылки — это вещь, хотя Google утверждает, что это не так

Буквально в прошлом месяце Мюллер (снова) заявил, что токсичные ссылки — это выдуманная концепция:

«Концепция токсичных ссылок создана инструментами SEO, поэтому вы регулярно платите за них».

Однако в документации мы видим ссылку на «BadBackLinks».

Приведенная здесь информация предполагает, что страница может быть оштрафована за наличие «плохих» обратных ссылок. 

Хотя мы не знаем, какую форму это принимает и насколько близко это к оценкам токсичных ссылок, выдаваемым инструментами SEO, у нас есть множество доказательств того, что существует по крайней мере логическое значение (обычно истинное или ложное). ) показатель наличия на странице плохих ссылок, указывающих на нее. 

Я предполагаю, что это работает в сочетании с понижением в должности ссылочного спама, о котором я говорил выше, но мы не знаем наверняка.

12. Содержимое, окружающее ссылку, дает контекст наряду с текстом привязки

Оптимизаторы уже давно используют якорный текст ссылок как способ дать контекстные сигналы целевой страницы, а документация Центра поиска Google, посвященная передовым методам работы со ссылками, подтверждает, что «этот текст сообщает людям и Google что-то о странице, на которую вы ссылаетесь». чтобы.»

Однако просочившиеся на прошлой неделе документы показывают, что для понимания контекста ссылки используется не только якорный текст. Вероятно, также используется содержимое, окружающее ссылку.

В документации упоминаются context2, fulleftContext и fullRightContext — термины, расположенные рядом со ссылкой. 

Это говорит о том, что для определения релевантности ссылки используется не только якорный текст. С одной стороны, его можно просто использовать как способ устранения двусмысленности, но с другой, это может способствовать повышению веса. 

Это подтверждает общее мнение о том, что ссылки из релевантного контента имеют гораздо больший вес, чем ссылки из нерелевантного контента.

Ключевые уроки и выводы для разработчиков ссылок и цифровых PR

Имеют ли ссылки значение?

Я бы, конечно, так сказал.

Здесь есть очень много свидетельств того, что ссылки по-прежнему являются значимыми сигналами ранжирования (несмотря на то, что мы не знаем, что является сигналом ранжирования, а что нет из этой утечки), но речь идет не только о ссылках в целом. 

Ссылки, которые Google поощряет или не игнорирует, с большей вероятностью положительно повлияют на органическую видимость и рейтинг.

Возможно, самый важный вывод из документации заключается в том, что релевантность имеет большое значение. Вполне вероятно, что Google игнорирует ссылки, которые приходят не с релевантных страниц, что делает это приоритетным показателем успеха как для создателей ссылок, так и для цифровых пиарщиков.

Но помимо этого мы получили более глубокое понимание того, как Google потенциально ценит ссылки и то, что может иметь больший вес, чем другие.

Могут ли эти результаты изменить ваш подход к построению ссылок и цифровому PR?

Это зависит от используемой вами тактики.

Если вы все еще используете устаревшие методы для получения ссылок более низкого качества, то я бы сказал да.

Но если ваша тактика получения ссылок основана на получении ссылок с тактикой PR из высококачественных публикаций в прессе, главное — убедиться, что вы представляете релевантные истории, а не предполагать, что любая ссылка из авторитетного издания будет быть вознагражден.

Для многих из нас мало что изменится. Но это конкретное подтверждение того, что тактика, на которую мы полагаемся, лучше всего подходит, и причина, по которой мы видим, что ссылки, полученные с помощью PR, оказывают такое положительное влияние на успех в органическом поиске.

Анонсы наших новых статей в Телеграме

Read More

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Капча загружается...