Бывший сотрудник Google: Google «использует клики для ранжирования»
«Практически все знают, что мы используем клики для повышения рейтинга. Это дискуссия: «Почему вы пытаетесь замять эту проблему, если все знают?»
Эта цитата принадлежит Эрику Леману, бывшему 17-летнему сотруднику Google, который работал инженером-программистом над качеством поиска и рейтингом. Он покинул Google в ноябре.
Леман дал показания в прошлую среду в рамках продолжающегося антимонопольного процесса США против Google.
Если вы еще не слышали эту цитату, ожидайте ее услышать. Очень много.
Но. Это еще не все, что сказал Lehman. По его словам, системы машинного обучения Google BERT и MUM становятся важнее пользовательских данных.
«С одной стороны, лучше иметь больше пользовательских данных, но новые технологии и более поздние системы могут использовать меньше пользовательских данных. Ситуация меняется довольно быстро», — сказал Леман, как сообщает Law360.
Леман считает, что Google будет в большей степени полагаться на машинное обучение для оценки текста, чем на пользовательские данные, говорится в электронном письме, которое Леман написал в 2018 году по сообщению Fortune:
«Огромное количество отзывов пользователей можно в значительной степени заменить неконтролируемым изучением необработанного текста», — написал он.
Пользовательские и обучающие данные. Когда дело дошло до BERT, также возникла путаница между «пользовательскими данными» и обучающими данными. Сообщения Big Tech on Trial:
Попытка Министерства юстиции подвергнуть импичменту показания Лемана также, похоже, имела неприятные последствия. В ответ на вопрос Министерства юстиции о том, имеет ли Google преимущество в использовании BERT перед конкурентами из-за своих пользовательских данных, Леман заявил, что «самое большое преимущество Google в использовании BERT» перед конкурентами заключалось в том, что Google изобрела BERT. Затем Министерство юстиции выставило экспонат под названием «Пункты для представления Сундару». В одном из пунктов на этой выставке говорилось следующее (согласно моим заметкам): «Любой участник может использовать BERT или аналогичные технологии. К счастью, наши данные обучения дают нам преимущество. У нас есть возможность сохранить и расширить наше лидерство, полностью используя данные обучения с помощью BERT и предоставляя их нашим пользователям…»
Вероятно, это было бы эффективным импичментом Lehman, если бы под «обучающими данными» подразумевались какие-то пользовательские данные. Но после того, как Министерство юстиции завершило повторное рассмотрение, судья Мехта спросил Лемана, что имеется в виду под «данными об обучении». Леман объяснил, что это отличается от данных пользовательского поиска».
Каково конкурировать с Google?
Деликатные темы. Юрист Министерства юстиции Эрин Мердок-Парк также спросил Лемана о слайде из одной из его подборок слайдов на тему «Деликатные темы», в котором сотрудникам предписывалось «не обсуждать использование кликов в поиск...»
Согласно сообщению Big Tech on Trial (через X), Леман заявил, что «мы стараемся не подтверждать, что используем пользовательские данные при ранжировании результатов поиска».
В сообщении репортера X говорится: «Я не получил хороших комментариев по этому поводу, но думаю, что причина как-то связана с нежеланием людей думать, что SEO можно использовать для манипулирования результатами поиска».
Google = лжецы? После обнаружения этого свидетельства специалисты по поисковой оптимизации поспешили использовать цитаты Лемана как окончательное доказательство того, что Google лгал об использовании кликов или рейтинге кликов на протяжении всех своих 25 лет.
Вопрос о том, использует ли Google клики, был первым вопросом, заданным на прошлой неделе во время АМА с Гэри Иллиесом из Google на Pubcon Pro в Остине. Иллиес ответил: «Технически да», потому что Google использует исторические данные поиска для своего алгоритма машинного обучения RankBrain.
Технически «да» в переводе с языка гуглеров означает да. RankBrain обучался на данных поиска пользователей.
Мы знаем это, потому что Иллес уже говорил нам об этом в 2018 году. Он сказал, что RankBrain «использует исторические данные поиска, чтобы предсказать, на что с наибольшей вероятностью нажмет пользователь по ранее невиданному запросу».
RankBrain использовался для всех поисковых запросов, влияя на многие из них, начиная с 2016 года.
Поиск Google отслеживает все. Но тот факт, что Google отслеживает клики в Поиске, не означает, что клики используются в качестве прямого фактора ранжирования. Другими словами, если сайт А получает 100 кликов, а сайт Б — 101 клик, то сайт Б автоматически поднимется на позицию 1.
Подобно тому, как Google использует своих сотрудников для оценки качества результатов поиска, Google, вероятно, использует клики для оценки результатов по запросам и обучения своих систем ранжирования.
Почему нас это волнует. Использует ли Google клики? Да. Но опять же, вероятно, не как сигнал ранжирования (правда, я не могу сказать этого со 100% уверенностью, поскольку не работаю в Google и не имею доступа к алгоритму). Я знаю, что щелчки шумные, и ими легко манипулировать. А для многих сайтов/запросов просто не хватит данных для оценки, чтобы сделать их полезным сигналом ранжирования для Google.
Копайте глубже. Самая большая загадка алгоритма Google: все, что когда-либо было сказано о кликах, CTR и показателе отказов
Анонсы наших новых статей в Телеграме