29 мар. 2019 г.

Google запатентовал поведенческие факторы

Рассылка SearchEngines.ru Неправильно отображается?
Посмотреть в браузере.
29 марта

2019 года

СЕГОДНЯ В ВЫПУСКЕ

Подписаться на Twitter     Подружиться на Facebook      Группа ВКонтакте

Отправить другу     Читать в Telegram

Google запатентовал поведенческие факторы

Сергей Людкевич
Автор: Сергей Людкевич - независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru.
Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.

 

Исторически Google, в отличие от Яндекса, никогда официально не признавал использование в ранжировании поведенческих факторов. Более того, устами своих сотрудников он открыто отрицал это, объясняя свое решение низким качеством этих сигналов.

Так, в 2014-м году на московской конференции Cybermarketing-2014 во время телемоста с европейской штаб-квартирой Google в Дублине сотрудник отдела качества поиска Андрей Липатцев недвусмысленно заявил, что поведенческие и социальные факторы, с точки зрения разработчиков алгоритма ранжирования Google, являются очень плохими и слишком шумными сигналами, и поэтому не учитываются в алгоритме. Эта мысль постоянно звучала затем в многочисленных видеоконференциях сотрудников Google, как русско-, так и англоязычных, в частности Джона Мюллера.

И вот 18 марта 2019 года американский SEO-специалист Билл Славски (Bill Slawski) обнаружил свеженький, датированный 12 марта 2019 года, патент Google под названием «Modifying search result ranking based on implicit user feedback» («Изменение ранжирования результатов поиска на основе неявной обратной связи с пользователем»).

Итак, что же подразумевается под «неявной обратной связью с пользователем»? Как оказалось, старые добрые поведенческие факторы. В частности, в патенте упоминаются следующие сигналы:

  1. Запрос, заданный пользователем, результаты поиска, предоставленные поисковой системой, документ, выбранный пользователем из числа результатов поиска, его позиция в порядке представления результатов поиска (“a query submitted by the user, one or more search results presented by the search engine in response to the query, a document selected by the user from among the search results, an ordinal position in a presentation order of the search results of the search result selected by the user”). То есть речь идет о так называемых «кликовых» поведенческих факторах, непосредственно связанных с поведением пользователя на странице поисковой выдачи. Замечу, что Яндекс вот уже 10 лет (начиная с алгоритма «Арзамас», запущенного в апреле 2009-го года) учитывает кликовые факторы (в свое время я достаточно подробно писал о кликовых факторах ранжирования в Яндексе).
  2. Время, проведенное пользователем на выбранном документе (“a time the user spent on the document”). Так называемая «длина клика». Далее поясняется, что под временем, потраченным пользователем на документ, подразумевается время, прошедшее от клика на документ в результатах поиска до возвращения к результатам поиска и выбора в них нового документа.
  3. Язык, используемый пользователем, и страна, где пользователь с большой долей вероятности находится (“a language employed by the user, and a country where the user is likely located”). Что свидетельствует о дифференцированном подходе к учету поведения пользователей в зависимости от их языка и страны. В общем-то, вполне логично, что разноязычные пользователи, равно как и пользователи, живущие в разных странах, могут иметь различные предпочтения в выдаче по одному и тому же запросу.

Информация по длине кликов в выдаче по определенному запросу от различных пользователей взвешивается на основе длины клика по срезам: 

  1. запрос-документ
  2. запрос-документ-язык
  3. запрос-документ-язык-страна

По длине клики классифицируются на короткие, средние и длинные (причем, дифференциация по этим категориям на основе длины клика зависит от запроса), также выделяется категория «последнего клика». Каждая категория имеет соответствующий вес. В качестве примера приводятся следующие весовые коэффициенты:

  • Короткий клик может считаться признаком плохой страницы и, следовательно, получает малый вес (например, 0,1). 
  • Средний клик может считаться показателем потенциально полезной страницы и, следовательно, получает несколько больший вес (например, 0,5). 
  • Длинный клик может считаться показателем хорошей страницы и, таким образом, получает гораздо больший вес (например, 1,0). 
  • Последний клик (когда пользователь не возвращается на страницу с результатами поиска) может считаться вероятным показателем хорошей страницы и, следовательно, иметь достаточно большой вес (например, 0,9).

При взвешивании кликов предлагается назначать меньший вес кликам тех пользователей, которые почти всегда выбирают высоко ранжируемые документы, по сравнению с кликами пользователей, которые чаще выбирают документы с более низкими позициями. В общем-то, на мой взгляд, вполне логично понизить вес «голосов» пользователей, занимающихся тупым перебором всех подряд элементов в списке, не обращая внимание на сниппеты.

Также предлагается разделять пользователей на определенные типы. Указывается, что более опытным пользователям требуется меньше времени на получение информации, таким образом, при учете кликов определенного пользователя, может использоваться весовой коэффициент в зависимости от его индивидуального поведения в сети, например, учитывающий среднюю продолжительность сессии или частоту переходов между документами.

Кроме того, пользователь может быть определенным образом классифицирован на основе его потока запросов. В частности, предполагается, что пользователь, который задает много запросов по определенной теме, может иметь высокий уровень знаний по данной теме, и данные о его кликах могут быть соответствующим образом взвешены для будущих запросов от данного пользователя по данной теме.

В качестве «меры релевантности» предлагается использование составных показателей, таких, например, как отношение числа длинных кликов к коротким или отношение числа длинных кликов ко всем кликам для конкретного документа по конкретному запросу (доля длинных кликов). Причем, к отношениям может быть добавлен в качестве защиты от шума параметр сглаживания, обладающий следующим свойством – если общее количество кликов невелико, то результат будет стремится к нулю. Благодаря составным показателям документы, получающие относительно небольшое количество кликов, но в большинстве своем длинные, в итоге могут получить больший вес, чем документы, находящиеся на более высоких позициях и получающие за счет этого большее количество кликов, но имеющие относительно небольшую долю длинных кликов. То есть, как говорится, не CTR’ом единым… 

Также параметры сглаживания могут варьироваться в зависимости от языка или страны пользователей. Примечательно, что в качестве примера географического источника запросов, среди которых исторически генерировалось больше спам-активности и которые потому требуют более жесткого сглаживания, указана Россия.

Упоминается и о возможности учета дополнительной информации, такой как позиции, численные значения релевантности и сниппеты как выбранных пользователем документов, так и показанных ему, но не выбранных им.

В итоге вычисленные значения меры релевантности в явном или преобразованном виде предлагается применять в качестве повышающего коэффициента к значениям релевантности, вычисленным алгоритмом ранжирования.

В тексте патента также провозглашается необходимость обеспечения защиты пользовательских данных от накруток. Что ж, вещь, несомненно, весьма актуальная, особенно для исторически спам-активной в этом плане России. Интересно, насколько эффективно ее будет решать Google, если дело дойдет до реализации заявленных в патенте положений.

Резюмируя, можно отметить, что ничего революционного в патенте не содержится. Всё вертится вокруг доли длинных кликов, как основной меры активности пользователя, и нюансах взвешивания данных от различных категорий пользователей. В хорошо известных статьях сотрудников Яндекса шести-семилетней давности на тему учета кликовых факторов «Session-based Query Performance Prediction» и «Through the looking glass: utilizing rich post-search trail statistics for web search» содержится информация о гораздо более разнообразных сигналах.

Ну, и не следует забывать, что наличие патента еще не означает непременной реализации указанных в нем вещей в «боевом» поиске. Но в любом случае мы получаем еще одно подтверждение, что задача удержания пользователей на сайте является одной из основных.


Google упразднил оператор info

В настоящее время большая часть тех данных, которые можно было получать с помощью этой команды, доступна в инструменте проверки URL в Search Console.

Читать новость на сайте

Директ вывел из беты текстово-графические объявления с ценой

Текстово-графические объявления с ценой вышли из тестирования и будут показываться в товарной галерее на постоянной основе. 

Также для удобной работы с ценами появилось массовое редактирование, которое упростит заполнение и контроль цен в объявлениях. Раньше для изменения цены в объявлении требовалось заново пройти модерацию текста объявления — теперь цена будет проходить проверку отдельно.

Читать новость на сайте

Важное за неделю

Google больше не поддерживает rel=next/prev

Как выяснилось, поисковик отказался от этого атрибута уже несколько лет назад, но никому об этом не сказал.
 

На турбо-страницах появились комментарии и авторизация

Новые функции появились на турбо-страницах для мобильной и десктопной версий. 
 

Мартовский апдейт Google не имел конкретной направленности

Об этом свидетельствуют результаты опроса Search Engine Land.
 

Яндекс.Маркет запретит использование рекламных слов в названиях магазинов

С 1 апреля Яндекс.Маркет изменит правила, касающиеся названий магазинов на сервисе.
 

Сообщество рекламодателей Google переезжает на новую платформу

Сохранить свой контент можно будет до июля 2019 года.
 

Google обновил инструмент проверки оптимизации для мобильных

Теперь в нём можно тестировать исходный код страниц.
 

Яндекс.Деньги вводят мультивалютные счета и карты

Помимо рублей, пользователи сервиса смогут хранить и расплачиваться 10 иностранными валютами.
 

Планировщик ключевых слов в Google Ads получил ряд новых функций

Оповещение об этом появляется при входе в сервис.
 

Google внедряет AMP в работу Gmail

В результате письма в сервисе станут более интерактивными. О поддержке этой технологии также заявил почтовый сервис Mail.ru.
 

Telegram снимает ограничения на удаление отправленных сообщений

Теперь можно удалить любое сообщение, отправленное или полученное с обеих сторон, в любом приватном чате.

Разработчик SEO-инструментов Ahrefs планирует создать свою собственную поисковую систему для конкуренции с Google. Об этом заявил основатель и глава компании Дмитрий Герасименко в Twitter.

Читать новость на сайте

«Яндекс.Шеф поможет любому человеку приготовить вкусный ужин всего за полчаса. Для этого не нужно ходить в магазин и уметь готовить — достаточно выбрать подходящие блюда и заказать набор продуктов на сайте или в мобильном приложении. Все необходимые ингредиенты, расфасованные в нужном количестве, доставят на дом вместе с рецептами для их приготовления», — сообщили в компании.

Читать новость на сайте

Подписаться на Twitter    Подружиться на Facebook    Отправить другу 
Copyright © 2019 Searchengines.ru,, All rights reserved.
Вы получили эту рассылку, поскольку регистрировались на сайте Searchengines.ru. Вы можете всегда отписаться от нее, переслать другу, а также обновить свой профиль подписчика.

Наш почтовый адрес:
Searchengines.ru, , Moscow, 65000, Russia
отписаться от этой рассылки    обновить настройки подписки 

Комментариев нет:

Отправить комментарий

Оповещение Google – JavaScript

JavaScript Ежедневное обновление ⋅ 19 января 2025 г. НОВОСТИ Google начинает требовать Jav...