24 апр. 2020 г.

Определяем быстроботовскую примесь в Яндексе

Рассылка SearchEngines.ru Неправильно отображается?
Посмотреть в браузере.
0b772da2-25ab-4d4a-9afe-1eeff8aa43cb.png 24 апреля

2020 года

СЕГОДНЯ В ВЫПУСКЕ

Подписаться на Twitter     Подружиться на Facebook      Группа ВКонтакте

Отправить другу     Читать в Telegram

Определяем быстроботовскую примесь в Яндексе


Автор: Сергей Людкевич - независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru.

Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.




В своей недавней статье «Очистка органической выдачи Яндекса от примесей» я упоминал о таком виде примеси как Свежие результаты, в среде SEO-специалистов носящей название «быстроботовской» примеси.

Идентификация относится ли конкретный документ в выдаче Яндекса к быстроботовской примеси, бывает очень полезна при решении аналитических задач. Дело в том, что документы, индексируемые быстроботом и попадающие в выдачу в течение короткого времени, ранжируются иначе, чем документы из основного индекса, и поэтому выдачу от них необходимо очищать при анализе основного алгоритма.

Тогда я рекомендовал идентифицировать быстроботовскую примесь по наличию специальных меток свежести документа («N минут назад», «N часов назад», «вчера», «позавчера» или просто дата не старше 3-4-х дней). Но похоже, подобная метка не является необходимым признаком документа, проиндексированного быстроботом.

Поясню на примере. Так, например, на момент написания статьи в индексе Яндекса присутствует следующий документ без специальной метки свежести в сниппете:

Однако, если мы заглянем в сохраненную копию, то увидим, что документ был проиндексирован через 3 минуты после его появления на сайте (судя по индикации времени, прошедшего с момента публикации пользователем этого материала):

Так быстро после появления документы могут с большой вероятностью попасть в индекс через быстроботовскую примесь. Однако, как уже было сказано выше, метка свежести, характерная для этой примеси, в сниппете данного документа отсутствует. 

Изучая поведение документов из быстроботовской примеси, я заметил одну интересную особенность. В отличие от документов из основного индекса, быстроботовские документы показываются в выдаче по запросу, состоящему из связки текстового запроса и документного оператора даже в том случае, когда документ нерелевантен текстовому запросу из этой связки.

Например, возьмем текстовый запрос в виде абракадабры, выдача по которому пуста:

И добавим к этому текстовому запросу документный оператор url: с адресом рассматриваемого документа в качестве значения. Вопреки логике этот документ показывается в выдаче:

Причем, расширив выдачу на весь сайт с помощью документного оператора site:, мы увидим, что в выдаче в подавляющем большинстве находятся документы с быстроботовской меткой в сниппете. 

А в сохраненных копиях тех, у кого эта метка отсутствует, наблюдаются признаки того, что документ проиндексирован быстроботом.

Таким образом, можно с определенной долей уверенности утверждать, что подобным способом мы можем проверять документ без быстроботовской метки в сниппете на предмет того, проиндексирован ли он быстроботом. Как правило, это срабатывает на документах трех-четырехдневной давности. Настоятельно рекомендую делать перепроверку с использованием нескольких достаточно сильно отличающихся друг от друга вариантов абракадабр. Дело в том, что некоторые абракадабры Яндекс интерпретирует как опечатки и пытается подобрать варианты замены, не предупреждая об этом пользователя, и в этом случае можно получить ложноположительные срабатывания метода. 

Интересно, что добавление к текстовому запросу в рассматриваемой связке операторов группы «Морфология и поисковый контекст» + («плюс» – поиск документов, в которых обязательно присутствует выделенное слово) или «» («кавычки» – поиск по цитате), чудесный эффект быстроботовской примеси пропадает:

Воспользуемся этим фактом, чтобы убедиться в том, что сохраненная копия для документа, который рассматривался в первом примере, совпадает с той, что находится в индексе (ведь может быть иначе, о чем я писал в своей статье «Сохраненные копии страниц – это не то, что находится в индексе»). 

Не мешало бы это проверить, ведь именно по сохраненной копии страницы мы делали предположение о быстроботном характере ее индексации. По точной фразе их сохраненной копии о времени публикации сообщения рассматриваемая страница находится:

А значит, в индексе действительно та копия, которая показывается как сохраненная. Кстати, для документов из быстроботной примеси я еще не встречал примеров рассинхронизации сохраненной и проиндексированной копий.

Сервис Google Shopping станет бесплатным

Google позволит продавцам бесплатно размещать товарные объявления в сервисе Google Shopping.

Согласно заявлению компании, начиная со следующей недели большинство результатов поиска в этом разделе будут представлять собой бесплатные объявления.

Читать новость на сайте

В Яндекс.Вебмастере появился индекс скорости сайта

В блоке Достижения и статистика Яндекс.Вебмастера начала отображаться скорость загрузки страниц в Яндекс.Браузере при переходе из мобильного поиска Яндекса. Достижение «скорость сайта» пока находится в режиме бета-тестирования.

Индекс скорости сайта рассчитывается на основе переходов пользователей на сайт из поисковой выдачи Яндекс.Браузера. Для расчета используются обезличенные (анонимизированные) данные Яндекс Браузера.

Читать новость на сайте

Важное за неделю

Google Ads проведёт верификацию всех рекламодателей

Новая инициатива призвана повысить прозрачность рекламы в результатах поиска.
 

Яндекс обновил мессенджер

Мессенджер приходит на смену Яндекс.Чатам, поэтому в нем уже есть все пользователи Яндекса.
 

Google Ads рассказал подробнее о программе поддержки малого бизнеса

Сервис прояснил, какие компании могут претендовать на выделенные средства.
 

Выручка Mail.ru Group выросла на 14% в I квартале 2020 года

Совокупная сегментная выручка Mail.ru Group за январь—март 2020 года составила 22,3 млрд рублей.
 

Google: почему бесконечная прокрутка может вызывать проблемы с SEO

И как их избежать.
 

Google запустил сайт с информацией о коронавирусе в России

И рассказал о других обновлениях, связанных с COVID-19.
 

Facebook отменяет обязательное использование оптимизации бюджета в кампаниях

Теперь эту настройку можно применять по желанию.
 

Google сокращает бюджеты на маркетинг на 50%

Компания сообщила об этом в рассылке для сотрудников.
 

Mail.ru Group начала продажи Капсулы

Умная колонка стоит 7990 рублей, плюс все покупатели получают в подарок шесть месяцев подписки на музыку ВКонтакте.

Яндекс сделал все тестирование на коронавирус на дому бесплатным в рамках социального проекта «Помощь рядом». Тестирование от аккредитованных лабораторных служб доступно для жителей Москвы и ближайшего Подмосковья всех возрастов. В будущем оно станет доступно и для жителей других регионов.

Читать новость на сайте

Подписаться на Twitter    Подружиться на Facebook    Отправить другу 
Copyright © 2020 SearchEngines.ru, All rights reserved.
Вы получили это письмо, так как подписались на рассылку на сайте SearchEngines.ru

Наш почтовый адрес:
SearchEngines.ru 21 Iridos Street, MetaQuotes Building, Mesa Yitonia Limassol 4004 Cyprus
отписаться от этой рассылки    обновить настройки подписки 
Email Marketing Powered by Mailchimp

Комментариев нет:

Отправить комментарий