18 нояб. 2016 г.

«Атипичная синонимия» в выдаче Яндекса или Проделки «Палеха»

Рассылка SearchEngines.ru Неправильно отображается?
Посмотреть в браузере.
18 ноября

2016 года

СЕГОДНЯ В ВЫПУСКЕ

Подписаться на Twitter     Подружиться на Facebook      Группа ВКонтакте

Отправить другу

«Атипичная синонимия» в выдаче Яндекса или Проделки «Палеха»?

Сергей Людкевич
Автор: Сергей Людкевич - независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru.
Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.

 

В текущем году Яндекс уже во второй раз нас порадовал внедрением нового официального «именного» алгоритма ранжирования. И если февральский «Владивосток» касался только мобильной выдачи, то ноябрьский «Палех» был анонсирован для общей формулы.

Вкратце: алгоритм «Палех» предназначен для поиска таких ответов на запросы, которые не содержат ключевых слов, входящих в запрос, но тем не менее релевантны ему. Это особенно актуально для длинного хвоста низкочастотных запросов, когда пользователь формулирует запрос достаточно нечетко, не сумев подобрать «правильных» ключевых слов, по которым поисковая система может выдать ему релевантный ответ. Поэтому поисковику приходится подбирать некоторые «ассоциации» к исходному запросу.

Впрочем, проблема с подбором расширенных результатов поиска не нова, и Яндекс уже давно пытается ее решить. Первой ласточкой было внедрение в 2008-м году в алгоритме «Магадан» первых вариантов синонимов ключевых слов – перевода и транслитерации. Затем синонимы сильно расширились за счет создания специального словаря. Также было внедрение в 2010-м году в алгоритме «Краснодар» технологии «Спектр» – попытки расширить выдачу за счет учета возможных вариантов расширения потребностей пользователя, заданных в общем, достаточно неоднозначно сформулированном, запросе.

Но все эти нововведения не решали проблему релевантной выдачи для «длинного хвоста», и вот появился «Палех». И сразу же стала весьма интересной задача определения, какие именно результаты выдачи сформированы конкретно этим алгоритмом.

Об идентификации различных уже известных примесей к органической выдаче Яндекса, в том числе, и сформированной технологией «Спектр», я писал в своей статье «Примеси к органической выдачи Яндекса».

Примерно месяц назад (еще до анонса «Палеха») мне показали один любопытный запрос, отдельные результаты в выдаче по которому заставили задуматься о том, что в ней могло появиться что-то новое. Выдача по запросу по названию русскоязычной школы «Адриатик Колледж», находящейся в черногорском городе Будва, содержит ссылки на документы, касающиеся других русскоязычных школ Черногории и не имеющие подсветки ключевых слов из запроса в сниппетах:

Оказывается, что эти страницы вообще не содержат слов запроса ни в контенте, ни в текстах входящих ссылок:

В общем-то, подобная картина характерна для документов, найденных с помощью одних только синонимов слов запроса. Так, например, находящийся на первом месте документ, имеет точно такие же свойства, демонстрируя нам подсвеченные синонимы (а именно, перевод слов запроса на английский язык) в сниппете:

Однако, мне удалось найти конструкцию запроса (с добавлением оператора отрицания с термином, заведомо не содержащимся в документе, например, произвольной абракадабры), при которой выдача для данных документов ведет себя по-разному, в одном случае документ продолжает находиться, в другом - нет:

Что дает возможность предположить, что документы, для которых в таком случае выдача пуста, попали в выдачу каким-то иным способом, нежели с помощью традиционного со времен релиза «Магадана» механизма учета синонимов. Назову это явление «атипичной синонимией».

Дальнейшее исследование показало, что документы, ведущие себя в выдаче по базовому запросу [адриатик колледж] как найденные с помощью «атипичной синонимии», достаточно хорошо находятся с помощью следующего запроса (по крайней мере, такими свойствами обладают четыре документа из топ-5):

Что позволяет предположить наличие некоей связи между запросами [адриатик колледж] и [русская школа в черногории] или схожим ему по смыслу и набору ключевых слов. Документ, который мы выбрали для примера идентификации «атипичной синонимии», также находится по запросу [русская школа в черногории], хоть и по тексту входящих ссылок:

Анонс алгоритма «Палех», в котором говорится, что семантический вектор стал использоваться несколько месяцев назад, наталкивает на мысль, что подобная «атипичная синонимия» может быть не чем иным, как результатом работы «Палеха».

Еще один пример «атипичной синонимии» я обнаружил у запросов, представляющих собой некоторые достаточно редко употребляемые русскоязычные варианты корейского бренда «Hyunday»:

Кроме запроса [хенде] «атипичная синонимия» наблюдается на запросах [хендей], [хэндэй], [хендеи], [хендаи], [хюнде].

Другие же (более распространенные?) русскоязычные варианты бренда, такие как [хендай] ведут себя, как «типичные» синонимы:

К ним также относятся запросы [хюндэй], [хюндай], [хюндаи] и др.

Я буду очень признателен, если кто-то из читателей найдет в выдаче подобные примеры «атипичной синонимии» и пришлет мне на е-мейл ludkiewicz@yandex.ru для исследования. А вдруг это действительно реальный способ идентифицировать примесь к органике, сформированную «Палехом».

Роскомнадзор заблокировал LinkedIn

 

Социальная сеть для профессиональных контактов LinkedIn внесена в реестр нарушителей прав субъектов персональных данных и направлена Роскомнадзором для блокировки операторам связи.

Блокировка LinkedIn является знаковым событием, так как до этого Роскомнадзор не вносил в реестр крупные зарубежные ресурсы по закону о хранении сведений в России.

В Директе появился Конструктор графических объявлений

В Яндекс.Директе появился Конструктор графических объявлений – инструмент, позволяющий создавать графические объявления прямо в интерфейсе, сразу в нескольких форматах за считанные минуты. Теперь совсем не обязательно тратить время на отрисовку баннеров в различных редакторах или заказывать их дизайнеру.

Самое интересное за неделю

Расширения цены в AdWords стали поддерживать русский язык

В результате обновления расширения получили новый формат и поддержку 10 новых языков, включая русский.
 

Google и Facebook лишат рекламы сайты фейковых новостей

Обе компании уже внесли соответствующие изменения в политику своих рекламных сервисов – Google AdSense и Facebook Audience Network.
 

Mail.ru Group измерит эффективность онлайн-рекламы для офлайн-магазинов

Mail.Ru Group реализовала уникальную на российском рынке систему анализа big data для оценки эффективности рекламы офлайн-магазинов. С ее помощью ритейлерам станут доступны новые методы оценки рекламы.
 

Facebook объявил об обновлении метрик и отчётности

Facebook анонсировал ряд изменений, которые коснутся измерения эффективности рекламы в социальной сети и поведения пользователей.
 

В рекламных записях ВКонтакте появились кнопки призыва к действию

В рекламных записях сообществ ВКонтакте появилась возможность установки кнопок призыва к действию. В зависимости от целей рекламной кампании доступны различные предустановленные призывы к действию.
 

Facebook запускает таргетинг на посетителей страницы

Появление новой функции заметили российские пользователи. Пока она доступна не всем.
 

Google не рассматривает AMP как альтернативу мобильной версии сайта

В будущем при отсутствии мобильной версии страницы Google будет индексировать десктопную, минуя AMP.
 

Zvooq подал иск к Яндексу на 29 млн долларов

Музыкальный сервис Zvooq подал иск к Яндексу, обвинив интернет-компанию в нарушении письменных договоренностей при найме на работу сотрудников Zvooq.
 

Google представил Фотосканер – новое приложение для оцифровки фото

Приложение позволяет сканировать напечатанные фотографии с помощью камеры телефона, а затем сохранять их.
 

Более половины россиян за цензуру в интернете

Более половины россиян считают необходимой цензуру в интернете, против выступают всего 25%.

AdSense переводит всех пользователей на новый интерфейс

В ближайшие дни все пользователи сервиса будут автоматически переведены на новый интерфейс. Вернуться к старой версии UI можно будет в настройках. Однако в начале 2017 года она будет отключена.

Google представил обновлённый интерфейс AdSense в прошлом месяце. Сначала его можно было активировать по желанию. Теперь он будет включен по умолчанию.

 

Подписаться на Twitter    Подружиться на Facebook    Отправить другу 
Copyright © 2016 Searchengines.ru,, All rights reserved.
Вы получили эту рассылку, поскольку регистрировались на сайте Searchengines.ru. Вы можете всегда отписаться от нее, переслать другу, а также обновить свой профиль подписчика.

Наш почтовый адрес:
Searchengines.ru, , Moscow,, 65000, Russia
отписаться от этой рассылки    обновить настройки подписки 

Комментариев нет:

Отправить комментарий

Оповещение Google – JavaScript

JavaScript Ежедневное обновление ⋅ 18 января 2025 г. НОВОСТИ Google начал требовать включе...