| | | Сеанс поисковой магии, или смещения в языке запросов Яндекса | | | Автор: Сергей Людкевич - независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru. Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов. Сегодня мне хотелось бы поговорить о весьма любопытном операторе языка запросов Яндекса – операторе cat:. В документации к языку запросов он относится к документным операторам и описывается как «поиск по страницам сайтов, зарегистрированных в Яндекс.Каталоге, тематическая рубрика или регион которых совпадают с заданным». Применение оператора осуществляется с помощью задания определенных идентификаторов. Документировано два типа идентификаторов, характеризуемых разными значениями так называемых смещений: 1. 9000000 – смещение для тематической рубрики Яндекс.Каталога, к которому надо прибавлять код темы из документа 2. 11000000 – смещение региона, к которому надо прибавлять код региона из документа https://yandex.ru/yaca/geo.c2n В свое время с помощью смещения для индикатора тематической рублики мне удалось сделать очень простой, но достаточно эффективный классификатор коммерческости запроса. Дело в том, что применив оператор cat: 9000000 к любому запросу, мы получим выдачу по нему, состоящую только из сайтов, зарегистрированных в Яндекс.Каталоге (будем называть это сужением на ЯК). А каждый из этих сайтов уже проклассифицирован редакторами сайта как коммерческий или некоммерческий. Коммерческие сайты характеризуются наличием поля «Сектор: Коммерческие» в ответе скрипта Яндекс-бара, например: http://bar-navig.yandex.ru/u?ver=4.0&show=32&url=http://money.yandex.ru: Подсчитав количество коммерческих сайтов в первых N результатах выдачи, суженной на ЯК, и разделив это число на N, можно получить оценку доли коммерческих сайтов в выдаче по запросу, которую и использовать в качестве коэффициента коммерческости запроса, имеющего значения в отрезке от 0 до 1. Конечно, точность оценки снижается из-за того, что коммерческие сайты могут содержать некоммерческие страницы (например, информационные статьи, обзоры моделей, форумы и т.п.), но, тем не менее, по моим оценкам, остается достаточно высокой. Главное, что для проверки требуется всего один запрос в Яндекс, что существенно расширяет возможности для проверки большого числа запросов. Но в любом случае тот факт, что документированные смещения применимы только к сайтам, зарегистрированным в Яндекс.Каталоге, существенно снижает возможности их применения. Так, например, определение географической принадлежности сайта к определенному региону требуется для решения определенных задач, и далеко не всегда выборка сайтов ограничивается сайтами из Яндекс.Каталога. Так вот, оказывается, что существует непустая выдача не только для документированных смещений, но и для других, недокументированных, которые можно составить модификацией первых. Например, Чукотский Автономный Округ, lr=10251, имеет одно из наименьших значений количества сайтов в Яндекс.Каталоге – всего: https://yaca.yandex.ru/yca/geo/Russia/East/Chukotska/. Если использовать документированное смещение 11000000 для этого региона, то есть зададим в Яндекс запрос cat:11010251, то в выдаче мы увидим порядка 20 сайтов (зарегистрированные в Яндекс.Каталоге плюс сайты из так называемой скрытой части Яндекс.Каталога – проклассифицированные редакторами, но по какой-то причине в каталоге не показываемые) с примерно 21 тыс. страниц: Однако, изменив первую цифру смещения с 1 на 2, мы получим в выдаче уже гораздо большее количество сайтов, визуально в своей массе имеющих отношение к Чукотке (около тысячи сайтов в примерно 212 тысячью страниц): Судя, по всему, это недокументированное смещение работает для источников географической классификации документов, отличных от Яндекс.Каталога. Похоже, одним из источников является автоматический классификатор по содержимому документа, так на представленном выше скриншоте, среди результатов выдачи, мы видим страницу англо-русского онлайн-словаря с переводом слова “Anadyr” (город Анадырь – столица Чукотского Автономного Округа). Продолжая менять первую цифру смещения, мы также непустую выдачу (и отличную от выдачи с документированным смещением 11000000) с документами, имеющими отношение к заданному региону, и для смещений 31000000, 51000000, 61000000 и 71000000. Не так давно была непустой выдача также и для смещения 81000000, но на данный момент выдача для этого смещения уже результатов нет. Таким образом, используя недокументированные смещения, образованные от документированного, мы можем классифицировать на принадлежность к конкретному региону уже гораздо большее число документов, нежели это возможно для документированного смещения. Вообще, методом простого перебора цифр для восьмизначных смещений можно убедиться, что непустая выдача существует для некоторого количества вариантов идентификаторов оператора cat:. Основная сложность заключается в интерпретации получаемых результатов – какой принцип классификации используется в каждом конкретном случае? Так, например, идентификатор 12000002 выдает сайты, содержащие сборники литературных произведений: Идентификатор 13000002 выдает сайты, явно имеющие отношение к средствам массовой информации: А идентификатор 18000004, похоже, классифицирует персональные сайты: В общем, у пытливого исследователя есть возможность поразбираться в особенностях классификации результатов выдачи. Ну и в заключение, хотелось бы обратить внимание на явный баг в результатах выдачи для документированного семизначного смещения 9000000. Кроме каталожных сайтов, принадлежащих в задаваемой рубрике, в выдачу попадают и результаты, релевантные числу-идентификатору оператора cat:, как таковому. Так например, применяя это смещение к рубрике Яндекс.Каталога «Словари украинского языка», имеющей код 4047, получаем для оператора cat: значение идентификатора 9004047. В выдаче поначалу действительно идут украинские словари: Но затем выдачу заполоняют сайты, содержащие цифры числа 9004047, например, в виде номера телефона или артикула: В этом плане предпочтительнее смотрится использование недокументированного восьмизначного смещения 24000000, выдача для которого подобного мусора не содержит: | Компания Яндекс сообщила об открытии Школ для вебмастеров и маркетологов. В рамках обучающей программы специалисты из разных областей интернет-индустрии и сотрудники Яндекса поделятся знаниями о том, как работать с сайтом и аудиторией на всех уровнях: от создания правильной семантической разметки и поисковой оптимизации до построения маркетинговых коммуникаций и стратегии продвижения бренда в интернете. Школа вебмастеров рассчитана на владельцев сайтов, начинающих и продвинутых специалистов. В программе курса около 30 лекций, на которых будут учить создавать качественные сайты, хорошо представлять их в поиске и оценивать их эффективность с помощью инструментов веб-аналитики. Лекции будут вести Михаил Сливинский, Алексей Иванов, Екатерина Ерошина, Елена Першина, Дмитрий Сатин, Петр Аброськин и другие признанные специалисты и эксперты отрасли. Задача Школы не в том, чтобы дать ответы на вопросы вроде «как попасть в топ-10 выдачи Яндекса». Ее цель - научить создавать качественные сайты, хорошо представлять их в поиске и оценивать их эффективность с помощью инструментов веб-аналитики. Речь также пойдёт о том, как работать с контентом, как правильно построить поисковое продвижение, как сделать сайт удобным для пользователей, как составлять технические задания и оценивать работу дизайнеров, оптимизаторов и других специалистов. Отдельная тема — представление сайта на мобильных устройствах. Не пропустите: 1 сентября лекция Михаила Сливинского "Перед стартом" Зарегистрироваться 3 сентября лекция Алексея Иванова "Сайт. Зачем он и каким должен быть" Зарегистрироваться | | | Baltic Digital Days 2015 13 - 14 августа 2015 года в Калининграде прошла третья ежегодная конференция по интернет-маркетингу и заработку в сети Baltic Digital Days 2015, организованная Дмитрием Шаховым (Ремарка). Мероприятие традиционно было посвящено установлению деловых контактов и обмену опытом между ведущими профессионалами отрасли. Также на конференции прозвучало множество полезных докладов с практическим уклоном, в которых предлагались готовые методики для внедрения. Обзоры наиболее интересных докладов с мероприятия: Артур Латыпов «Анализ алгоритма Минусинск, современная работа со ссылочным» Олег Шестаков «Автоматизация построения структуры сайта и мониторинг ее эффективности» Дмитрий Севальнев «Максимум текстовой релевантности сегодня: факторы, практические рекомендации» Станислав Поломарь «Белые методы наращивания поведенческих факторов» Денис Савельев «Практика применения контент-маркетинга. Почему SEO проигрывает в эффективности» Виталий Кравченко: «Разрушители легенд: крауд-маркетинг - модно или эффективно» | | Самое интересное за неделю | | | Разработчики сервиса контекстной рекламы Google Adwords представили новые автоматические расширения для Товарных объявлений (PLA). Эти расширения отображаются рядом с товарными объявлениями без выполнения дополнительных действий или оплаты. Они используют существующую информацию, которую рекламодатели предоставили в настройках Merchant Center и фидах данных для автоматического показа информации о бесплатной доставке или снижении цен. Компания Mail.ru Group представила предварительные неаудированные финансовые данные за первое полугодие 2015 года. Совокупная сегментная выручка компании выросла на 6,9% по сравнению с аналогичным периодом 2014 года и составила 18 301 млн рублей. Совокупная чистая прибыль, из-за процентных расходов по займу, полученному в связи с приобретением ВКонтакте, снизилась на 10,5% по сравнению с аналогичным периодом прошлого года и составила 5 606 млн рублей. Выручка от онлайн-рекламы в I полугодии 2015 года выросла на 9,3% по сравнению с аналогичным прошлогодним периодом, и составила 6 363 млн рублей. Британские регуляторы требуют, чтобы Google удалял все последующие за уже удаленными проиндексированные ссылки на новости и статьи о субъекте деиндексации. Такие меры поисковая система должна предпринять в рамках реализации права на забвение. Удаление таких ссылок из результатов поиска Google стимулировало появление новых сообщений, которые были проиндексированы поисковой системой. В Google отказались удалить ссылки на более поздние сообщения, которые освещали детали уголовного преступления, утверждая, что они являются неотъемлемой частью новостей и публикуются в интересах общества. Теперь британский Офис уполномоченного по информации приказал Google удалить появившиеся ссылки, включающие имя субъекта и описание состава преступления. У Google есть 35 дней на обжалование решения. Специалист отдела качества поиска Google по работе с вебмастерами Джон Мюллер (John Mueller) сообщил в Twitter, что поисковая система никогда не индексирует все страницы. 19 августа 2015 представитель Google написал: «Мы никогда не индексируем все страницы, так что вы не всегда можете исправить это. Вы видите сайты с важными, но не проиндексированными страницами? Тогда это, должно быть, ошибка». Редактор Search Engine Land Барри Шварц (Barry Schwartz) сообщил, что Google индексирует всего 95% страниц его сайта: 19928 страниц из 20892. Главный исполнительный директор Foursquare Деннис Кроули (Dennis Crowley) на конференции GrowthBeat в Сан-Франциско рассказал, что количество зарегистрированных пользователей сервиса за 10 месяцев увеличилось на 5 миллионов и в настоящее время превысило 60 миллионов, при этом количество ежемесячно активных пользователей достигло 50 миллионов. Необычное соотношение показателей объясняется тем, что не все активные пользователи Foursquare зарегистрированы в сервисе. Количество подсказок Foursquare превысило 75 млн, в то время как в октябре этот показатель составлял всего 50 млн. Разработчики внедрили контекстно-зависимый поиск в седьмой версии приложения Google для iOS. Это дает пользователям возможность задавать дополнительные и уточняющие вопросы, не формулируя их заново. Например, если пользователь во время прочтения статьи об Уильяме Шекспире скажет «Ok, Google, где он родился» поисковая система поймет вопрос и даст релевантный ответ. Распознавание контекста и предмета первоначального поиска позволяет пользователю задавать неоднозначные дополнительные вопросы или использовать местоимения. Microsoft запустил новый тип автоматизированных правил для рекламных кампаний Bing под названием Notify Me (Сообщить мне), которые рассылают рекламодателям письма о кампаниях, группах объявлений и ключевых словах, соответствующих выбранным критериям. Правило может распространяться на все включенные кампании, все имеющиеся или только выбранные. Если нужно установить правило для кампаний, превысивших бюджет, следует выбрать соответствующую опцию в разделе Delivery (Доставка). Рекламодатели также могут установить диапазон дат при фильтрации любых данных о показах. Специалисты Google объявили о запуске новых типов стратегии назначения ставок для Торговых кампаний: Максимум кликов, Оптимизатор цены за конверсию и Целевая рентабельность инвестиций. Стратегия под названием «Максимум кликов» подходит тем, кто хочет получить как можно больше трафика в рамках своего бюджета, так как он автоматически регулирует ставки. В компании утверждают, что это отличный способ продвижения акций на сайте или в магазине с помощью товарных объявлений. Команда Яндекс.Метрики сообщила об обновлениях в настройках Вебвизора, которые вступят в силу 1 октября 2015 года. Начиная с указанного времени, плеер Вебвизора, а также код просмотра прочих инструментов inpage-аналитики - карт кликов, ссылок, скроллинга и аналитики форм - будет загружаться с отдельного домена webvisor.com. Это изменение затронет те сайты, которые запрещают отображение своих страниц в iframe, используя для этого http-заголовок "X-Frame-Options: SAMEORIGIN". Чтобы сохранилась возможность анализа таких сайтов инструментами inpage-аналитики, необходимо настроить web-сервер. Соучредитель Wikipedia Джимми Уэльс (Jimmy Wales) заявил, что у ресурса наблюдается «давняя проблема с уменьшением трафика от Google». Сайт Wikipedia действительно наблюдает плавное длительное снижение позиций в Google. Снижение видимости началось ещё в марте, так что проблема наблюдается уже в течение длительного времени. Ранее Wikipedia доминировала в результатах поиска Google. Это был наиболее заметный сайт в выдаче. Британские пользователи заметили, что Google экспериментирует с показом твитов в результатах десктопной поисковой выдачи. Пресс-секретарь компании подтвердил эту информацию и уточнил, что тестирование проводится с середины июля. Детали теста раскрыты не были. Ruward:Track опубликовал результаты исследования популярности различных платформ/сервисов рунета за 2 квартал 2015 года, в основу которого лег автоматический анализ краулером около 5 миллионов доменов зоны .RU (по типовым сигнатурам сервисов). Исследование показало, что WordPress показывает быстрый рост, а Jooma — быстрое падение. В начале года ряд экспертов утверждал, что с учетом кризиса продажи коммерческих систем будут падать, а разработчики будут переходить на open-source решения. Пока этого не происходит — Битрикс и UMI наращивают долю рынка. Аналитик и инженер отдела качества поиска Google Гэри Илш (Gary Illyes) сообщил в своем Twitter'е, что хотел бы сделать межстраничную рекламу негативным фактором ранжирования в Google. Представители Google регулярно сообщают о нежелательности использования межстраничной рекламы. Межстраничные объявления с рекламой приложений уже включены в перечень распространенных ошибок, которые встречаются на сайтах для мобильных устройств. | Cоциальная сеть Facebook превзошла Google по объему реферального трафика на сайты издателей в июне, а в июле разрыв показателей достиг 3 процентных пунктов: 38,2 и 35,2%. Об этом свидетельствуют данные нового исследования от аналитической платформы Parse.ly . Это уже второй раз, когда Facebook опережает Google в рейтинге Parse.ly; аналогичная ситуация наблюдалась осенью 2014 года. Важно отметить, что доля Google в реферальном трафике существенно не уменьшается, тогда как Facebook его обгоняет. Это говорит о том, что Facebook отбирает трафик у других источников. Исследование Parse.ly основано на 400 клиентах платформы, среди которых Fox News, Telegraph Media Group, Mashable, Business Insider, Condé Nast, The Atlantic и Reuters. Аналогичные результаты показывают и другие исследования, которые показывают преобладание социального реферального трафика над поисковым. | | Зачастую предприниматели до такой степени погружаются в работу, что не замечают ничего вокруг себя. Они забывают о семье, личном и духовном развитии и физических упражнениях. А ведь без этих вещей любая профессиональная деятельность становится бессмысленной и прекращает быть эффективной. О том, как наладить свою личную жизнь, чтобы добиться успеха в жизни профессиональной, рассказывает книга «Новые размышления о личном развитии». Автор книги — Ицхак Адизес, известный бизнес-консультант, рассматривает финансовую организацию как живой организм, который переживает свои взлеты, болезни, падения и подсказывает, как избежать летального исхода. Также Адизес разработал теорию, согласно которой, менеджер должен обладать характеристиками PAEI — быть производителем результатов (P), администратором (A), предпринимателем (E) и интегратором (I). Советы Ицхака Адизеса применяют Bank of America, Coca-Cola, IBM и более 2000 других крупных компаний. Несмотря на деловой бэкграунд автора, книга «Новые размышления о личном развитии» вовсе не о бизнесе. Она о косвенном влиянии на профессиональную жизнь взаимодействия человека с окружением и самим собой. По словам автора, не стоит отделять личную жизнь от профессиональной, они должны обогащать и поддерживать друг друга. Пока в частной жизни нет равновесия, человек не сможет справиться с переменами и натиском обстоятельств, которые являются естественной составляющей на пути к успеху в мире бизнеса. Кроме того, каждому из нас нужно личное, неделовое пространство, в котором мы будем развивать себя. Книга состоит из пяти глав, каждая из которых — весомая часть в развитии каждого человека. Это здоровый образ жизни, отношения, самопознание, духовность и руководство к жизни... | | | | |
Комментариев нет:
Отправить комментарий