10 мар. 2017 г.

Поиск поддоменов сайта в индексе Яндекса и Google

Рассылка SearchEngines.ru Неправильно отображается?
Посмотреть в браузере.
10 марта

2017 года

СЕГОДНЯ В ВЫПУСКЕ

Подписаться на Twitter     Подружиться на Facebook      Группа ВКонтакте

Отправить другу

Поиск поддоменов сайта в индексе Яндекса и Google

Сергей Людкевич
Автор: Сергей Людкевич - независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru.
Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.

 

В данной статье я хочу рассмотреть один из способов применения операторов языка запроса поисковых машин Яндекс и Google для решения полезной практической задачи – поиска поддоменов сайта, проиндексированных этими поисковыми машинами.

Не редки случаи, когда разработчики сайта забывают закрыть от индексации поддомены сайта, на которых содержится бесполезная для поиска информация – копии текущей версии сайта, неактуальные версии сайта, отчеты анализаторов логов и прочая техническая и служебная информация. Захламление поискового индекса подобными данными в ряде случаев может негативно повлиять на позиции сайта. Поэтому желательно все подобные случаи выявить и запретить к индексации поисковыми роботами.

Решение задачи поиска поддоменов в поисковом индексе базируется на простой логической операции – последовательном отрицании при поиске по всему сайту уже известных нам поддоменов. Поиск по всему сайту и в Яндексе и в Google осуществляется с помощью одинакового оператора site:, для которого в качестве значения необходимо указать домен сайта. Например, site:yandex.ru или site:google.com.

Что же касается поиска по определенному поддомену, то в Яндексе это можно сделать с помощью документированного оператора host:. Необходимо иметь ввиду, что указание домена без www и c www дает разные результаты – проиндексированные страницы только с домена второго уровня и только с поддомена www соответственно:

Особенность оператора host: заключается в том, что он не чувствителен к виду протокола http или https, то есть с помощью этого оператора невозможно отделить в выдаче страницы с протоколами http и https друг от друга.

Таким образом, для поиска поддоменов сайта в Яндексе с помощью оператора отрицания ~~ на первом этапе убираем из поиска по всему сайту документы из корневого домена и/или поддомена www и получаем в выдаче документы с других поддоменов:

Отмечу, что здесь есть некоторая особенность. Дело в том, что в случае достаточно большого количества поддоменов, этот список может быть неполным (вообще связка операторов ~~ и host: весьма странным способом то ли группирует, то ли фильтрует результаты поиска), и его необходимо будет уточнять последовательным отрицанием имеющихся в списке поддоменов (при этом в выдаче могут появляться новые поддомены):

Соответственно возможности метода в общем случае ограничены вместимостью поисковой строки (на сегодня ограничение на длину поискового запроса в Яндексе составляет 400 символов).

Рекомендую использовать в URL страницы поисковой выдачи get-параметр &rd=0, который позволяет снять ограничение на показ документов с одинаковыми сниппетами (подробнее см. в моей статье «Параметры URL страницы выдачи Яндекса»).

В Google нет аналога яндексовскому оператору host:, однако поиск по конкретному поддомену там можно осуществлять с помощью недокументированного оператора inurl:, указав в качестве значения полный (включая протокол) адрес поддомена.
Например: inurl:https://google.com или inurl:http://www.google.com. Здесь надо иметь ввиду, что оператор inurl: ищет вхождение заданной подстроки в URL документа:

Соответственно, данный способ подразумевает разделение в выдаче страниц с http и https протоколами. А если же указывать в качестве значения просто доменное имя без прокола, то нужного результата мы можем не добиться, т.к., к примеру, все поддомены в качестве подстроки будут включать в себя доменное имя.

того, для поиска поддоменов сайта в Google с помощью оператора отрицания (минус) на первом этапе убираем последовательно из поиска по всему сайту документы из корневого домена и/или поддомена www по обоим проколам (в случае необходимости) и получаем в выдаче документы с других поддоменов:

В отличие от ситуации с Яндексом, здесь какой-либо особой фильтрации результатов не замечено, кроме стандартной фильтрации результатов, которые «очень похожи на уже представленные выше». Стандартная фильтрация обходится добавлением в URL страницы выдачи get-параметра &filter=0 (подробнее см. в моей статье «Параметры URL страницы поисковой выдачи Google»). Равно как не замечено и группировок, поэтому также в случае большого количества поддоменов, для большей информативности результатов, будет полезно применение последовательного отрицания уже известных поддоменов, т.к. страницы с одного-двух поддоменов могут забить видимую выдачу. Опять же, здесь мы, как и в случае с Яндексом, ограничены лимитом на длину поискового запроса, в Google он составляет 32 слова.

Кстати, в Яндексе есть также оператор inurl: (бывший некогда документированным, затем прошлым летом исчезнувший из официальной документации, но на данный момент корректно функционирующий) с точно такой же функцией поиска в адресе документа, но по причине того, что он в отличие от гугловского, полностью игнорирует заданный протокол (по сути вырезая его из подстроки), он не годится для решения поставленной задачи:

Я.Вебмастер персонифицировал уведомления и добавил раздел Исключенные страницы

 

Уведомления Вебмастера для каждого сайта стали персонифицированными. Теперь для каждого сайта можно выбрать способ доставки уведомлений — через интерфейс Вебмастера или сразу на почту. Кроме того, по-прежнему остаются и два типа сообщений, для которых привязка к конкретному сайту обычно не ставится. Это персональные сообщения от службы поддержки и глобальные сообщения и новости сервисов для вебмастеров.

В разделе «Страницы в поиске» появился подраздел «Исключенные страницы». В большинстве случаев исключение страниц из поиска — естественный процесс, связанный с настройками на стороне сайта (редиректы, запрет в robots.txt и проч.). Однако исключение страниц из поиска может быть вызвано не только указаниями со стороны владельца сайта, но и ошибками индексирования, дублированием или низким качеством контента.

Сейчас статусы этих страниц видны, и на них стоит обращать внимание и стараться исправлять их при необходимости...

Читать новость на сайте

Google обновил алгоритм по борьбе с некачественными ссылками

На днях Google, возможно, обновил алгоритм, который борется с некачественными ссылками. Об этом сообщает Search Engine Land со ссылкой на множественные сообщения зарубежных вебмастеров.

Американские оптимизаторы прозвали это обновление «Fred». Именно так сотрудник Google Гэри Илш в шутку предложил называть все апдейты поискового алгоритма.

Инструменты мониторинга SERP также показывают значительные изменения в выдаче, что является индикатором обновления...

Самое интересное за неделю

Google интересуется, как вебмастера используют оператор «site:»

Google приглашает вебмастеров принять участие в опросе, посвящённом использованию оператора «site:»
 

Google запустил Data Studio по всему миру

Сервис теперь доступен в более чем 180 странах мира, кроме России, Польши и ещё нескольких рынков.
 

Яндекс обновил мобильное приложение для iOS и Android

Приложение сохраняет ответы на популярные поисковые запросы и показывает их, даже когда интернета нет или он работает очень медленно.
 

Facebook запускает новый инструмент «Advanced Measurement»

С его помощью рекламодатели смогут сравнивать эффективность кампаний в сервисах Facebook и на других платформах.
 

Google AdWords сокращает период учёта конверсий по показам

29 марта 2017 года период учёта конверсий по показам, заданный по умолчанию, будет сокращён с 30 дней до одного дня.
 

AdWords запускает несколько обновлений для объявлений с номерами телефонов

В их числе – расширения «Номера телефонов» на уровне аккаунта, обновлённые объявления формата «call-only» и другие нововведения.
 

WhatsApp тестирует инструменты для бизнеса

Мессенджер тестирует систему, которая позволит компаниям напрямую общаться с пользователями.
 

Мобильная коммерция вытесняет десктопную

Ожидается, что в 2017 через мобильные телефоны будет совершено больше покупок товаров высокой ценовой категории.
 

LinkedIn не удалось договориться с Роскомнадзором

Руководство соцсети по-прежнему уверено, что действует в соответствии с российским законодательством и остается открытой к продуктивному диалогу с Роскомнадзором.
 

Facebook запускает Messenger Day

Это нововведение является аналогом исчезающих постов, принцип которых был позаимствован многими социальными сетями у мессенджера Snapchat.
 

Роспотребнадзор заставит товарные агрегаторы нести ответственность перед потребителем

Комиссия правительства по законопроектной деятельности одобрила законопроект, предложенный Роскомнадзором, который вводит понятие товарного агрегатора и ответственность за предоставление им заведомо недостоверной информации о товаре (услуге) и продавце.
Подписаться на Twitter    Подружиться на Facebook    Отправить другу 
Copyright © 2017 Searchengines.ru,, All rights reserved.
Вы получили эту рассылку, поскольку регистрировались на сайте Searchengines.ru. Вы можете всегда отписаться от нее, переслать другу, а также обновить свой профиль подписчика.

Наш почтовый адрес:
Searchengines.ru, , Moscow, 65000, Russia
отписаться от этой рассылки    обновить настройки подписки 

Комментариев нет:

Отправить комментарий

Оповещение Google – JavaScript

JavaScript Ежедневное обновление ⋅ 18 января 2025 г. НОВОСТИ Google начал требовать включе...