4 сент. 2015 г.

Как распознать и заблокировать «нехороших» ботов

Рассылка SearchEngines.ru Неправильно отображается?
Посмотреть в браузере.
4 сентября

2015 года

СЕГОДНЯ В ВЫПУСКЕ

Статейная биржа WebArtex запустила в работу новый модуль продвижения в социальных сетях. Оптимизаторам Системы доступны личные страницы пользователей и паблики «ВКонтакте», популярные аккаунты в Twitter, каналы на YouTube.

Стоимость постов со ссылками от 8р. ВК и Twitter и от 75р. в YouTube. Отбор площадок традиционно строгий: на это и ставка, потому что всем нужны страницы, паблики и каналы с живыми, активными читателями. Именно такой источник непоискового трафика – мощное подспорье и хороший толчок на пути в ТОП10.

Что дают ссылки из соцсетей продвигаемому сайту?

● Активный живой трафик с постов: на сайт переходят люди, которые заинтересовались либо вашим предложением, либо вашим креативом. По вебвизору видно невооруженным взглядом, что это живые пользователи, которые изучают сайт. Кроме того, с подобных размещений сайт ещё долго будут тянуться переходы на сайт, потому как постами делятся другие пользователи.

● SEO-эффект: рост позиций за счёт того, что сайт становится авторитетнее в глазах поисковиков, естественным образом укрепляется поведенческий и социальный профиль.

● Наконец, поисковый трафик: поисковик видит, что сайт полезен и интересен живым людям, которые постоянно туда приходят из непоисковых источников.

Набор площадок открыт и идёт активными темпами. Желающие вебмастера могут добавлять свои страницы, выкуп уже начался, и он будет значительно расти месяц от месяца.

Также работает очень интересная партнёрская программа, где можно заработать хорошие деньги, особенно с тем учётом, что вебмастера добавляют свои площадки в огромном количестве, и привлекать их можно недорогими ресурсами.

Как распознать и заблокировать «нехороших» ботов

Ben Goodsell
Автор: Бен Гудселл (Ben Goodsell) – руководитель отдела поискового продвижения в RKG Merkle. Специалист в области технического SEO, имеет опыт продвижения сайтов в социальных медиа, специализируется на разработке стратегий контентного продвижения и линкбилдинге. Регулярно сотрудничает с крупными брендами.

Источник: SearchEngineLand.com

Любому грамотному оптимизатору в своей профессиональной деятельности когда-либо доводилось анализировать лог-файлы для того, чтобы определить поведение поискового робота Googlebot. Однако мало кто представляет себе, насколько эффективным может оказаться этот подход для выявления нежелательных ботов, которые регулярно посещают сайт. Главная опасность таится в том, что эти роботы автоматически исполняют сценарий JavaScript, наводняя аналитику ложными данными, нанося вред ресурсу, незаконно копируя его контент и т.д.

Согласно данным ежегодного отчёта агентства Incapsula, доля неестественного трафика, поступающего на сайты, в среднем составляет 56%. При этом в 29% случаев боты, приходящие на ресурс, содержат вредоносное ПО и наносят заметный ущерб. В ходе исследования экспертная группа агентства проанализировала статистику 20 тыс. веб-сайтов разного масштаба за 90-дневный период. Наблюдения позволили выделить ещё один заметный момент: чем более крупный и узнаваемый бренд представляет сайт, тем более очевидной и желанной целью он становится для ботов.

Главная цель этой статьи – рассказать специалистам отрасли о том, с чего следует начинать аудит сайта по данному направлению и как грамотно анализировать лог-файлы при помощи Excel для выявления «недобросовестных» ботов и последующей их блокировки на уровне сервера. Также автор статьи расскажет о том, как устранить искажения в отчётах Google Analytics.

Находим лог-файлы

Как известно, сервер фиксирует все обращения к сайту и хранит их в виде текстового файла со списком. Не важно, заходит ли на сайт реальный пользователь (к примеру, через браузер Firefox) или же новые страницы ресурса сканирует Googlebot – все эти активности фиксируются в специальном файле. Расположение этих файлов зависит от типа сервера или хостинга.

Так, если владелец ресурса использует платную панель управления веб-хостингом cPanel, то файл, записывающий все обращения к сайту, будет располагаться под отдельной ссылкой:

В интерфейсе сервера Apache путь к файлу лога будет таким: /var/log далее в поддиректории следует запустить команду access.log – это позволит быстро обнаружить лог-файлы на сервере.

Если в качестве хостинга используется набор серверов от Microsoft IIS (Internet Information Services), то путь будет таким: Панель управления – Администрирование – Internet Information Services (IIS) Manager – Выбрать веб-сайт – после этого нужно правой кнопкой мыши кликнуть по вкладке Свойства – выбрать вкладку Веб-сайт – Свойства – Основные свойства. Для англоязычной версии продукта последовательность действий будет такой: Control Panel -> Administrative Tools -> Internet Services Manager -> Select website -> Right-click then Properties -> Website tab -> Properties -> General Properties tab.

Вычисляем количество хитов на один IP-адрес и считаем число заходов User Agent’ов

После того как все лог-файлы были обнаружены, необходимо объединить их в одном файле и загрузить в Excel любым удобным методом. Учитывая объёмы отдельных лог-файлов, сделать это зачастую бывает очень непросто. В то же время, чтобы проделать указанную выше операцию для небольших и средних сайтов, мощности одного стандартного компьютера будет вполне достаточно.

На практике набор действий сводится к следующей последовательности. Все файлы, расположенные в директории .log files, необходимо объединить и поместить в новый файл формата .txt, используя стандартный текстовый редактор. После этого нужно запустить Excel, разбив текст по колонкам, используя для разделения пробел и выравнивая впоследствии заголовки столбцов.

Рассчитываем количество хитов на один IP

После того как все логи собраны и объединены в таблице Excel, становится гораздо легче рассчитать количество загрузок страниц сайта на один IP-адрес.

Далее нужно выполнить действия в такой последовательности:

  1. Сформировать сводную таблицу, проанализировать количество Client IP и сделать расчёт.
  2. Затем необходимо скопировать полученную таблицу; переименовать существующие столбцы в «Client IP» и «Хиты»; отсортировать список по нисходящей; добавить колонку User Agent.

Вычисляем User Agent по IP

На заключительной стадии необходимо выявить потенциально опасных ботов. Для этого придётся установить, с какого IP-адреса осуществлял вход на сайт тот или иной User Аgent, и какой из роботов оказал на ресурс наибольшее негативное воздействие. Чтобы проделать эту операцию, необходимо повторно обратиться к сводной таблице и указать в качестве переменной User Аgent в каждую строку секции сводной таблицы (графа Row Label на рис. выше).

Теперь нахождение роботов Аgent с привязкой к IP станет гораздо более простой задачей. На скриншоте ниже видно, что User Agent с IP-адреса устройства, расположенного в Китае, заходил на сайт на 80 тысяч раз чаще, чем другие роботы.

Блокируем нежелательный IP-адрес

Ключевым этапом всей деятельности становится блокировка доступа к сайту User Agent'а с нежелательного IP-адреса, а также исключение этих данных из сервиса статистики.

Чтобы заблокировать статистику посещений с нежелательного IP в Google Analytics, придётся создать специальный фильтр. Для этого нужно войти во вкладку «Администратор» и выбрать пункт «Аккаунт» , в котором будет создаваться фильтр. Затем выбрать пункт «Фильтры», далее +Новый фильтр. После этого нужно переключиться на пункт «Встроенный» и выбрать стандартный тип фильтра: «Исключить трафик с IP-адресов» (Exclude traffic from the IP addresses). Далее в специальном поле можно перечислить все нежелательные IP.

Совет: Сервис Google Analytics автоматически блокирует данные, поступающие от всех известных краулеров из списка IAB. Чтобы сервис аналитики перестал учитывать переходы от этих роботов, достаточно обратиться к вкладке «Администратор» снизу от пункта меню «Посмотреть Настройки» можно увидеть раздел «Фильтрация роботов» («Bot Filtering») там же можно выбрать пункт «Exclude all hits from known bots and spiders». Самым правильным вариантом будет создавать новый фильтр всякий раз, когда вы меняете настройки профиля.

Если же владелец сайта использует аналитику от Omniture, исключить из статистики данные по нежелательным IP можно следующим способом:

  1. Опция Exclude by IP позволяет игнорировать данные для 50 IP-адресов.
  2. Опция Vista Rule предусмотрена для крупных компаний и позволяет увеличить число нежелательных IP.
  3. Функционал Processing Rule позволяет создавать специальные правила и блокировать данные о переходах на сайт с нежелательных IP.

Блокировка IP на уровне сервера

Аналогично тому, как вычисляется расположение лог-файлов, производится вычисление сервера, которому принадлежит конкретный IP-адрес, и осуществляется его блокировка.

При работе с cPanel имеет смысл воспользоваться возможностями IP Address Deny Manager. Нежелательные IP-адреса будут заблокированы навсегда.

Для Apache рекомендуется использовать модуль mod_authz_host, кроме него можно использовать .htaccess.

Те, кто пользуются IIS, могут заблокировать все нежелательные IP на уровне сервера в Open IIS Manager (Features View -> IPv4 Address and Domain Restrictions -> Actions Pane -> Add Deny Entry).

Итоги и выводы

Сегодня сторонние решения, предназначенные для выявления неестественного трафика на сайты и обнаружения ботов, позволяют делать это в режиме реального времени. При этом они умеют анализировать не только IP-адреса и коды юзерагентов, но и параметры HTTP-запроса, поведение робота на сайте и целый ряд других факторов.

Помимо подобных решений, владельцы ряда сайтов всё чаще применяют такой инструмент, как reCAPTCHA. Новая формула защиты от Google еще раз позволяет убедиться, что на сайт приходят реальные пользователи, а не роботы.

Рекомендуем посетить

Хотите поговорить о перспективах больших данных и машинного обучения с гуру data science, услышать о лучших практиках работы с данными от топ-менеджеров Badoo, Deutsche Telekom, GfK, TripAdvisor, Boeing?

Приезжайте на бизнес-сессию Machine Learning and Big Data: Business challenges, организованную Фабрикой Данных Яндекса в рамках международной научной конференции Machine Learning: prospects and applications.

Yandex.Berlin

Среди спикеров:

Владимир Вапник (Facebook)
Jeff Palmucci (TripAdvisor)
Norbert Wirth (GFK)
Аркадий Волож (Yandex)
Esther Dyson (Edyson ventures)

Узнать больше о программе бизнес-сессии

Узнать больше о научной конференции

Зарегистрироваться на бизнес-сессию

Чтобы получить скидку 100 евро на участие в конференции (научная и бизнес-сессии), перейдите по ссылке: https://yandexdataschool.com/conference/registration/d100?from=inno

Google представил новый дизайн и логотип

Компания Google представила новый логотип для своей поисковой системы. Теперь его название, выполненное новым шрифтом, выглядит плоским.

Обновление призвано привести логотип в соответствие с современными тенденциями упрощения интерфейса.

Изменению подверглась также и иконка – как в веб-версии, так и в мобильном приложении. Теперь она не синяя, а четырёхцветная, что соответствует новому логотипу.

Кроме того, компания также обновила внешний вид мобильной поисковой выдачи и карточек Google Now. Все эти изменения призваны отобразить новый визуальный язык Google.

«Мы не первый раз меняем оформление и, скорее всего, не последний. Однако это обновление особенно важно, ведь оно отражает нашу философию и разнообразие наших сервисов. Теперь их всех – Поиск, Gmail, Карты, Chrome и многие другие, объединяет образ, для которого мы взяли лучшее от Google – простоту, лаконичность, яркость и дружелюбие. Он символизирует не только нынешний этап развития Google, но и его будущее», - заявил дизайнер продуктов Кай Конраган (Kai Conragan) в официальном блоге.

В рамках обновления главная страница поискового приложения Google на Android-устройствах также была изменена, чтобы пользователи могли «погрузиться в различный контент, такой как изображения, видео и новости» с помощью пролистывания и нажатия.

Самое интересное за неделю

Google будет ранжировать ниже сайты с навязчивой межстраничной рекламой установки приложений

Google объявил, что страницы, содержащие межстраничную рекламу приложений, скрывающую «значительную часть контента» на странице, будут считаться недружественными к мобильным устройствам. Соответственно, в мобильной выдаче они будут ранжироваться ниже, чем mobile-friendly страницы. Нововведение вступит в силу 1 ноября 2015 года.  Это изменение не повлияет на другие виды межстраничных объявлений.

Опубликован список 260+ факторов ранжирования Google

Агентство Northcutt опубликовало список из 261 фактора ранжирования Google. При составлении списка экспертами было использовано три источника данных: патентная информация; заявления сотрудников Google; научные статьи. Публикация на сайте агентства также включает полосу прокрутки, позволяющую отфильтровать факторы в диапазоне от наиболее реальных до так называемых «SEO-мифов». При этом, как показывают результаты фильтрации, из 261 фактора лишь 200 вероятнее всего учитываются Google.

Google обновил редактор AdWords до версии 11.1.3

Представители сервиса контекстной рекламы Google AdWords объявили об обновлении Редактора до версии 11.1.3. В этом выпуске были улучшены ярлыки, ссылки сайта и импорт файлов CSV, а также исправлены незначительные ошибки в работе приложения. Новая версия Редактора уже доступна для загрузки.

Facebook облегчил оптимизацию рекламных кампаний на основе конверсии

Facebook представил усовершенствованную версию инструмента измерения роста конверсии объявлений Conversion Lift, запущенного в январе.
Ранее этот функционал позволял определить, оказывает ли кампания влияние на рост онлайн и офлайн-продаж. Теперь также можно протестировать различные типы объявлений и выбрать те из них, которые дают максимальный результат с точки зрения конверсии.

Google запустил нативную рекламу в Gmail

Google AdWords объявил о запуске нативной рекламы в почтовом сервисе Gmail. Новый функционал уже доступен рекламодателям во всём мире.
Рекламный блок отображается в верхней части вкладки «Промоакции» в папке «Входящие». Объявления будут появляться как в мобильных приложениях, так и в веб-версии сервиса. По умолчанию они находятся в свёрнутом состоянии. По клику объявления разворачиваются до размеров полноценного сообщения, что даёт пользователю возможность взаимодействовать с изображениями и текстом.  Плата взимается только за клики по свёрнутому объявлению.

Bing обновил приложение для iOS, упростив поиск тематических новостей

Bing выпустил новую версию поискового приложения для iOS. Среди основных нововведений - функционал Bing News приложения теперь содержит «умные» ярлыки, запущенные две недели назад. Новости также можно отслеживать с помощью новой функции Bing Interests. В приложении Bing для iOS теперь также легче перейти в режим приватного поиска. Это можно сделать с помощью нового переключателя, добавленного разработчиками в поисковую строку.

Google добавил видеокампании TrueView в основной интерфейс AdWords

Google объявил, что теперь рекламодатели смогут управлять видеокампаниями TrueView через основной интерфейс AdWords наряду с торговыми и кампаниями поисковой и медийной рекламы.
Рекламодатели получили возможность массового редактирования видеокампаний и добавления учётных записей в YouTube в раздел «Связанные аккаунты» в AdWords. Видеокампании теперь будут доступны в качестве одной из опций в меню выбора кампании в левом верхнем углу интерфейса.

Новые правила в Яндекс.Директе затронут не только поиск Яндекса, но и поисковые площадки Рекламной сети

Яндекс напоминает, что с 1 сентября Яндекс.Директ меняет условия размещения рекламы: вводит новую модель аукциона и сортировку объявлений. В Директе начнет действовать аукцион Викри-Кларка-Гровса, в котором цена клика рассчитывается с учетом того, насколько больше трафика дает рекламная позиция по отношению к более низкой. Таким образом, средняя цена клика будет расти пропорционально росту трафика, и рекламодателям станет выгодно торговаться за дополнительную аудиторию.

Google Analytics запустил функционал для проверки данных в режиме реального времени

Команда Google Analytics объявила о запуске нового мощного функционала Google Tag Assistant Recordings. Инструмент призван помочь проверять корректность данных в аккаунтах Google Analytics или Google Analytics Premium. Если функционал находит проблемы качества данных, он помогает устранить их, а затем провести повторную проверку. Функционал доступен как часть расширения Google Tag Assistant Chrome Extension.

Google представил новый дизайн межстраничных объявлений

Google запустил новые форматы дизайна межстраничных объявлений. Они доступны как для рекламы установки приложений, так и для текстовых объявлений, показ которых производится в iOS и Android-приложениях. Реклама установки приложений теперь включает более крупное изображение обложки в верхней части объявления, а рейтинг и описание продукта расположены в центре. Внизу объявления находится круглая кнопка «Установить» – её цвет можно настроить.

Яндекс изменил дизайн главной корпоративной страницы

Компания Яндекс провела редизайн главной корпоративной страницы, значительно улучшив ее внешний вид и облегчив пользователям навигацию. Основой дизайна новой страницы стало окно сервиса «Прямой эфир», которое уже много лет в реальном времени демонстрировало тексты запросов пользователей. Окно покинуло нижний правый угол, который занимало ранее, и было расширено на весь первый экран.
Все главные звенья навигационной цепочки вынесены в шапку, что гораздо удобней, чем левостороннее расположение, а анонсы самых важных новостей компании расположились внизу экрана.

Google улучшил пользовательский интерфейс мобильного поиска приложений

Разработчики Google обновили дизайн мобильных результатов поисковой выдачи при поиске приложений.
Каждое приложение в выдаче представлено иконкой и размещенной под ней информацией о приложении – названием приложения, рейтингом, количеством скачиваний и стоимости.

Mail.Ru Group и Сбербанк представили сервис упрощенной оплаты товаров и услуг через соцсети

Mail.Ru Group и Сбербанк России сообщили о создании сервиса для упрощенной оплаты товаров и услуг с использованием аккаунтов в Одноклассниках и ВКонтакте. Теперь пользователи, которые привязали к аккаунту в соцсети банковскую карту, смогут платить ею на сторонних сервисах в один клик. Сервис позволяет быстро и безопасно платить в интернет-магазинах, подключенных к Сбербанку, используя авторизацию во ВКонтакте или в Одноклассниках при условии, что банковская карта привязана к аккаунту в соцсети.

Google вводит поддержку HTML5-баннеров, начиная с 1 сентября 2015

Начиная с 1 сентября 2015 года, Google вводит поддержку HTML5-баннеров для рекламодателей. Flash-объявления, преобразованные в HTML5, могут показываться на всех ресурсах, поддерживающих формат Flash или HTML5. Google AdWords теперь автоматически конвертирует Flash в HTML5. Однако пока возможность доступна лишь для ограниченного числа кампаний. Для самостоятельного изменения формата можно воспользоваться конвертером Swiffy, предварительно загрузив туда Flash-баннеры.

Facebook начал тестирование нового интерактивного формата мобильной рекламы

Facebook приступил к тестированию нового формата мобильной рекламы – полноэкранных интерактивных объявлений.

В эксперименте принимает участие четыре бренда – Gatorade, Mr Porter, Michael Kors и Carrefour.

В новостной ленте объявления выглядят как обычные спонсируемые посты, однако по клику они разворачиваются на весь экран и позволяют пользователю прокручивать и поворачивать текст, фотографии, видео и другой контент. Этот формат выглядит как альтернативная версия веб-сайта бренда. При этом он загружается быстрее и является более интерактивным. В целом, идея очень схожа с функционалом «мгновенных статей», который социальная сеть предлагает ведущим СМИ.

На текущий момент эксперимент ограничен лишь приложениями Facebook для iPhone и iPad.

В своей книге Джон Янч объясняет, как поменять взгляд на продажи. Стать современным продавцом, значит, стать проводником в мире покупки — интересоваться тем, что дать клиенту, а не тем, что можно получить от него. Составлять содержательные и привлекательные презентации, а не звонить клиентам по холодной базе. Выступать на конференциях, а не посещать их. Общаться с лидерами отрасли, а не дружить с ними в социальных сетях. Строить партнёрскую сеть, а не ждать, пока тебя сделают партнёром.

В первой части книги автор формирует образ мышления, который помогает сопровождать клиента. Благодаря интернету ему доступна вся информация, клиент может защититься от рекламы и оставить отзыв о компании. Поэтому продавцу надо тесно взаимодействовать с маркетёром, участвовать в создании рекламных посланий.

Во второй части Джон делится практическими навыками и приёмами для использования в новой среде продаж. Прежде они рассматривались как инструменты маркетёров, однако больше такого разделения нет...
 

Подписаться на Twitter    Подружиться на Facebook    Отправить другу 
Copyright © 2015 Searchengines.ru,, All rights reserved.
Вы получили эту рассылку, поскольку регистрировались на сайте Searchengines.ru. Вы можете всегда отписаться от нее, переслать другу, а также обновить свой профиль подписчика.

Наш почтовый адрес:
Searchengines.ru, , Moscow, 65000, Russia
отписаться от этой рассылки    обновить настройки подписки 

Комментариев нет:

Отправить комментарий

Оповещение Google – JavaScript

JavaScript Ежедневное обновление ⋅ 20 января 2025 г. НОВОСТИ Достойный противник классичес...