Архивы
Long-tail heaven. Кейс использования Базы Пастухова
2012-02-01 16:42
Натыкаясь (в последнее время - все чаще и чаще) на посты посвященные Базам Пастухова, понимаю, что по большей части они представляют собой рерайт справочника по пользованию оболочкой с официального сайта продукта. Поэтому сегодня мы рассмотрим конкретный случай работы с БП и пример дальнейшего использования результатов этого взаимодействия (как вы уже могли догадаться, речь пойдет о работе с long-tail-запросами). На подтанцовке будет KeyCollector. Чаще всего последний, к слову, противопоставляют продукции Макса Пастухова, и не без оснований. Все же, несмотря на разный принцип получения данных, KC выполняет те же функции, что и Базы Пастухова, но стоит при этом в 6 раз меньше. Но ведь очевидно, что гораздо практичнее использовать оба инструмента, задействуя весь доступный потенциал. И если плюсы KC в основном сводятся к возможности снятия кучи параметров и общему удобству использования, то у Баз Пастухова самый значимый плюс монолитен как скала - максимальная полнота предоставляемой информации. И это мы можем проверить на практике. Неплохое сравнение KeyCollector 8217;a и Баз Пастухова опубликовал как-то Маул, я же, если позволите, предложу свою версию и дополню в некоторых местах. Для начала соберем данные. Дабы не возиться с большими списками, возьмем не слишком частотный ключ. И, раз уж на этом блоге постоянно проскакивают посты о сайтах женской тематики, для примера возьмем кулинарную тему лазанья в домашних условиях . Почему я говорю тема , а не ключ Тут есть небольшой нюанс. Для получения маскимального кол-ва запросов по этой теме мы немного изменим основной ключ, удалив из него последнее слово. Ну и предлог также можно опустить (в статистике они не учитываются). Парсим запрос лазанья домашний . По основной фразе KeyCollector находит 6 запросов: Кроме непосредственно Вордстата у нас еще один дополнительный (и очень полезный) инструмент - парсинг поисковых подсказок. В рамках пользования KC я обычно использую сбор подсказок с 4 основных ПС: Яндекса, Google, Рамблера и Mail.ru. В общем, собираем подсказки по всем 6 запросам, снимаем частотность. Смотрим: Как видим, Mail.ru - излюбленный дамский поисковик - предоставил нам еще 7 запросов из своей базы подсказок. Обратите внимание - запросы даже с нулевой частотностью я оставляю, чуть позже В поясню, почему. Теперь делаем выборку из Базы Пастухова. Поскольку система поиска здесь (в отличии от Вордстата) чувствительна к морфологии, обрезаем окончания у слов запроса: Найдено 28 запросов, 3 из них - нецелевые (связанные с тв-каналом Домашний ). Для удобства сравнения оставшиеся 25 запросов я добавил в KeyCollector и снял частотности: Сразу обращаем внимание на сей ключ: Как видим, этот ключ присутствует в выборке Пастухова, но отсутствует в статистике, собранной с Вордстата. Почему Хрен его знает. Чтобы удостовериться, что это не глюк, вручную забьем его в Вордстат: Все в порядке, ключ есть в базе. Вот только почему он не отображается при сборе статистики Хороший вопрос. Причем, ладно бы, если б...
Продолжить чтение...