Настройка парсинга ключевых слов

Как и любая другая разумная деятельность, парсинг ключевых слов является задачей, характеризуемой набором параметров. Очередь слов, в свою очередь, является контейнером, объединяющим слова по признаку одинакового набора параметров задачи. Понятно объясняю?

Иначе говоря, на уровне очереди вы указываете программе, что делать с этим конкретным списком слов: парсить ли для них только статистику показов; собирать ли для них новые связанные ключевые слова; если собирать, то какие именно, для каких именно регионов, устройств и т.д.

Если у вас есть две очереди с дублирующимся набором слов, вы можете для одной очереди задать сбор информации только по московскому региону, а для второй — только по питерскому. Данные по словами будут храниться отдельно для каждой очереди, при этом для пущего удобства вы можете присвоить очередям говорящие названия при помощи меню «Очередь» → «Переименовать».

Если вы уже обработали несколько ключевиков в очереди, а потом полностью изменили для нее задание, информация для всех слов будет собрана заново, с учетом новых требований.

После того, как вы добавили парсеры и создали очередь ключевых слов, «Солнечный» сразу же запустит процесс сбора информации. Если вы планируете запустить очередь с настройками, отличными от устанавливаемых по умолчанию, поставьте очередь на паузу до того, как вы добавите первое ключевое слово.

Постановка очереди на паузу

Временно приостановить обработку текущей очереди можно при помощи кнопки паузы. Приостановить обработку сразу всех очередей можно при помощи меню «Очередь» → «Приостановить все».

Важно! Постановка очереди на паузу приостанавливает только отправку ключевых слов на обработку парсерам (серверам). Сами парсеры не останавливаются, поэтому отправленные ранее слова будут обработаны и информация по ним будет получена и отображена в окне очереди не взирая на режим паузы.

Кнопка паузы и индикация останова текущей очереди

Настройка парсинга «Вордстата»

Кликните по формулировке задачи, расположенной в панели управления очередью, чтобы отрыть меню настроек парсинга:

Разберем доступные пункты меню:

«Собрать статистику показов для списка слов»

Неотключаемый пункт. При парсинге любой информации из «Вордстата», вы так или иначе будете загружать информацию о статистике показов для каждого из обрабатываемых ключевых слов, поэтому «Солнечный» всегда сохраняет собранные данные о показах. Это минимальный набор полезных действий, выполняемый всегда, при любой постановке задачи.

В интерфейсе сервиса «Вордстат» эта информация расположена здесь:

Размещение информации о статистике показов в интерфейсе «Вордстата»

«Найти новые слова»

Под «новыми» словами подразумеваются все ключевые фразы, связанные с обрабатываемым (в данном случае это ключевик «авто»).

В интерфейсе «Вордстата» есть два столбца связанных слов: левый, состоящий из ключевиков, содержащих искомое слово, и правый, содержащий «похожие» слова. Отметьте пункт меню «Найти новые слова», чтобы «Солнечный» собирал связанные слова из левого столбца:

Связанные ключевые слова в интерфейсе «Вордстата», левый столбец (слова, содержащие искомое ключевое слово)

«Солнечный» будет самостоятельно листать страницы «Вордстата», собирая все слова в соответствии с настройками.

В интерфейсе программы количество найденных поисковых фраз из левого столбца «Вордстата» отображается в столбце очереди под названием «Что искали со словом...»:

Поисковые фразы из левого столбца «Вордстата» в интерфейсе Солнечного

«Найти «похожие» слова»

Отметьте этот пункт меню для сбора т.н. «похожих» слов, которые размещены в правом столбце интерфейса «Вордстата». Они не содержат оригинального слова («авто»), но связаны с ним по смыслу (говоря точнее, люди, искавшие по ключевику «авто», искали также и по этим фразам).

«Похожие» ключевые слова в интерфейсе «Вордстата»

В некоторых кругах эти слова называют «эхом Вордстата». «Солнечный» не использует подобную терминологию. Раньше правый столбец назывался в интерфейсе «Вордстата» «Что еще искали люди, искавшие слово «авто». В интерфейсе Солнечного он называется «Что еще искали...», либо просто «похожие слова»:

Поисковые фразы из правого столбца «Вордстата» в интерфейсе Солнечного

Сбор ключевых слов по регионам

Являясь интерфейсом к базе «Директа», «Вордстат» позволяет получать информацию о ключевых словах для конкретного набора регионов.

Кликните по пункту меню «Регионы», в открывшемся диалоговом окне отметьте галочками интересующую региональную комбинацию и нажмите кнопку «Применить».

Диалоговое окно региональных настроек парсинга

«Солнечный» самостоятельно поддерживает актуальность списка регионов, время от времени скачивая его актуальную версию с серверов Яндекса.

Дифференциация по типам конечных устройств

Дифференциация (сегментация?) по типам устройств спрятана за пунктом «Расширенные настройки». Нажмите на него, далее в открывшемся диалоговом окне выберите интересующий тип устройств и нажмите кнопку «Сохранить».

Выбор типа пользовательского устройства в диалоговом окне Солнечного

Вот так это выглядит в пользовательском интерфейсе «Вордстата»:

Выбор типа пользовательского устройства в интерфейсе «Вордстата»

На этом настройка парсинга «Вордстата» завершена! Снимите очередь с паузы, если ставили ранее, и «Солнечный» сразу же начнет отправлять слова подлюченным парсерам «Вордстата».

Настройка парсинга поисковых подсказок Яндекса

Парсинг поисковых подсказок Яндекса прост как палка и не требует дополнительных настроек. Если они со временем появятся, то окажутся доступны все в том же меню постановки задачи:

Контроль процесса парсинга

Удостовериться, что парсинг выполняется без сучка без задоринки, можно по следующим характерным признакам:

Контроль парсинга через показания серверов

Контроль парсинга через показания очереди слов

Готовность очереди ключевых слов

После того, как все ключевые слова в очереди были обработаны, вкладка очереди обозначается галочкой «Готово!» (см. рисунок). Это основной индикатор готовности очереди.

Второстепенными индикаторами могут выступать готовность всех поисковых фраз, равная «100%», и отмеченная на рисунке вертикальная шкала синего цвета. На этой шкале синими рисками обозначаются в соответствующем масштабе ключевые слова, достигшие стопроцентной готовности. Это позволяет по фрагментированной линии на глазок определять текущий уровень готовности очереди. Когда обработка очереди завершена, шкала выглядит непрерывной линией.

Признаки готовности пула ключевых слов