Семантическое ядро, часть 1. Методика подготовки фраз для парсинга семантического ядра

1 126 8

Ключевые фразы — залог успеха компании. Чем больше тематических удаётся собрать, тем больше шансов, что в семантическое ядро попадут редкие сочетания, мало или совсем не используемые другими рекламодателями. Что означает более низкую конкуренцию.

Речь в материале пойдёт о предварительном этапе сбора семантического ядра — подготовке фраз для парсинга. Этап этот не менее важен, чем последующие два:

Семантическое ядро, часть 2. Парсинг и чистка ключевых фраз

Семантическое ядро, часть 3. Группировка, распределение и оценка вероятности успеха

Содержание статьи:

  1. 1. Собираем названия товаров и услуг, включая синонимы.
  2. 2. Готовим "коммерческую" часть фраз при необходимости.
  3. 3. "Перемножение" составляющих фраз.
  4. 4. Особые случаи.

Инструкция написана на примере сбора ключевых фраз, используемых пользователями при поиске помощи при панических атаках (для рекламы сайта психолога).

1. Собираем названия товаров и услуг, включая синонимы

Блок под результатами поиска

Забиваем в поиск Яндекса название "панические атаки". Внизу в блоке "Вместе с «…» ищут" можно увидеть название самого заболевания, которое вызывает панические атаки:
блок Яндекса вместе с ключевой фразой ищут
Фраза "паническое расстройство" относится к тому же заболеванию и подходит.

Собираем синонимы

В словаре синонимов: https://text.ru/synonym/ по очереди проверяем слова, образующие название заболевания:

синонимы слова панический

Видно, что подходящего синонима нет, и, если заменить слово "панический", то изменится и смысл запроса. Поэтому слово "панический" обязательно должно присутствовать (в какой либо форме) и заменить его нечем.

синонимы слова атака

Слово "Приступ", которое словарь выдал в качестве синонима слова "атака", также широко используется в медицине и хорошо сочетается со словом "панический". Таким образом на этом этапе получили новую ключевую фразу, обозначающую название заболевания, — "панический приступ". Если забить фразу в поисковике, можно увидеть, что выдаются сайты также о панических атаках, что подтверждает правильность хода мыслей:

результаты поиска панический приступ

Аналогичным образом проверили синонимы слова "расстройство" и получили список фраз на этом этапе:

  • панические атаки,
  • паническое расстройство,
  • панический приступ,
  • панические нарушения.

Работа с формами слов

Теперь нужно попробовать поменять формы слов: существительные преобразовать в прилагательные, а прилагательные — в существительные.

На более простом примере: "телефон для женщин" в контексте поиска товаров будет синонимом фразы "женский телефон".

"Атакических" или "приступных" паник не бывает, но играясь с формами можно заметить ещё одну фразу "приступы паники". В этой фразе прилагательное "панический" стало существительным "паника". По смыслу эта фраза подходит, итого, в результате изысканий получили 5 названий одного и того же заболевания (вернее, название заболевания здесь одно — "паническое расстройство", но сути не меняет — на людей, ищущих решения этой проблемы, нацелена реклама) :

  • панические атаки,
  • паническое расстройство,
  • панический приступ,
  • приступы паники,
  • панические нарушения.

После этого добавляем единственное или множественное число (в зависимости от того, какая форма уже присутствует  в списке).

Итог:

  • панические атаки,
  • паническая атака,
  • паническое расстройство,
  • панические расстройства,
  • панический приступ,
  • панические приступы,
  • приступы паники,
  • приступ паники,
  • панические нарушения,
  • паническое нарушение.

Поиск дополнительных идей в Вордстате

Необходимо по очереди забить составляющие фразы слова в https://wordstat.yandex.ru/ и оценить первую страницу результатов (дальше первой заходить, как правило, нет смысла). Например, если забить слово "панический", можно обнаружить новую подходящую фразу:

wordstat-panicheski-small

Проверяем производные фраз

Полученные фразы нужно проверить в Яндекс.Вордстате на содержание нерелевантных производных фраз.

Например, здесь видно:
вордстат панические атаки

что большая часть производных фраз являются нерелевантными (при условии, что нацеливаемся на аудиторию, собирающуюся совершить покупку. Если бы нас интересовала любая аудитория, интересующаяся паническими атаками, данная фраза подходила бы). Если оставить слово в таком виде, не уточнив его, при последующем парсинге будет получено значительное количество производных нерелевантных фраз, от которых потом придётся долго чиститься. Чтобы этого избежать, к исходным фразам в данном случае нужно добавить уточняющую часть, придающую нужный "коммерческий" интент.  

2. Готовим "коммерческую" часть фраз при необходимости

В зависимости от задач рекламы, работа, как может быть закончена на предыдущем этапе, так и продолжится. 

Например, если нужно собрать информационные запросы (какой экскаватор лучше для разработки котлованов, как правильно одевать подгузник и т.д.), к фразам следует добавить соответствующие слова: как, чей, сколько, откуда, куда, зачем, почему, когда, где, который, какой, что, кто.

В соответствии с выбранным примером привожу методику и ход мыслей при сборе коммерческих "хвостов", в которых пользователь выражает намерение совершить покупку.

Сбор коммерческих окончаний фраз

Забиваем самое популярное название заболевания в Яндекс.Вордстат https://wordstat.yandex.ru/

(Узнать самое популярное название можно, забив по очереди все названия в тот же инструмент:

вордстат панические атаки

Цифра напротив будет означать количество запросов пользователей с этой фразой. Чем больше цифра, тем больше популярность.)

Например, фраза "панические атаки симптомы" имеет слабо выраженный коммерческий интент, т.к. пользователь только интересуется симптомами и непонятно, когда соберётся обратится к специалисту.

В результатах можно выбрать при первичном осмотре следующие слова:

  • "лечение" — из фразы "панические атаки лечение". Это также сомнительное с точки зрения интента слово. Может быть праздное любопытство человека, решившего узнать, как лечатся атаки.
  • "лечение в Москве" — из фразы "лечение панических атак в москве" (здесь пользователи забивают название города, а, значит, с высокой вероятностью ищут возможные места, где собираются получить психологическую помощь). Хорошая фраза с выраженным коммерческим интентом. В данном случае выписываем более узкую фразу "лечение в Москве" только потому, что приняли решение отказаться от более широкой "лечение". Если бы взяли слово "лечение", то выписывать фразы "лечение +какое-то слово" не имело бы смысла, т.к. они итак были бы собраны при последующем парсинге.
  • "лечение цена" — из фразы "лечение панической атаки цена". Аналогично предыдущей фразе.
  • "врач" — из фразы "панические атаки врач". Пользователь с высокой вероятностью подбирает себе врача, и, значит, в этой фразе сильный коммерческий интент.

Другие слова из фраз с сильным коммерческим интентом: 

  • "клиника" — из фразы "клиника панических атак".
  • "избавление" — из фразы "избавление от панических атак".
  • "помощь" — из фразы "помощь при панических атаках".
  • "терапия" — из фразы " терапия панических атак".
  • "психотерапевт" — входит в состав фраз "панические атаки психотерапевт Москва",

Итого:

  • лечение в москве
  • врач
  • клиника
  • избавление
  • помощь
  • терапия
  • психотерапевт
  • специалист
  • психиатр
  • психолог
  • снятие
  • тренинг
  • куда обратиться

Прорабатываем формы "коммерческой" части фраз

Для каждого полученного слова нужно проработать форму. Например из фразы "лечение панических атак в Москве" получится:

  • лечить панические атаки в москве
  • вылечить панические атаки в москве

При этом нужно следить, чтобы не исказился общий смысл фразы и отражаемый ею коммерческий интент.

Итого получаем:

  • лечение в москве
  • вылечить в москве
  • врач
  • клиника
  • избавление
  • избавить
  • избавиться
  • помощь
  • терапия
  • психотерапевт
  • специалист
  • психиатр
  • психолог
  • снятие
  • снять
  • тренинг
  • куда обратиться

Здесь просто приведу для примера типовые "коммерческие" окончания фраз при покупке товаров или услуг:

  • купить
  • куплю
  • продажа
  • цена
  • расценки
  • прайс
  • стоимость
  • сколько стоит
  • заказать
  • заказ
  • сайт
  • москва
  • недорого
  • дешево
  • доставка
  • интернет магазин
  • интернет-магазин
  • онлайн магазин

3. "Перемножение" составляющих фраз

Если при сборе получили информационную часть фраз (названия товаров или услуг):

А, Б, В

 и коммерческую часть:

Г, Д, Е,

то перед дальнейшим парсингом их необходимо "перемножить", чтобы получить максимальное количество возможных вариантов. Получится:

АГ, АД, АЕ, БГ, БД, БЕ, ВГ, ВД, ВЕ.

Сделать это можно, например, при помощи этого бесплатного инструмента.

перемножение ключевых фраз

Полученный список фраз можно запускать в дальнейший парсинг.

4. Особые случаи

Коммерческие фразы без явного "коммерческого" фрагмента

Если цель сбора — только коммерческие фразы, нужно иметь ввиду, что в некоторых случаях фраза или слово является достаточно коммерческой без добавления к ней слов, выражающих намерение купить.

Убедиться в необходимости использования такой фразы в чистом виде без добавления коммерческого "хвоста" можно, забив её в поиск в нужном регионе. В результатах выдачи в таких случаях доминируют страницы с предложением товаров или услуг (а не информационные ресурсы).

Примеры:

Однородные и неоднородные нецелевые фразы

Если проверка производных фраз на первом этапе показала, что нерелевантных фраз много (например, более половины на первой странице), и они неоднородны в плане интента (как в примере выше — одни хотят почитать про симптомы, другие — про причины, третьи — про отзывы и др.), то оптимальный вариант уточнения исходных фраз — добавление слов с коммерческим интентом, как и было описано в методике.

Но иногда удалить сразу много нецелевых фраз можно, зафиксировав форму слова, без добавления уточняющего "хвоста". В следующем примере видно, что нерелевантные фразы однородны:

 wordstat-otdelka

Целевая аудитория ищет отделку купленной ранее квартиры, нецелевая — покупку готовой с выполненной отделкой. Можно заметить, что те, кто хотят купить квартиру используют слово "отделка" в дательном падеже и часто добавляют слово "купить". Соответственно, чтобы быстро избавиться от этих фраз, необходимо добавить минус слова:

 вордстат отделка квартир

зафиксировав восклицательными знаками форму слова. Подробнее про операторы https://yandex.ru/support/direct/keywords/symbols-and-operators.html

Видно, что в результате простой операции сразу очистились от большого числа нерелевантных фраз. Правда, при последующем сборе нужно не забыть использовать эту фразу с минус-словами.

Методика подготовки фраз таким образом довольно трудоёмка. Если нужно более быстрое понимание основных ключевых слов на странице, можно воспользоваться инструкцией

спасибо, про синонимы интересно

Ответить

Константин Гайдук
28.01.2019 в 09:12

Рад, что интересно.

Ответить

Это не парсинг, а ручной сбор получается.

Ответить

Константин Гайдук
28.01.2019 в 10:56

Да, это не парсинг, подготовка к нему.

Ответить

хотя очень подробно расписано и мне понравилось

Ответить

Константин Гайдук
28.01.2019 в 10:56

Спасибо.

Ответить

Сергей
29.01.2019 в 10:01

Отличная инструкция. Обычно именно из за неправильной подготовки парсинг получается не полным

Ответить

Константин Гайдук
29.01.2019 в 10:02

Так и есть, спасибо.

Ответить

Комментировать