Семантическое ядро, часть 1. Методика подготовки фраз для парсинга семантического ядра

Семантическое ядро, часть 1. Методика подготовки фраз для парсинга семантического ядра

Опубликовано: 27.01.2019. Обновлено: 09.04.2022 1 946 8

Ключевые фразы — залог успеха компании. Чем больше тематических удаётся собрать, тем больше шансов, что в семантическое ядро попадут редкие сочетания, мало или совсем не используемые другими рекламодателями. Что означает более низкую конкуренцию.

Речь в материале пойдёт о предварительном этапе сбора семантического ядра — подготовке фраз для парсинга. Этап этот не менее важен, чем последующие два:

Семантическое ядро, часть 2. Парсинг и чистка ключевых фраз

Семантическое ядро, часть 3. Группировка, распределение и оценка вероятности успеха

Содержание статьи:

  1. 1. Собираем названия товаров и услуг, включая синонимы.
  2. 2. Готовим "коммерческую" часть фраз при необходимости.
  3. 3. "Перемножение" составляющих фраз.
  4. 4. Особые случаи.
  5. 5. Поиск новых услуг.

Инструкция написана на примере сбора ключевых фраз, используемых пользователями при поиске помощи при панических атаках (для рекламы сайта психолога).

1. Собираем названия товаров и услуг, включая синонимы

Блок под результатами поиска

Забиваем в поиск Яндекса название "панические атаки". Внизу в блоке "Вместе с «…» ищут" можно увидеть название самого заболевания, которое вызывает панические атаки:
блок Яндекса вместе с ключевой фразой ищут
Фраза "паническое расстройство" относится к тому же заболеванию и подходит.

Собираем синонимы

В словаре синонимов: https://text.ru/synonym/ по очереди проверяем слова, образующие название заболевания:

синонимы слова панический

Видно, что подходящего синонима нет, и, если заменить слово "панический", то изменится и смысл запроса. Поэтому слово "панический" обязательно должно присутствовать (в какой либо форме) и заменить его нечем.

синонимы слова атака

Слово "Приступ", которое словарь выдал в качестве синонима слова "атака", также широко используется в медицине и хорошо сочетается со словом "панический". Таким образом, на этом этапе получили новую ключевую фразу, обозначающую название заболевания, — "панический приступ". Если забить фразу в поисковике, можно увидеть, что выдаются сайты также о панических атаках, что подтверждает правильность хода мыслей:

результаты поиска панический приступ

Аналогичным образом проверили синонимы слова "расстройство" и получили список фраз на этом этапе:

  • панические атаки,
  • паническое расстройство,
  • панический приступ,
  • панические нарушения.

Работа с формами слов

Теперь нужно попробовать поменять формы слов: существительные преобразовать в прилагательные, а прилагательные — в существительные.

На более простом примере: "телефон для женщин" в контексте поиска товаров будет синонимом фразы "женский телефон".

"Атакических" или "приступных" паник не бывает, но играясь с формами можно заметить ещё одну фразу "приступы паники". В этой фразе прилагательное "панический" стало существительным "паника". По смыслу эта фраза подходит, итого, в результате изысканий получили 5 названий одного и того же заболевания (вернее, название заболевания здесь одно — "паническое расстройство", но сути не меняет — на людей, ищущих решения этой проблемы, нацелена реклама) :

  • панические атаки,
  • паническое расстройство,
  • панический приступ,
  • приступы паники,
  • панические нарушения.

Проверяем производные фраз

Полученные фразы нужно проверить в Яндекс.Вордстате на содержание нерелевантных производных фраз.

Например, здесь видно:
вордстат панические атаки

что большая часть производных фраз являются нерелевантными (при условии, что нацеливаемся на аудиторию, собирающуюся совершить покупку. Если бы нас интересовала любая аудитория, интересующаяся паническими атаками, данная фраза подходила бы). Если оставить слово в таком виде, не уточнив его, при последующем парсинге будет получено значительное количество производных нерелевантных фраз, от которых потом придётся долго чиститься. Чтобы этого избежать, к исходным фразам в данном случае нужно добавить уточняющую часть, придающую нужный "коммерческий" интент.  

2. Готовим "коммерческую" часть фраз при необходимости

В зависимости от задач рекламы, работа, как может быть закончена на предыдущем этапе, так и продолжится. 

Например, если нужно собрать информационные запросы (какой экскаватор лучше для разработки котлованов, как правильно одевать подгузник и т.д.), к фразам следует добавить соответствующие слова: как, чей, сколько, откуда, куда, зачем, почему, когда, где, который, какой, что, кто.

В соответствии с выбранным примером привожу методику и ход мыслей при сборе коммерческих "хвостов", в которых пользователь выражает намерение совершить покупку.

Сбор коммерческих окончаний фраз

Забиваем самое популярное название заболевания в Яндекс.Вордстат https://wordstat.yandex.ru/

(Узнать самое популярное название можно, забив по очереди все названия в тот же инструмент:

вордстат панические атаки

Цифра напротив будет означать количество запросов пользователей с этой фразой. Чем больше цифра, тем больше популярность.)

Например, фраза "панические атаки симптомы" имеет слабо выраженный коммерческий интент, т.к. пользователь только интересуется симптомами и непонятно, когда соберётся обратится к специалисту.

В результатах можно выбрать при первичном осмотре следующие слова:

  • "лечение" — из фразы "панические атаки лечение". Это также сомнительное с точки зрения интента слово. Может быть праздное любопытство человека, решившего узнать, как лечатся атаки.
  • "лечение в Москве" — из фразы "лечение панических атак в москве" (здесь пользователи забивают название города, а, значит, с высокой вероятностью ищут возможные места, где собираются получить психологическую помощь). Хорошая фраза с выраженным коммерческим интентом. В данном случае выписываем более узкую фразу "лечение в Москве" только потому, что приняли решение отказаться от более широкой "лечение". Если бы взяли слово "лечение", то выписывать фразы "лечение +какое-то слово" не имело бы смысла, т.к. они итак были бы собраны при последующем парсинге.
  • "лечение цена" — из фразы "лечение панической атаки цена". Аналогично предыдущей фразе.
  • "врач" — из фразы "панические атаки врач". Пользователь с высокой вероятностью подбирает себе врача, и, значит, в этой фразе сильный коммерческий интент.

Другие слова из фраз с сильным коммерческим интентом: 

  • "клиника" — из фразы "клиника панических атак".
  • "избавление" — из фразы "избавление от панических атак".
  • "помощь" — из фразы "помощь при панических атаках".
  • "терапия" — из фразы " терапия панических атак".
  • "психотерапевт" — входит в состав фраз "панические атаки психотерапевт Москва",

Итого:

  • лечение в москве
  • врач
  • клиника
  • избавление
  • помощь
  • терапия
  • психотерапевт
  • специалист
  • психиатр
  • психолог
  • снятие
  • тренинг
  • куда обратиться

Прорабатываем формы "коммерческой" части фраз

Для каждого полученного слова нужно проработать форму. Например из фразы "лечение панических атак в Москве" получится:

  • лечить панические атаки в москве
  • вылечить панические атаки в москве

При этом нужно следить, чтобы не исказился общий смысл фразы и отражаемый ею коммерческий интент.

Итого получаем:

  • лечение в москве
  • вылечить в москве
  • врач
  • клиника
  • избавление
  • избавить
  • избавиться
  • помощь
  • терапия
  • психотерапевт
  • специалист
  • психиатр
  • психолог
  • снятие
  • снять
  • тренинг
  • куда обратиться

Здесь просто приведу для примера типовые "коммерческие" окончания фраз при покупке товаров или услуг:

  • дешево
  • дёшево
  • дёшево москва
  • доставка
  • заказ
  • заказать
  • интернет магазин
  • интернет-магазин
  • купить
  • купить в интернет-магазине
  • купить в москве
  • купить дёшево
  • купить дёшево в москве
  • купить недорого
  • купить недорого в москве
  • купить с доставкой
  • москва
  • недорого
  • онлайн магазин
  • прайс
  • продажа
  • расценки
  • сколько стоит
  • со скидкой
  • стоимость
  • стоимость москва
  • цена
  • цена москва

3. "Перемножение" составляющих фраз

Если при сборе получили информационную часть фраз (названия товаров или услуг):

А, Б, В

 и коммерческую часть:

Г, Д, Е,

то перед дальнейшим парсингом их необходимо "перемножить", чтобы получить максимальное количество возможных вариантов. Получится:

АГ, АД, АЕ, БГ, БД, БЕ, ВГ, ВД, ВЕ.

Сделать это можно, например, при помощи этого бесплатного инструмента.

перемножение ключевых фраз

Полученный список фраз можно запускать в дальнейший парсинг.

4. Особые случаи

Коммерческие фразы без явного "коммерческого" фрагмента

Если цель сбора — только коммерческие фразы, нужно иметь ввиду, что в некоторых случаях фраза или слово является достаточно коммерческой без добавления к ней слов, выражающих намерение купить.

Убедиться в необходимости использования такой фразы в чистом виде без добавления коммерческого "хвоста" можно, забив её в поиск в нужном регионе. В результатах выдачи в таких случаях доминируют страницы с предложением товаров или услуг (а не информационные ресурсы).

Примеры:

Однородные и неоднородные нецелевые фразы

Если проверка производных фраз на первом этапе показала, что нерелевантных фраз много (например, более половины на первой странице), и они неоднородны в плане интента (как в примере выше — одни хотят почитать про симптомы, другие — про причины, третьи — про отзывы и др.), то оптимальный вариант уточнения исходных фраз — добавление слов с коммерческим интентом, как и было описано в методике.

Но иногда удалить сразу много нецелевых фраз можно, зафиксировав форму слова, без добавления уточняющего "хвоста". В следующем примере видно, что нерелевантные фразы однородны:

 wordstat-otdelka

Целевая аудитория ищет отделку купленной ранее квартиры, нецелевая — покупку готовой с выполненной отделкой. Можно заметить, что те, кто хотят купить квартиру используют слово "отделка" в дательном падеже и часто добавляют слово "купить". Соответственно, чтобы быстро избавиться от этих фраз, необходимо добавить минус слова:

 вордстат отделка квартир

зафиксировав восклицательными знаками форму слова. Подробнее про операторы https://yandex.ru/support/direct/keywords/symbols-and-operators.html

Видно, что в результате простой операции сразу очистились от большого числа нерелевантных фраз. Правда, при последующем сборе нужно не забыть использовать эту фразу с минус-словами.

Методика подготовки фраз таким образом довольно трудоёмка. Если нужно более быстрое понимание основных ключевых слов на странице, можно воспользоваться инструкцией

5. Поиск новых услуг

В предыдущих частях статьи речь шла о подборе ключевых фраз к уже известной услуге, представленной на сайте. Довольно часто сем. ядро можно расширить за счёт добавления новых услуг, оказываемых теми же средствами и с той же квалификацией, что и уже существующие услуги. Если клиент владеет только парком самосвалов, то нет смысла предлагать погрузочно-разгрузочные работы, для которых необходимые погрузчики. 

Например на сайте представлена услуга "Гравировка на пластике". Это значит, скорее всего, что клиент может оказывать также услуги гравировки флешек, клавиатур, телефонов, пуговицах и т.д. Под которые можно создать новые посадочные страницы на сайте и получать больше трафика. 

Как искать новые услуги:

  1. 1. Читаем текст на сайте в уже существующих разделах. Довольно часто там можно увидеть упоминания других услуг. Которые входят в состав уже представленных услуг либо являются смежными. 
  2. 2. Анализируем сами услуги. Например, услуга "аренда ямобура". Ищем в сети, зачем нужен ямобур, находим, например, что для "бурения лунок". 
  3. 3. Если есть семантическое ядро, в сервисе снимаем позиции и выгружаем топ 10 конкурентов в Яндексе и топ 10 конкурентов в Гугле. Открываем сайты и сравниваем аналогичные разделы сайтов конкурентов с сайтом клиента. Выписываем отсутствующие на сайте нашего клиента услуги. 
  4. 4. Если семантического ядра нет, можно просто забить запрос релевантный текущей услуге и посмотреть сайты топовых конкурентов. Смотреть лучше всего сайты в Московском регионе, там будет самая детализированная проработка услуг.  

Если новые услуги собирались первыми двумя способами, то необходимо убедиться в наличии коммерческих сайтов в результатах выдачи Яндекса. Нередко могут попадаться информационные запросы.

Далее проверяем наличие спроса на найденные услуги в Яндекс.Вордстате. После этого подбираем запросы, как описано в первых 4 разделах на этой странице.

спасибо, про синонимы интересно

Ответить

Константин Гайдук
28.01.2019 в 09:12

Рад, что интересно.

Ответить

Это не парсинг, а ручной сбор получается.

Ответить

Константин Гайдук
28.01.2019 в 10:56

Да, это не парсинг, подготовка к нему.

Ответить

хотя очень подробно расписано и мне понравилось

Ответить

Константин Гайдук
28.01.2019 в 10:56

Спасибо.

Ответить

Сергей
29.01.2019 в 10:01

Отличная инструкция. Обычно именно из за неправильной подготовки парсинг получается не полным

Ответить

Константин Гайдук
29.01.2019 в 10:02

Так и есть, спасибо.

Ответить

Комментировать