Сделал семантическое ядро (далее СЯ), для личного коммерческого проекта под лидген. В рамках марафона ЕБШ от Сеоники. Решил кратко и тезисно описать как я это делаю.
Зачем собирать и кластеризовывать СЯ
- Чтобы понимать какие ключи мы в принципе будем продвигать;
- Оценка коммерческого спроса в нише;
- Оценка интересов/интентов/болей аудитории;
- Проектирование структуры сайта;
- Распределение кластеров ключей по посадочным страницам;
- Подготовка файла в ТопВизор для отслеживания позиций.
Этапы работы
Сбор конкурентов
- Консультируемся с клиентом, какие услуги у нас есть в наличии;
- Вбиваем основной ВЧ ключ в Яндекс. Копируем 1-2 прямых конкурентов из топ10;
- В сервисе Мутаген.Мегаинструмент собираем 50-100 конкурентов для доменов из предыдущего шага. Сортируем их по трафику и объёму семантики;
- Глазами просматриваем всех конкурентов, оставляем те, где ассортимент и структура соответствует нашему будущему сайту.
Тариф мутагена 675 рублей в месяц, времени на данный этап 1-2 часа.

Сбор всей семантики
- В мутагене по всем подходящим конкурентам скачиваем семантику;
- Дополнительно по ВЧ ключам скачиваем хвосты.
На этом этапе получаем максимально полное, но при этом частично мусорное СЯ. В моём случае было ~50 000 ключей.
По времени если не заморачиваться и не отвлекаться на VC или Пикабу, займет 30-40 минут.

Чистка семантики
- Удаляем дубликаты ключей в бесплатном сервисе https://konstantinbulgakov.com/tools/duplicate ;
- Поскольку в нише септиков сильная сезонность, то идем в сервис https://word-keeper.ru/ и снимаем годовую частотность;
- Удаляем ключи с точной годовой частотностью менее 30;
- Там же в Word Keeper через валидацию подсказочником удаляем «плохие» ключи, которые вбивают боты и сервисы;
- Определяем наиболее частотные словоформы ключей, (пригодится при составлении тайтлов).
Тариф Комфорт 990 рублей, лимитов хватило на чистку 50 000 ключей. Личное время 1 час +1 час ожидания, пока сервис пробъёт все данные.
Вообще в сервисе много разного есть для работы с семантикой, но я не всё использовал. Так как или не нужно, или некоторые инструменты у конкурентов лучше.

Кластеризация СЯ
Существует куча сервисов для кластеризации, но мне больше всего нравится сервис Оверлид https://overlead.me/clusterization/.
Плюсы:
- Кластеризация идет на основе выдачи Яндекса;
- Вроде кластеризует с помощью нейронки;
- Данные по частотности кластера;
- Данные конкуренции, геозависимости, коммерческости;
- Удобные результаты кластеризации для дальнейшей работы.
Минусы:
- Очень дорого, для 7 000 ключей цена лимитов 1300 рублей (именно поэтому на ранних стадиях сильно чистил);
- Длительное время ожидания, 6-7 часов пока сервис сделает ядро;
- Кластеризация на 4+ , но потом надо все равно просматривать глазами, так как попадаются сомнительные кластеры и ключи.
Данный этап 30м времени и 1300р на сервис.

Распределение кластеров по MindMap карте
Далее просматриваю каждый кластер, и добавляю один из ключей в миндмап и номер кластера. В результате получается почти готовая структура сайта.
Тут приходится работать много головой. Держать в голове интенты юзеров, и потенциальную структуру сайта для будущего SEO продвижения и многое другое.
Поскольку я не эксперт в нише, то в дальнейшем. Миндмап придется дорабатывать.
Немного рутинный и время затратный этап, я сильно не упарывался поэтому уложился в 3 часа нон стоп.

Проектирование структуры URL
Финальный штрих — проектирование SILO структуры URL (Которую так любит Гугл).
Плюс тезисное описание структуры каждого типа страниц.
Если по максимуму упороться, то можно сразу прописать URL для всех будущих страниц, и прописать метатеги.
Проектирование URL очень полезно, если в дальнейшем потребуется ставить адекватные ТЗ на программистов, дизайнеров и контент менеджеров..
И в целом понимать структуру своего сайта.
Я не упарывался поэтому уложился в 1,5 часа.

Итог
Итого на выходе я получил полноценное СЯ на 4+ подготовленное к практическому применению для создания и продвижения сайта.
Расходы на сервисы ~3000р , Личного чистого времени 8 часов.
P.S. Что-то кратко не получилось 🙁
