0
На рассмотрении

Разбор результата кластеризации

george 9 лет назад обновлен 9 лет назад 14
Ребятки, вы бы описали как-то процесс того, как все это вы собираете и обрабатываете. По крайней мере, я ничего не нашел, кроме "ура-ура" и кейса в 190 000% роста. Тут: http://www.rush-analytics.ru/pricing написано "Подробная документация". Где? Видимо, некогда или теперь описывать функционал вообще не принято.

Я использую прекрасный во всех смыслах показательный ключ, проект "Аудит Россия (225) - слова из Wordstat
20.03.2015 23:57".

Что видим в результате выполнения проекта:
1.
Кластеризовано 716
Некластеризовано 1286
2. Берем первый попавшийся кластер с самыми ненужными в моем случае информационными запросами. В кластер "цель аудита" попали
цель аудита 6508
задачи аудита 5772
цели +и задачи аудита 1676
основные задачи аудита 591 (а это как относится к "цели"?)
главная цель аудита 99


и не попали
основная цель аудита 1023
целью аудита является 569
цель проведения аудита 555
цель аудита бухгалтерской отчетности 374
цель внешнего аудита 198
цель планирования аудита 181
основной целью аудита является 131
цель международных стандартов аудита 112
цель аудита основных средств 107
цель кадрового аудита 96
цель обязательного аудита 93
цель аудита денежных средств 89
цель аудита налогообложения 73


Пошто обидели столько слов? И от этого ваши кластеры по 2-5 ключей (в настройках было 5 или 6, я теперь смутно предполагаю, что это число относится к ограничению размера полученного кластера).
3. Top URL кластера http://cribs.me/audit/tseli-i-zadachi-audita_.
Проверим в Яндексе. Персональный поиск: учитывать мою историю поиска — откл.
Ан это не топ-сайт, а поз. 3. В топе consultant.ru.

Дальше не стал копаться. Стало неинтересно.
А вот что интересно: за вот это вы попросили виртуальных денег:
21.03.2015 00:05 Аудит Россия (225) - слова из Wordstat (Кластеризация ключевых слов) -536.25 руб.
21.03.2015 00:02 Аудит Россия (225) - слова из Wordstat (сбор SERP для кластеризации) -50 руб.
Вы правда считаете, что за вот этот результат вам будут готовы заплатить? Реальных денег, а не тех, которые вы предлагаете в качестве бонуса на входе? Будет ли доверие к таким результатам?

Лично я бы посадил несколько здравомыслящих живых людей, которые бы сделали такую работу более эффективно и менее затратно. И более предсказуемо.

Объясните мне, непонятливому, как использовать этот результат мне? Реально использовать, а не пялиться в полученный файл и искать недочеты?
Из вашего предыдущего ответа @Надежда Хребтова стало понятно, что чем вы называете. Описали бы вы это где-нибудь. Но вопрос как использовать результат для контекста, никуда не делся. Или все же никак?
На рассмотрении
Георгий, Ваш топик принят в обработку. Скоро Вы получите детальный ответ по всем вопросам.
Георгий, точности 5 или 6 определяет, сколько ОБЩИХ URL в ТОПе по двум запросам должно быть, чтобы они попали в один кластер. Для вашей тематики лучше всего поставить точность 3-4 - такие настройки дадут намного больше кластеров и меньше ключевых слов останутся не сгруппированными.

По поводу описания - это титаническая работа, которую мы уже 4ю неделю делаем всей командой - важно описать функционал так, чтобы это было понятно новичкам и так, чтобы это было полезно профессионалам.
Уже скоро мы пришлем ссылку на новый FAQ.

Олег Шестаков, CTO Rush Analytics
Охотно верю, что хороший FAQ — титаническая работа. Желаю удачи в работе над ним)
Применительно к контексту я вижу такое использование: по поводу "точности 5 или 6" — мне представляется, что для целей сбора ядра ключей и расфасовки их по смысловым группам (чтобы не путать с вашим понятием "кластер") мне нужно указать частотность вообще 0 (если бы она была доступна, но у вас такие ключи отправляются на лист "Некластеризованные").
Тогда любой ключ из моего примера, содержащий оба слова "цель"," аудит" (существительные в разных падежах, любые позиции в ключе, количество каждого вхождения =>1) попал бы в условную группу "цель аудит". Если бы было вот так, я представляю, как это использовать.

цель аудита
задачи аудита
цели +и задачи аудита
основные задачи аудита
главная цель аудита
основная цель аудита
целью аудита является
цель проведения аудита

цель кадрового аудита
цель обязательного аудита
цель аудита денежных средств
цель аудита налогообложения
То есть в предельном случае с частотностью 0 происходит сборка в группы. И эта функциональность НЕ реализована в сборе ключевых слов Wordstat, там нет группировки, там, сортировка.

Получается, что ни с помощью Wordstat, ни с помощью кластеризации, добиться распределения ключей по группам просто по вхождению самого высокочастотного запроса (в примере это "цель аудита") нельзя.
Георгрий, верно - с лингвистикой мы не работаем  - мы автоматом собираем группы по ТОПам.

Из вашего примера:

цель аудита
задачи аудита
цели +и задачи аудита
основные задачи аудита
главная цель аудита
основная цель аудита
целью аудита является
цель проведения аудита
//Этот кластер имеет практический смысл

цель кадрового аудита
цель обязательного аудита
цель аудита денежных средств
цель аудита налогообложения
//А этот кластер не имеет практического смысла - такие запросы должны что в SEO, что в контексте продвигаться на разные страницы (страница кадрового аудита, страница обязательного аудита, страница денежного аудита, страница аудита наолообложения), разве нет?
Я не зря использую везде ключ "аудит": он очень скользкий во всех смыслах. "Цель аудита" не особенно показательный ключ, там все НЧ-ключи, включающие "цель аудита" — информационные. Соответственно в коммерческой тематике практически малоценны что в seo, что в контексте.

И как раз на мой взгляд та часть, что вы подчеркнули как "имеет практический смысл" — не имеет или в меньшей степени. В этом отношении "цель обязательного аудита", "цель аудита налогообложения" имеют больший практический смысл, так как вызывают приток целевых с точки зрения этого бизнеса.

Если посмотреть закладку "Лидеры тематики" в результатах кластеризации (прекрасный подарок от вас, кстати), то в пятерку войдут трафикогенераторы с рефератами: allbest.ru; bestreferat.ru; xreferat.ru и пр. Они, вероятно, никогда не сгенерируют лид в такой тематике. Толпы зевак, загрузку телефонных линий — легко.

Думаю, вы согласитесь, что валидную информацию для принятия решения "практический смысл или нет" дадут либо счетчики на ресурсах клиента по CTR/CR. ПС со своей стороны смотрит и на счетчики, и в том числе на CTR результатов поиска и пр. (с недавних пор Яндекс даже стал давать некий взвешенный показатель "Продуктивность"). Это позволяет с полюсов процесса (клиент; ПС или рекламная система) оценивать практический смысл.

Но сторонний сервис без подключения к клиентской статистике — вряд ли. Я еще не встречал ни лингвистические модули, ни тем более интеллектуальные, решающие такие задачи. Соответственно, легче, проще собрать ключи стройными рядами как заготовку для боле быстрой, удобной и осмысленной работы человека.
Вот это я и пытаюсь вам сказать: трудно автоматизировать такие оценочные вещи. Есть первичная, базовая информация, к таковой я бы отнес полные списки ключевиков, сгруппированные определенным образом без отсева. Ваш Wordstat в текущем виде представляется мне малоценным и не превосходящим существующий инструментарий.

Если говорить о кластеризации, то вы пытаетесь предложить сразу второй этап без должных обоснований метода (предполагаю, что у вас на данном этапе нет строгих обоснований, или вы считаете, что они и не нужны). Неважно, для seo или нет. Когда я подключился к сервису, я почему-то ожидал для начала именно хорошо подготовленные списки ключевиков. "Хорошо" тут для каждого понятие свое, я это помню, и я естественно хотел посмотреть, как и что предложите вы в качестве решения))
Вы очень наглядно расписали в другой ветке, что вы делаете в процессе кластеризации. Но у меня еще больше вопросов. Так что я пока почитаю еще раз ваше сообщение)

Сервис поддержки клиентов работает на платформе UserEcho