Контент-анализ - определение наиболее релевантных запросу страниц

Сегодняшняя статья содержит важный материал для тех, кто продвигает свой проект по большому количеству запросов, от 50 и больше.

Мы знаем, что ссылки в результатах поиска сортируются по релевантности, которая определяется как "соответствие документа тексту запроса". Поисковые системы даже дают советы веб-мастерам, как сделать сайт, который должен легко находиться пользователями. Вот ссылки на официальные документы большой четверки Рунета:
Яндекс - http://www.yandex.ru/info/webmaster3.html
Рамблер - http://www.rambler.ru/doc/recommendations.shtml
Google - http://www.google.ru/intl/ru/webmasters/
Апорт - http://www.aport.ru/webmast.php
Но в этих текстах даны лишь общие принципы, тогда как продвижение сайта - это набор конкретных практических методов.
Представим себе реальную задачу. Есть сайт с большим количеством страниц и есть большое количество запросов, по которым его нужно продвинуть. Простой вопрос: какую страницу сайта Яндекс (Рамблер, Google) считает наиболее релевантной одному отдельно взятому запросу списка?

Практический смысл ответа на этот вопрос состоит в следующем: если вы точно знаете, какую страницу сайта поисковик считает наиболее релевантной запросу, именно ее стоит продвигать в поиске по данному запросу, т.е. производить текстовую коррекцию и ставить на нее ссылки с нужным текстом.

Как "технически" определить наиболее релевантную страницу?

Поисковые системы индексируют все страницы сайта, но в результатах поиска выдают, как правило, ссылку только на одну - наиболее релевантную запросу. Это необходимо - есть сайты, в которых одному поисковому запросу могут соответствовать сотни страниц, и для поисковика показать такой "блок" из ссылок на один и тот же сайт в результатах поиска по всей Сети, значит, лишиться многих пользователей, они будут просто возмущены подобными результатами.

Но Яндекс, Рамблер и Google дают возможность поиска и в пределах одного сайта, показывая все страницы, релевантные заданному вопросу. Это стандартная опция крупных поисковиков, на базе которой несложно организовать у себя на сайте "собственную" поисковую систему. Алгоритмы ранжирования результатов поиска в пределах одного сайта и поиска в Большом интернете - одинаковы: наверху наиболее релевантная страница, ниже - чуть менее релевантная и так далее.

Проверить это несложно. Возьмем запрос, например, "деревянные двери". Смотрим.
Яндекс, 6 позиция, ссылка на страницу www.dnw.ru/wood_doors.html.
Поиском по сайту dnw.ru по запросу "деревянные двери" найдено 13176 релевантных страниц и первой в этом списке стоит ссылка на ту же самую страницу - www.dnw.ru/wood_doors.html.
Рамблер, 1 позиция, ссылка на страницу www.dip-plast.ru/links/.
Поиском по сайту dip-plast.ru по запросу "деревянные двери" найдено 6 релевантных страниц и первой в этом списке, конечно же, ссылка на www.dip-plast.ru/links/
Google, 9 позиция, ссылка на страницу
www.newporte.ru/hc/bosca/exit.html.
Поиском по сайту newporte.ru по запросу "деревянные двери" найдено 120 релевантных страниц и первой в этом списке снова стоит ссылка на ту же самую страницу - www.newporte.ru/hc/bosca/exit.html.
Можете попрактиковаться на любых других запросах, результат всегда один - верхняя ссылка, найденная поиском по сайту находится на максимальной позиции для данного сайта и в результатах поиска по всей базе поисковой системы. Это и есть наиболее релевантная запросу страница сайта, по мнению данной поисковой системы. Алгоритмы ранжирования для Большого поиска и для Поиска по сайту - одинаковы.

Прямое следствие: если вы даже поиском по сайту не нашли ни одной релевантной запросу страницы - нет смысла "лопатить" десятки страниц поисковой выдачи с целью определить позицию сайта по данному запросу - ее там просто нет. На практике я десятки раз видел, как веб-мастер составляет список запросов для продвижения, а контент-анализ показывает, что, минимум, для половины запросов списка на сайте нет материалов.