Семантический анализ текста
Семантический анализ текста
Что такое семантический анализ текста?
Каждый сайт занимает какое-то определенное место в Интернете. От того, насколько близок сайт к началу списка в поисковой выдаче основных поисковых систем, зависит посещаемость сайта, а значит, количество подписчиков и в конечном итоге, заработок на сайте. Мы уже знаем, что основной трафик (до 90%) приходит из поисковых систем, значит, главной задачей веб мастера является продвижение своего сайта, как можно ближе к началу названного списка. Считаю, что главным и основным методом продвижения и повышения посещаемости является качественный оригинальный и полезный людям контент http://fobos12.ru/?p=1636. В то же время, поскольку продвижение зависит от индексации в поисковых системах, может сложиться так, что самый полезный людям контент не будет индексироваться или индексироваться с большим замедлением, если текст не будет отвечать определенным правилам и особенностям поисковых систем. Другими словами, существует определенный список показателей с допустимыми нормами. Определение таких показателей, сопоставление их с допустимыми и является задачей и сутью семантического анализа. Удачным можно считать текст, не только интересный по содержанию, но и показатели которого не превышают допустимого предела.
Основные показатели:
«Вода» — часть текста, в которой суть вопроса и смысловая нагрузка отражены минимально или вообще не отражены. Показателем является процентное отношение незначимых слов к их общему количеству. Считается, что «воды» в тексте должно быть не более 40%. В то же время текст совсем без «воды» будет сухим и неживым. В стилистически грамотно написанном тексте «воды» может быть и 60%.
«Стоп-слова» — к ним можно отнести предлоги, союзы, слова-связки. Поисковыми роботами они не распознаются и не воспринимаются. Показателем является количество и процентное соотношение стоп-слов. В статье их не должно быть более 5%.
«Тошнота» — считается основным показателем. Это не что иное, как тавтология, или оценка степени «заспамленности» текста самым частым словом, т.е. наиболее часто встречающимся. Обычно – это ключевое слово. Поисковый робот может зациклиться на нем и остальные ключевые слова не воспринимать. Различают классическую тошноту и академическую тошноту. Классическая тошнота характеризуется коэффициентом заспамленности самым повторяющимся словом, и определяется, квадратным корнем из количества повторений самого тошнотного слова. Оптимальное значение указанного показателя равно 7, максимальное – 10. Показатель академической тошноты растет при увеличении количества различных повторяющихся слов.
Семантический анализ ключевых слов — основа оптимизации, необходимой для продвижения сайтов при помощи статей. Позволяет определить более популярные запросы, является основой привлечения целевой аудитории.
Семантическое ядро — список ключевых слов и фраз, по которым продвигается проект и используется пользователем для поиска нужной информации. Оптимизируя текст под определенное количество ключевых слов, мы можем получить большее число посетителей по запросам в поисковиках.
Уникальные слова – слова, встречающиеся в тексте хотя бы один раз без учета повтора.
Значимые слова – слова, определяющие значимость текста (только существительные), обычно, редко встречающиеся в интернете.
Количество символов - общее количество символов в тексте с пробелами.
Количество символов без пробелов - количество символов без пробелов.
Количество слов — количество слов в тексте с предлогами.
Для семантического анализа текста существует много программ и онлайн-сервисов, используемых в SEO, которые помогают математическими методами определять качество текста. Рассмотрим основные из них.
Аdvego.ru – известнейшая биржа статей, имеющая большое количество своих сторонников. Доступ к инструментам биржи возможен только зарегистрированным пользователям http://fobos12.ru/?p=1214. Для семантического анализа на вкладке «Инструменты» выбираем окно «Семантический анализ текста», выбираем язык и вводим анализируемый текст в поле 1 (рисунки 1, 2).
Нажимаем кнопку «Проверить». В результате анализа получаем показатели текста, выведенные в таблицы (рисунки 2.1 – 2.4).
stxt.ru – онлайн сервис для проверки тематичности. Доступ представляется любому пользователю без ограничения. Для проверки текст вводим в поле 2 (рисунок 3) и нажимаем кнопку «Проверить тематичность».
Результаты проверки получаем в виде показателей:
Распознана тематика (5 наиболее соответствующих тексту)
Индекс тематичности: 10,77*. Прогноз посещаемости из поисковых систем по низкочастотным запросам: 29 в месяц.
Распознанные ключи
Анализируемый текст (8 089 знаков без пробелов)
Неполные ключи (выделены слова, не найденные в тексте)
Примечания:
* 0 — Программе не удалось распознать тематики, возможно, текст слишком короток;
0-0.1 — Вероятно, тема текста не известна программе, или текст очень короток;
0.1-1 — Неплохо для комментария (ответа в форуме);
1-7 — Удовлетворительное качество текста, пригодно для внутренних страниц сайта;
7 и выше — Отлично, но на всякий случай проверьте текст на тошноту.
pr-cy.ru – сервис может проводить полный анализ контента на всем сайте и отдельной странице. Для анализа необходимо во вкладке «Инструменты для веб мастера» нажать кнопку «Анализ контента» (рисунок 4.1). В поле 3 (рисунок 4.2) вводим URLстраницы или домен всего сайта и нажимаем кнопку «Анализировать».
Результаты анализа выводятся на отдельной странице (рисунок 4.3). Определяются такие показатели, как вес страницы, релевантность заголовка, процент релевантности ключевых слов ко всему тексту на странице и др. В выводимой таблице показываются все слова текста с выделением наиболее частотных.
Чтобы посмотреть основные характеристики всего сайта (тИЦ, PR и многое другое), нужно провести его комплексный анализ. Для этого вводим домен в поле 4 (рисунок 4.1) и также нажимаем кнопку «Анализировать».
seoexp.com/ru/seo_tools/optimizer/ - ресурс предлагает несколько полезных онлайн сервисов, список которых открывается при наведении курсора на закладку «On-line сервисы» (рисунки 5.1, 5.2).
При нажатии на кнопку «On-line сервисы» (рисунок 5.1) открывается вкладка «Сервисы» (рисунок 5.3) с краткими описаниями функционала каждого из них.
При нажатии на кнопку «Подробнее» открывается сам функционал выбранного сервиса, например, «Сервис анализа страниц» с определением плотности ключевых слов (рисунки 5.4) и «Оптимизатор текста» для определения плотности ключевых слов и фраз в тексте (рисунок 5.5).
Для работы в сервисе «Сервис анализа страниц» вводим URL страницы в поле 5 (рисунок 5.4), выбираем кодировку страницы (обычно это UTF-8) и нажимаем кнопку «Анализ». Для анализа в сервисе «Оптимизатор текста» вводим текст в поле 6 (рисунок 5.5) и нажимаем кнопку «Анализ». Результаты анализа выводятся в таблице (рисунок 5.6).
В заключение посмотрите видео урок Дмитрия Исаенко о работе по проверке на уникальность и определению семантического ядра текста в программе Advego plagiatus:

Никогда не задумывалась о том, что спамность текста может быть разной, пока не прочитала это в одной статье. Там же узнала много интересного о том, как ее проверить и какие есть способы снизить переспам (Кому интересно, вот та статья: https://ifish2.ru/spamnost-teksta/)
Добрый день,
Хочу внести «поправку из жизни»
У меня много топовых статей… я их никогда не проверяла нигде… просто писала и выгружала…
И вот мне стало интересно после вашей статьи — узнать их процент тошноты и воды…
Так вот любопытно что… статьи из топа Яндекса и гугла имеют
11-12% тошноты (когда норма 7%)
75 % воды (когда норма 40 и максимум 60)
Отсюда могу вывести мораль, что… все-таки на ранжирование Яндекса и Гугла больше влияет не семантика, а ПОВЕДЕНЧЕСКИЙ ФАКТОР (поведение читателя на странице). То есть важнее, как долго читатель был на странице и на сайте… на не то, какая семантика текста по тошноте, воде и др…
Леонид, Спасибо за очень нужную информацию, изложенную в полном соответствии, тому, чему учите нас, наглядность, полезнейшая вещь.
Инструменты для проверки уникальных слов в наших не всегда уникальных, зачастую водяных, попросту сырых статьях — непонятных роботу и не интересных посетителю,
помогут решению статью выкинуть и написать новую.
Леонид? я не спам ли написала? Это пародия на собственные мои статьи. Но учась — научаюсь.
И ещё спасибо, что форма для комментариев готова к заполнению, это очень удобно.
Век живи, и век учись!!! Очень полезная информация для моего молоденького сайта. Леонид,Спасибо ВАМ!!!
Спасибо, Леонид. Адвего пользуюсь давно, а вот остальные сервисы обязательно попробую. Творческих вам успехов))
Большое спасибо за информацию, полную и полезную. Нашла для себя кое-что новенькое. Может быть подскажете где можно проверять пунктуацию? Становлюсь Вашим подписчиком ))
Спасибо за полезный контент , буду заходить по чаще.
Леонид, спасибо за информацию, очень мало знаем, статья дает дополнительные знания по использованию различных программ, которые мы используем на 1-2%. Буду к вам заходить.
За сервисы,Леонид, отдельное спасибо. Побольше бы статей по интерпретации данных сервисов.
Это относится ко всем. А то сервис назван. Приходишь туда,торкаешься — … и как эти данные переводить на язык использования не понимаешь.
P.S. Почему- то не нашел «Подписаться на комментарии».
Леонид!
К СЧАСТЬЮ, в статье намного больше, чем обещал заголовок. Хотя, с точки зрения копирайтинга он мало, что обещал.
Самое смешное: почти все сервисы знакомые,использованы только частично.
Спасибо.
Спасибо за отличный список инструментария по анализу текста, очень полезно. Большинство просмотренных ранее обзоров ограничиваются Адвего плагиатусом.