- PVSM.RU - https://www.pvsm.ru -

Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных

Все мы участвовали в опросах, онлайн или в реальной жизни. А когда начинаем новый проект, то без опросов не обойтись. Но иногда есть результаты опросов, с которыми непонятно что делать, кроме как улыбнуться [1], ниже, на картинке, результат опроса Всероссийского центра изучения общественного мнения (ВЦИОМ).
Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных - 1
Полюбопытствовал как сейчас используют вопросы с качественными оценками и обнаружил, что ВЦИОМ, ФОМ [2], Левада-Центр [3] используют, в основном, трехдиапазонную шкалу (плохо/норма/хорошо). В случаях более детальных вопросов, шкала увеличивается до 5-6 единиц [4], но редко.
Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных - 2
Тогда, на сегодняшний день, складывается ситуация, в которой социологи уходят от многоуровневой шкалы качественных оценок и стараются использовать трехуровневую. И если социология умеет из этого выворачиваться, то при анализе приличных объемов данных, необходимость использования качественных оценок становится усложняющим фактором и снижает надежность результатов. Так как разграничить, например, понятия: «прекрасная квартира» и «отличное жилье» практически невозможно, а с учетом ответа, одного из персонажей «Двенадцати стульев»: «Кому и кобыла невеста», многопересекаемость качеств выходит за разумные пределы.

Механизм градации есть и он хорошо используется банками при определении подлогов в финансовых документах. Это закон распределения Бенфорда [5], который, в 1984, доказал Ted Hill [6].
Теоретические выкладки предлагаемого инструмента представлены в этом материале: «Закон Бенфорда и распределения под него попадающие [7]».
В Википедии этот закон сформулирован так: если у нас основание системы счисления b (b > 2), то для цифры d (d ∈ {1, …, b − 1}) вероятность быть первой значащей цифрой составляет:
Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных - 3
На основании сказанного, получаем механизм градации качественных признаков, следующим образом.
Выбираем количество интервалов, ну допустим 5, то есть четыре градации и один серединный интервал. Значит b = 6, получаем вероятности для интервалов:
1-й интервал — 0,386853;
2-й интервал — 0,226294;
3-й интервал — 0,160558;
4-й интервал — 0,124539;
5-й интервал — 0,101756.

Из статистики частотности, слов оценивающих качественные признаки, составляем ряд по возрастанию и проставляем индекс. Проводим преобразование частотности к вероятности высказывания. Далее аккумулируем вероятности от хвоста, до тех пор, пока не получим значение равное крайнему ряду (5-му), в нашем случае – 0,101756 и слова (качественные определения), вероятности которых попадают в эту сумму, относим к 5 диапазону. Далее по убывающему индексу проводим дальнейшее суммирование, пока не подойдем значению вероятности 4-го диапазона и, далее, аналогично, к значению первого интервала.
В результате мы получаем четкие подмножества с реальной числовой оценкой.
Не буду обнадеживать, что подбор синонимов легкое дело. Так как каждый сам для себя определяет удобное ему соотношение результат/усилия.

Автор: Александр Еськов

Источник [8]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/matematika/323103

Ссылки в тексте:

[1] улыбнуться: https://infographics.wciom.ru/

[2] ФОМ: https://fom-gk.ru/?pk_vid=2da44f63741f339d1562449764a440a6

[3] Левада-Центр: https://www.levada.ru/nopisanie/o-tsentre/

[4] единиц: https://infographics.wciom.ru/theme-archive/politics/internal-policy/liberties/article/zherar-deparde-nash-novyi-sootechestvennik

[5] Бенфорда: https://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%91%D0%B5%D0%BD%D1%84%D0%BE%D1%80%D0%B4%D0%B0

[6] Ted Hill: https://en.wikipedia.org/wiki/Ted_Hill_(mathematician)

[7] Закон Бенфорда и распределения под него попадающие: https://habr.com/ru/post/240853/

[8] Источник: https://habr.com/ru/post/459052/?utm_source=habrahabr&utm_medium=rss&utm_campaign=459052