Четыре слова, которые нельзя (часть 2)

в 21:21, , рубрики: big data, data mining, лингвистика, Читальный зал

По просьбе хабрачан продолжим публикации об исследовании обсценной лексики. (Если кто не читал первую часть, то можете ознакомиться).
Начнем сразу с картинок.
Итак, картинка первая.
Четыре слова, которые нельзя (часть 2) - 1
Рис.1. Распределение обсценной лексики по источникам.

Тут можно не комментировать, из подписи к картинке все понятно.
Хотя нет. Нужно пояснить, откуда и что за данные:
За четверо суток (с 9 по 14 мая) было собрано около 710 тыс. русскоязычных сообщений (это около 400 тыс. авторов), содержащих предмет исследования — обсценную лексику. Точнее не любую, а верхушку частотного словаря сквернословия, которая составляет около 70% от общей массы. В принципе, это достаточно для небольшого исследования. Данные собраны и обработаны системой Brand Analytics.
Анализ показал не только распределение абсолютного употребления данной лексики по регионам и городам и регионам (см. рис.2 и рис. 3 соответственно),
Четыре слова, которые нельзя (часть 2) - 2
Рис.2. Распределение обсценной лексики по городам России.

Четыре слова, которые нельзя (часть 2) - 3
Рис.3. Распределение обсценной лексики по регионам России.

но и распределение по полу и возрасту (см. рис. 4 и рис. 5 соответственно).
Четыре слова, которые нельзя (часть 2) - 4
Рис.4. Распределение обсценной лексики по возрастам.

Четыре слова, которые нельзя (часть 2) - 5
Рис.5. Распределение обсценной лексики по полу.

Но не буду огорчать читательниц: данные по полу не совсем корректны. Я посмотрел топы авторов – самые неприлично пишущие барышни оказались рекламой секс услуг, попросту говоря — спамом (и, по всей видимости, роботами, которые отсечь в потоке, к сожалению, просто не получиться: публикации постоянно меняют лексику, публикуют не периодически, имеет друзей и нормальное кол-во репостов, т.е. ведут себя как люди). Либо замаскированными мальчиками. То есть на самом деле процент дам меньше.
Предвижу вопрос читателей: ну с абсолютным распределением по гео вроде бы и так более-менее понятно, а как с относительным. Кто у нас попал в матерщинники. Попробуем сделать картинку:
Четыре слова, которые нельзя (часть 2) - 6
Рис.6. Распределение обсценной лексики по России.

Небольшое пояснение: покраснение показывает более частое употребление обсценной лексики относительно зеленых областей.
Некоторые области с очень низким количеством сообщений (например, Чукотка – менее 0.02% от общей суммы) не очень корректно отображают действительное положение дел (немного искажают картину).
Тем не менее, вот десятка лидеров, не брезгающих неприличными словами:

  • Хабаровский край
  • Приморский край
  • Республика Саха (Якутия)
  • Магаданская область
  • Камчатский край
  • Еврейская автономная область
  • Мурманская область
  • Забайкальский край
  • Амурская область
  • Алтайский край

А вот, так сказать, аутсайдеры:

  • Республика Карачаево-Черкесия
  • Ленинградская область
  • Республика Ингушетия
  • Кабардино-Балкарская Республика
  • Республика Коми
  • Тюменская область
  • Республика Северная Осетия
  • Республика Тыва
  • Чеченская Республика
  • Вологодская область

В целом видно, что меньше всего употребляют эти нехорошие слова северо-кавказские республики и Ленинградская область (видимо вся питерская интеллигенция в мае выехала на дачу). Не хочу никого обидеть, но с Тюменской областью у меня сомнения, поскольку приходилось там бывать. Хотя давно это было…
Какие можно сделать выводы, глядя на всю эту красоту? Мы видим покраснение к востоку России и части севера России (Мурманская область, Ненецкий АО). Отчасти это говорит о том, что там не то чтобы больше ругаются матом, а просто говорят на нем. Вообще обсценная лексика имеет несколько функций. Думаю, даже стоит остановиться на этом и сделать небольшой лингвистический экскурс.

Функции обсценной лексики

Известный американский лингвист Стив Пинкер в своей недавно вышедшей у нас в переводе книге «Субстанция мышления: язык как окно в человеческую природу» выделил пять функций или пять способов сквернословия:

  1. Описательная (значение слова соотносится со своим предметом референции);
  2. Идеоматическая (или иносказательная);
  3. Агрессивная (выражение своей оценки по поводу происходящего);
  4. Эмфатическая (огрубление семантики с целью выделения значимых для говорящего вещей)
  5. Катартическая (не поверите: проведены научные исследования, которые говорят о том, что ругательства облегчают боль!)

В советское время у больших и не очень больших начальников успехом пользовалась эмфатическая функция: если начальник начинал ругаться, значит на это следовало обратить особое внимание. В принципе, и сейчас некоторые менеджеры активно эксплуатируют такой способ управления коллективом, но его эффективность год от года слабеет. Причиной тому распространение обсценной лексики в СМИ, кино, музыке и пр., а также среди молодежи, что снимает с нее (с этой лексики) элемент табуирования – если раньше при девушках считалось неприличным выражаться, то теперь это уже почти разговорная норма. Поэтому можно сказать, что сейчас больше работает агрессивная функция.
Эмфатическая функция наиболее сильно смещает семантическое значение слова в диахроническом аспекте. За примерами далеко ходить не надо: еще лет 30-40 назад слово «трахать» имело смысл «сильно ударить чем-либо» или «издавать резкий громкий звук», как правило в разговорном контексте, теперь это слово практически всегда употребляется, как синоним глагола группы Е (см. первую часть). Другая история с вполне нормальными глаголами «залупить» и «залупиться — залупаться» («краска залупилась»), который практически перестал употребляться (ни одного вхождения в НКРЯ) вследствие однокоренного обсценного товарища.
Катартической функцией пользуются все без исключения, разве что заменяя грубые слова эвфемизмами, не придавая по сути им определенного значения («блин», «черт», «ёпрст» и др.). Это своего рода способ «примирения» с действительностью: выругался и стало легче.
Идиоматической функцией больше пользуются творческие личности, чтобы подчеркнуть свою эксклюзивность, ну а порой и просто потому что «слово из песни не выкинешь». К тому же в наше время тексты литовать не надо – выложил и интернет видео-вирус – стал знаменитостью.
Ну и последнее, о чем хотелось бы упомянуть. Некоторые современные когнитивные нейробиологи стали вновь обращаться к гипотезе Дарвина о том, что эмоциональные выкрики были одним из главных связующих звеньев между языком животных и языком человека. Такой поворот событий отводит особую роль обсценной лексики не только в эволюции речеобразования человека, но позволяет по-другому взглянуть на процессы человеческой коммуникации.

Автор: lingvolab

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js