Метка «нецензурная лексика»

Суперкомпьютер IBM Watson выучил уличный жаргон: пришлось чистить ему память

Разработчики суперкомпьютера IBM Watson сделали большую ошибку, когда закачали в его память словарь уличного жаргона с сайта Urban Dictionary. IBM Watson обучен распознавать смысл предложений/вопросов и отвечать на них, используя усвоенные массивы неструктурированных данных (data mining). Благодаря этому компьютер выиграл у чемпионов телевикторины «Своя игра» (Jeopardy) в 2011 году, после чего начал изучать медицинские справочники с целью диагностировать болезни по симптоматике, как доктор Хаус.

Разработчики думали, что информация о дополнительных смыслах слов улучшит искусственный интеллект, поможет ему лучше понимать людей. Они ошиблись. Уличный жаргон оказался исключительно вреден суперкомпьютеру. Однажды он даже ответил на вопрос неприличным словом “Bullshit”.
Читать полностью »

Коммуникационная группа «Византия» провела интересное исследование российской аудитории социальных сетей. В отличие от подобных исследований, здесь социологи сконцентрировались на составлении психологического портрета среднего пользователя Facebook, «Вконтакте», «Одноклассники» и Twitter. Оказалось, что аудитория этих сайтов заметно отличается.

Например, вот один из результатов исследования: количество мата на 1000 слов.

Вконтакте — 17,2 бранных слова на тысячу
«Мой мир» — 16,3
Twitter — 15,5
«Одноклассники» — 15,4
Facebook — 12,8
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js