- PVSM.RU - https://www.pvsm.ru -
Предлагаются метрики для оценки общения при помощи текста. Делается вывод, что по большинству метрик в интернете нет прогресса по сравнению с временами бумажного общения.
Прежде чем писать техзадание для будущих платформ надо оценить текущее состояние технологий текстового общения при помощи метрик. Под таким общением я понимаю не только прямое общение при помощи социальных сетей, электронной почты, мессенджеров, форумов и корпоративных средств управления разработкой, но любых технологий на выходе, дающих какой-то текст доступный другим, включая книги, статьи и даже подкасты и умные видео.
Перечисленные ниже метрики описывают качество текстов (1 и 2), долговечность и доступ к информации (3 – 5), связность информационного пространства (6 и 7) и отношения между людьми через тексты (7 – 9). Метрики частично повторяются или дополняют друг друга, например, наличие быстрой обратной связи необходимо для обеспечения качества. Данный список должен обсуждаться, уточняться и дополняться.
Обеспечения качества заметных текстов. Не только прямое повышение качества, но и снижение ранга некачественных текстов.
Наличие быстрой обратной связи. Возможность задавать вопросы и получать ответы, большая скорость исправления текстов для повышения их качества, обновление по мере необходимости.
Долговечность хранения информации. Доступность старых качественных текстов для повторного использования, дополнения и исправления вместо написания новых текстов. Сохранение истории правок и удаленного в архивах.
Универсальность платформы для разных форматов информации и любой пользовательской аудитории, то есть обладание функционалом множества других систем (Вики, архивы оригинальных публикаций, социальные сети, форумы, обзоры и отзывы, маркетплейсы, поисковики и мессенджеры) в рамках единого пользовательского интерфейса. Выдача текстов согласно текущему контексту обсуждения и аудитории.
Доступ к текстам и информации. Включает возможность быстрой публикации авторами, быстрой проверки, оценки и исправления текста другими, и быструю доставку текста до читателей (то есть пункт 2).
Плотность связей между текстами, включая неявные (вычисляемые) связи с версиями на других языках и переводами текста, обсуждениями темы текста, альтернативными текстами на ту же тему, историей правок текста, библиографическими прямыми и обратными [1] ссылками включая ссылки на первоисточники.
Качество связей между текстами. Включает возможность продуктивной дискуссии между группами людей со стойкими неразрешенными противоречиями, например сторонниками и противниками вакцинации от ковида-19, Российской империи, октябрьской революции, СССР, Трампа и Камалы…
Количество качественных связей между людьми (определяется через уровень взаимного доверия и взаимную работу над текстами). В данный момент ограничено числом Данбара, а значит возможность преодолеть это ограничение.
Качество механизмов разрешения конфликтов, что не сводится только к механизмам раздачи привилегий. Также относится к возможности вести продуктивную дискуссию в условиях стойких неразрешённых противоречий из пункта 7.
Прогресс по некоторым из этих метрик был достигнут на отдельных платформах, например в Википедии, и в узкоспециализированных системах вроде корпоративной Вики Confluence [2] и в системе отслеживания ошибок для программистов Jira [3] от Atlassian [4]. В интернете в целом по перечисленных выше метрикам, кроме доступа к текстам (если текст в интернете сохранился), с начала XX века не было достигнуто значительного прогресса или наоборот произошла деградация:
Простота публикации приводит к падению качества текстов. Интернет наполнен копипастой и заспамлен. Распространение ИИ приводит к генерации вторичных текстов, а не исправлению стиля исходных текстов без создания излишних копий.
Скорость получения обратной связи, повысилась радикально. На форумах и под постами в социальных сетях отвечают крайне быстро, но это обычно не приводит к исправлению и улучшению текстов. Для исправления научных текстов используется старая процедура рецензирования и отзыв полностью фальсифицированных статей, но не исправление отдельных ошибок.
Интернет не приспособлен для долговременного хранения информации. Например, упоминаний Джека Ма до 2005 года в интернете найти невозможно [5], то же было проверено с Касперским, но найдены были только несколько ссылок на Лента.ру [6]. Если есть старая ссылка, то можно попытаться воспользоваться интернет-архивом [7], но ссылки тоже утрачиваются из-за проблемы со связностью интернета. Первые два десятилетия XXI века через 100 лет возможно окажутся черной дырой, о которой сохранится намного меньше источников, чем копий бумажных публикаций в архивах о двух последних десятилетиях ХХ века.
Достигнутый предел универсальности – мессенджеры с интегрированными социальными сетями.
Доступ к информации, включая дистанционное общение, кардинально улучшился благодаря развитию интернета. Научные статьи, даже спрятанные за paywall подписки, можно найти в бесплатном доступе на Sci-Hub [8], а не ехать в библиотеку в университетском городе. Бумажные книги массово сканируют и выкладывают в интернет, особенно в русском интернете.
Возможность ставить ссылки пришла в массы, но журналисты и блогеры часто не ставят даже минимально необходимые ссылки на цитируемые или копируемые источники. Обратные ссылки (кто на меня ссылается?) редко вычисляются и мало используются. Количество ссылок явно не достаточное, хотя библиографии научных статей стали длиннее от того, что статей стало намного больше. Связи в интернете потенциально могут заменить плохо работающий поиск в старом Google и новых ИИ системах вроде perplexity.ai [9].
Качество ссылок в научных статьях ухудшилось. Авторы научных статей копируют ссылки из других статей, не читая. Например, не замечают [10], что цитируемые статьи давно отозваны [11]. Библиографии в книгах обычно прорабатывают хуже, чем в прошлых веках. В остальном интернете недостаток ссылок заменяет поиск.
Количество двухсторонних связей между людьми по-прежнему ограничено числом Данбара, а односторонние связи реализуются в интернете примерно также как в эпоху бумажных изданий и ТВ. Качество связей между людьми возможно упало, так как упал общий уровень доверия. Мы часто не знаем даже своих соседей по дому или офису, а индустрия массового мошенничества получила новое развитие.
Конфликты разрешаются при помощи привилегий и бана. Привилегии раздаются административными методами либо голосованием за глобальную карму авторов и рейтинг публикаций. Рейтинг сайтов в выдаче поисковых систем управляется с помощью «тайных механизмов» или покупается за деньги. Данные механизмы отличаются от редакционных механизмов, существовавших до интернета, только массовостью и автоматизацией.
Можно также попытаться составить метрики роста, связанные с привлекательностью системы для авторов и читателей (и оценить прогресс по этим метрикам). Эти метрики описывают возможность захватить единственный ограниченный ресурс – время пользователей, авторов и читателей. Первая задача: привлечь лучших авторов и эффективно использовать их время. Для привлечения лучших авторов система должны выбирать, продвигать и сохранять лучшие тексты. Это работает и для привлечения читателей, а значит перечисленные выше метрики достаточны для оценки возможностей роста системы.
Проект платформы В++ [12] позволяющий достичь значительных улучшений по всем метрикам письменного общения описан в моих прошлых статьях. В++ использует явно оформленные и самоуправляемые сообщества единомышленников (дискурсы), что позволяет создавать эффективные обратные связи для улучшения качества текстов и подавления копипасты и спама [13]. Для навигации В++ используем многомерную систему координат [14] (заголовок, дискурс, формат, сложность, язык…) что позволяет помещать рядом (перечислять в меню дискурсов подобному меню языков Википедии) статьи на одну тему написанные с разных точек зрения и принадлежащих к разным дискурсам.
Автор: vignatovic
Источник [15]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/tekst/404360
Ссылки в тексте:
[1] обратными: https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%80%D0%B0%D1%82%D0%BD%D0%B0%D1%8F_%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0
[2] Confluence: https://ru.wikipedia.org/wiki/Confluence
[3] Jira: https://ru.wikipedia.org/wiki/Jira
[4] Atlassian: https://ru.wikipedia.org/wiki/Atlassian
[5] упоминаний Джека Ма до 2005 года в интернете найти невозможно: https://giovanni1313.livejournal.com/135368.html
[6] проверено с Касперским, но найдены были только несколько ссылок на Лента.ру: https://giovanni1313.livejournal.com/135368.html?thread=1667016#t1667016
[7] интернет-архивом: https://web.archive.org/web/20071216175435/https:/www.neurosoc.ru/articles/fromtribe.htm
[8] Sci-Hub: https://www.sci-hub.ru
[9] perplexity.ai: https://www.perplexity.ai
[10] не замечают: https://www.science.org/content/article/many-scientists-citing-two-scandalous-covid-19-papers-ignore-their-retractions
[11] что цитируемые статьи давно отозваны: https://jamanetwork.com/journals/jamainternalmedicine/fullarticle/2782460
[12] платформы В++: https://habr.com/ru/articles/665678/
[13] позволяет создавать эффективные обратные связи для улучшения качества текстов и подавления копипасты и спама: https://habr.com/ru/articles/864086/
[14] многомерную систему координат: https://habr.com/ru/articles/789644/
[15] Источник: https://habr.com/ru/articles/864484/?utm_campaign=864484&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.