WEB 3.0. От сайтоцентризма к юзероцентризму, от анархии к плюрализму

в 13:22, , рубрики: semantic web, web 2.0, интернет, Семантика

В тексте в конспективном виде изложены идеи, высказанные автором в докладе «Философия эволюции и эволюция интернета».

Основные недостатки и проблемы современного веба:

  1. Катастрофическая перегруженность сети многократно дублированным контентом, при отсутствии надежного механизма поиска оригинального источника.
  2. Рассредоточенность и несвязанность контента – невозможность сделать исчерпывающую выборку по тематике и, тем более, по уровням анализа.
  3. Зависимость формы представления контента от издателей (зачастую случайных, преследующих собственные, обычно коммерческие, цели).
  4. Слабая связанность результатов поиска с онтологией (структурой интересов) пользователя.
  5. Малая доступность и слабая классифицированность архивного контента сети (в частности, социальных сетей).
  6. Малое участие профессионалов в организации (систематизации) контента, хотя именно они по роду своей деятельности повседневно занимаются как раз систематизацией знаний, но результат их работы фиксируется лишь на локальных компьютерах.


Основная причина замусоренности и нерелевантности сети – это доставшееся нам в наследство от Web 1.0 сайтовое устройство, при котором главным лицом в сети является не владелец информации, а владелец места ее размещения. То есть в сеть была перенесена идеология материальных носителей контента, где главным было место (библиотека, киоск, забор) и предмет  (книга, газета, бумажка), а уже потом их содержание. Но поскольку в отличие от реального мира, пространство в виртуальном мире не ограничено и стоит копейки, то количество мест, предлагающих информацию, на порядки превысило количество единиц уникального контента. Web 2.0 частично исправил ситуацию: каждый пользователь получил свое личное пространство – аккаунт в социальной сети  и свободу в известной мере его конфигурировать. Но проблема с уникальностью контента лишь усугубилась: технология копипаста еще на порядки увеличила степень дублирования информации.
Усилия по преодолению указанных проблем современного интернета концентрируются в двух, в некоторой степени взаимосвязанных, направлениях.

  1. Повышение точности  поиска путем микроформатирования распределенного по сайтам контента.
  2. Создание «хранилищ» достоверного контента.

Первое направление, безусловно, позволяет получить более релевантный поиск, по сравнению с вариантом указания ключевых слов, но не снимает проблемы дублирования контента, а самое главное, не устраняет возможности подлога – систематизацию информации чаще всего делает ее владелец, а не автор и уж подавно не потребитель, который больше всех заинтересован в релевантности поиска.
Разработки во втором направлении (Google, Freebase.Com, CYC и др.) позволяют получить однозначно достоверную информацию, но только в областях, где это возможно – остается открытой проблема плюрализма знаний в сферах, где нет единых стандартов и общей логики систематизации данных. Сложно решается проблема получения, систематизации и включения в базу нового (текущего) контента, что является главной проблемой в современной социально ориентированной сети.

Какие же решения предлагает юзероцентристский деятельный подход, изложенный в докладе «Философия эволюции и эволюция интернета»

  1. Отказ от сайтовой структуры – главным элементом сети должна стать единица контента, а не место его размещения; узлом сети должен быть пользователь, с конфигурированным относительно него множеством единиц контента, которое можно назвать онтологией пользователя.
  2. Логический релятивизм (плюрализм), констатирующий невозможность существования единой логики организации информации, признающий необходимость неконечного числа практически независимых онтологических кластеров даже в пределах одной тематики. Каждый кластер представляет собой онтологию некоторого пользователя (индивидуального или обобщенного).
  3. Деятельный подход к построению онтологий, подразумевающий, что онтология (структура кластера) формируется и проявляется в деятельности генератора контента. Такой подход необходимо требует переориентации сервисов сети с генерации контента, на генерацию онтологий, что по сути, означает создание инструментов для реализации в сети любой деятельности. Последнее позволит привлечь в сеть множество профессионалов, которые обеспечат ее функционирование.

Последний пункт можно расписать подробнее:

  1. Онтология создается профессионалом в ходе его профессиональной деятельности. Система предоставляет профессионалу все инструменты для введения, систематизации и обработки любых типов данных.
  2. Онтология выявляется в деятельности профессионала. Сейчас это стало возможно, поскольку большой процент операций любой деятельности выполняется или фиксируется на компьютере. Профессионал не должен строить онтологии, он должен действовать в программной среде, которая одновременно является основным инструментом его деятельности и генератором онтологий.
  3. Онтология становится основным результатом деятельности (и для системы, и для профессионала) – продукт профессиональной работы (текст, презентация, таблица) является лишь поводом для построения онтологии этой деятельности. Не онтология привязывается к продукту (тексту), а текст, понимается как объект, сгенерированный в конкретной онтологии.
  4. Онтология должна пониматься как онтология конкретной деятельности; сколько деятельностей – столько и онтологий.

Итак, основной вывод: Web 3.0 это переход от сайтоцентристского веба к семантической юзероцентристской сети – от сети вебстраниц с произвольно конфигурированным контентом к сети уникальных объектов, объединенных в неконечное число кластерных онтологий. С технической стороны Web 3.0 это множество онлайн-сервисов, предоставляющих полный спектр средств внесения, редактирования, поиска и отображения любого типа контента, которые одновременно обеспечивают онтологизацию деятельности пользователей, а через нее и онтологизацию контента.

Александр Болдачев, 2012-2015

Автор: boldachev

Источник

Поделиться новостью

* - обязательные к заполнению поля