Рубрика «semantic web» - 2

Как микроразметку используют в разных сторонах жизни и зачем это вам

2014-07-15 в 13:10, admin, рубрики: semantic web, Блог компании Яндекс, микроразметка, Микроформаты, Семантическая Сеть, сниппеты

Мы уже писали о том, как устроен мир семантической разметки и почему стандартов синтаксиса так много. Теперь хотим рассказать, зачем все это нужно. Зачем разработано столько стандартов и где они используются. Почему всем это полезно знать?

В веб-сервисах много больших задач, основанных на передаче данных и на создании связи между объектами. В этой статье мы разберем примеры конкретных проектов, реализованных с помощью семантической разметки.

Поисковые системы стремятся к улучшению выдачи: разрабатывают колдунщики, запускают партнерские программы, собирают «базы знаний». Большая часть этих задач решается с помощью разметки. Сайты могут получить красивый сниппет, передать данные для Яндекс.Островов, а «базы знаний», которые есть почти у всех поисковых систем (Google Knowledge Graph, Bing Satori, Яндекс Entity Search), получают свежие данные.

Facebook был заинтересован в развитии индустрии приложений, поэтому дал разработчикам возможность продвигать свои проекты в социальных сетях и связываться с другими приложениями. Так — тоже с помощью разметки — Open Graph публикует записи приложений в социальных сетях, а Applinks позволяет приложениям легко ссылаться друг на друга. Позже публиковать свои записи стало возможно и в Google+.

Читайте дальше и узнайте подробнее, как перечисленные ниже задачи решаются с помощью семантической разметки в разных продуктах и сервисах:

Улучшение выдачи в поисковиках: сниппеты в Яндексе, Google, Bing и Yahoo!
Пополнение Баз знаний: Яндекс Entity Search, Google Knowledge Graph, Bing Satori.
Другие варианты использования: приложения, глубокие ссылки и почта.

Читать полностью »

Будущее дизайна веб-систем, попытка прогноза

2014-01-21 в 9:04, admin, рубрики: semantic web, unity, веб-дизайн, Веб-разработка, Дизайн в IT, интерфейсы будущего, Семантическая Сеть, метки: semantic web, unity, веб-дизайн, интерфейсы будущего, семантическая сеть

Преамбула

Данный текст не привносит ничего принципиально нового. Все решения, которые тут упомянуты, уже существуют и используются, но не настолько широко, как хотелось бы.

Текст предлагает несколько парадигм, которые должны радикально улучшить восприятие и работу с веб-сайтами, а также повысить качество информации в сети.

Ну и да, на данный момент — образцовый дизайн: Дзенский поиск Яндекса. Шутка.
Читать полностью »

Базы знаний. Часть 1 — введение

2013-10-16 в 9:31, admin, рубрики: api, freebase, Linked data, owl, rdf, semantic web, sparql, онтологии, открытые данные, парсеры, парсинг контента, Семантическая Сеть, метки: api, freebase, Linked data, owl, rdf, semantic web, sparql, онтологии, открытые данные, парсеры, парсинг контента

Одной из причин причина слабого использования Linked Data-баз знаний в обычных, ненаучных приложениях является то, что мы не привыкли придумывать юзкейсы, видя перед собой только данные. Трудно спорить с тем, что сейчас в России производится крайне мало взаимосвязанных данных. Однако это не значит, что разработчик, создающий приложение для русскоязычной аудитории совсем уж отрезан от мира семантического веба: кое-что всё-таки у нас есть.

Основными источниками данных для нас являются международные базы знаний, включающие русскоязычный контент: DBpedia, Freebase и Wikidata. В первую очередь это справочные, лингвистические и энциклопедические данные. Каждый раз когда вам в голову приходит мысль распарсить кусочек википедии или викисловаря — ущипните себя как следует и вспомните о том, что всё, что хранится в категориях, инфобоксах или таблицах, уже распарсено и доступно через API с помощью SPARQL или MQL-интерфейса.

Я попробую привести несколько примеров полезных энциклопедических данных, которые вы не найдете нигде, кроме Linked Data.

Эта статья — первая из цикла Базы знаний. Следите за обновлениями.

Часть 1 — Введение
Часть 2 — Freebase: делаем запросы к Google Knowledge Graph
Часть 3 — Dbpedia — ядро мира Linked Data
Часть 4 — Wikidata — семантическая википедия

Читать полностью »

Semantic Forms для MediaWiki

2013-06-28 в 5:15, admin, рубрики: cms, forms, mediawiki, semantic web, Wiki-технология, вики, руководство, Семантическая Сеть, схемы, формы, шаблоны, метки: forms, mediawiki, semantic web, вики, руководство, схемы, формы, шаблоны

В прошлый раз я описал функционал плагина Semantic MediaWiki, позволяющего управлять структурированными данными в вашей системе и создавать на их основе различные представления. Ложкой дёгтя здесь является то, что пользователям приходится учить дополнительные элементы разметки.
Сегодня мы поговорим про расширение Semantic Forms, позволяющее сделать вики совсем не похожей на вики и привлечь к работе более широкий круг пользователей.

Semantic Forms для MediaWiki

Напомню, что сердцем Semantic MediaWiki является механизм семантических свойств. Назначение семантического свойства странице хоть и похоже на простое создание вики-ссылки [[имя свойства::значение свойства | что выводить на экран]], но, всё-таки, это новый синтаксис. Вдобавок даже если наши пользователи будут настолько дисциплинированы, что прочитают и вникнут в руководство по созданию свойств, они вряд ли будут называть все термины единообразно.
На моей вики, посвященной историческим личностям половина людей будет описана свойством время рождения, другие участники опишут людей свойством год рождения, а третьи дата рождения. Теперь для того, чтобы получить список исторических личностей и вывести их даты рождения, мне нужно написать три запроса вместо одного:

{{#ask:[[Категория Историческая личность]] | ?Время рождения }}
{{#ask:[[Категория Историческая личность]] | ?Год рождения }}
{{#ask:[[Категория Историческая личность]] | ?Дата рождения }}

Для решения этих проблем применяют шаблоны и формы.
Читать полностью »

ISO 15926 vs Семантика: сравнительный анализ семантических моделей

2013-05-07 в 6:21, admin, рубрики: semantic web, семантическая паутина, Семантическая Сеть, метки: semantic web, семантическая паутина

Идея применения семантических моделей в корпоративных информационных системах существует давно, но устойчивая практика такого их использования еще не сформировалась. Семантические модели можно применять для интеграции данных, аналитики, управления знаниями; однако, общепринятого мнения о том, где они наиболее полезны, по каким методикам должны строиться такие модели, пока не сформировано.
Задача статьи — на практическом примере сравнить аналитический потенциал моделей, построенных по правилам интеграционного стандарта ISO 15926, который предписывает использование OWL и SPARQL для выражения моделей и работы с ними, и «обычной» семантических моделей, построенных без использования этого стандарта. Решение этого вопроса позволит выбрать диапазон задач, для решения которого целесообразно применять такие высокоуровневые парадигмы семантического моделирования, как ISO 15926.
Читать полностью »

Semantic MediaWiki

2013-04-19 в 11:46, admin, рубрики: Semantic MediaWiki, semantic web, Wiki-технология, семантическая паутина, Семантическая Сеть, управление знаниями, метки: Semantic MediaWiki, semantic web, семантическая паутина, семантическая сеть, управление знаниями

Semantic MediaWiki
Semantic MediaWiki — это расширение, ради которого стоит ставить MediaWiki: оно помогает бороться с бардаком и хаосом, который рано или поздно воцаряется в любой вики-системе.

Оно позволяет поддерживать согласованность данных на вики.
С его помощью можно обращаться с вики как с базой данных.
С его помощью можно генерировать красивые графики, диаграммы и графы на основе вики-данных.
Оно позволяет пользователям возможность вводить данные с помощью форм, а не вики-разметки, понижая тем самым порог вхождения для пользователей.

SMW позволяет использовать вики как составную часть системы управления знаниями, с его помощью можно создавать коммерческие системы, которые сочетают простоту вики, четкость коллаборативных баз данных, и лучшее из мира Semantic Web. В общем, это вещь, более чем достойная пристального внимания и подробного обзора.
Читать полностью »

Редактор онтологий на естественном языке

2013-03-18 в 5:04, admin, рубрики: owl, semantic web, Песочница, семантическая паутина, метки: owl, semantic web, семантическая паутина

На выставке CeBIT я познакомился с представителями польской компании Cognitum, которая разрабатывает семантический фреймворк Ontorion. Важнейшей частью этого фреймворка является редактор онтологий Fluent Editor, который показался мне замечательным и достойным обзора. Главное достоинство Fluent Editor'а состоит в том, что он позволяет создавать OWL-онтологии людям, не имеющим представления о синтаксисе OWL (хотя иметь представление о его концепциях, и о моделировании информационных структур, конечно, все равно нужно). Онтологии создаются на естественном языке, Controlled English — то есть на обычном английском, к которому применены определенные правила и ограничения. Приведу обзор основных возможностей синтаксиса этого языка, не забывая смотреть на то, в каком виде его основные выражения будут сохраняться в OWL.

Для примера начнем составлять онтологию, содержащую сведения о бизнесе некой компании. У этой компании, как у любой коммерческой организации, есть поставщики и покупатели. Те и другие являются организациями, причем одна и та же организация может быть одновременно и поставщиком, и покупателем. Запишем соответствующие выражения на Controlled English:

Every customer is a organization.
Every supplier is a organization.

Читать полностью »

Как и для чего мы сделали свой валидатор микроразметки

2013-01-14 в 10:27, admin, рубрики: semantic web, Блог компании Яндекс, валидация, микроразметка, Микроформаты, Семантическая Сеть, яндекс.вебмастер, метки: semantic web, валидация, микроразметка, семантическая сеть, яндекс.вебмастер

Недавно мы писали о нашем валидаторе семантической разметки. А сегодня хотим рассказать, зачем и почему он был сделан, какие сложности возникли при разработке и как мы с ними справились. Одна из причин, по которой мы его сделали, конечно, в том, что мы хотели избавить роботов от встреч с ошибками вебмастеров. Но руководствовались мы не только этим.

Медленно, но верно семантическая разметка набирает популярность. Чуть больше десяти лет назад (в мае 2001 года) впервые был введен термин «семантическая паутина». В 2004 году появилось первое упоминание формата RDFa, примерно тогда же начали развиваться микроформаты. В июне 2011 года был запущен стандарт schema.org.

Сейчас семантическую микроразметку поддерживают и Яндекс, и другие ведущие мировые поисковые системы.

Однако вебмастера часто сталкиваются с тем, что валидаторы HTML выдают массу ошибок. Читать полностью »

MilkyWeb — Graph of Everything

2012-12-23 в 10:57, admin, рубрики: big data, semantic web, графы, онтологии, Семантическая Сеть, социальные сети, Социальные сети и сообщества, я пиарюсь, метки: big data, semantic web, графы, онтологии, социальные сети

MilkyWeb — Graph of Everything

В данной статье я хочу поделиться своими мыслями по поводу способов решения фундаментальных проблем современного Интернета. Хочу описать модель, которая, по моему мнению, может помочь ещё лучше упорядочить знания в интернете, и продемонстрировать свою попытку реализации такой модели.
Читать полностью »

Как работает W3C, и что там делает Яндекс? Интервью с Чарльзом МакКэтиНевилом

2012-10-29 в 8:38, admin, рубрики: IT-стандарты, semantic web, standards, w3c, YaC, yac2012, Блог компании Яндекс, Веб-разработка, стандарты, яндекс, метки: semantic web, standards, w3c, YaC, yac2012, стандарты, яндекс

В конце августа Яндекс вступил в World Wide Web Consortium. Тогда, в том числе в посте на Хабре, нам задали много вопросов о том, зачем нам W3C, и что мы там собираемся делать.

Нашим представителем в W3C стал Чарльз МакКэтиНевил, и я воспользовался его приездом на YaC 2012, чтобы задать часть этих вопросы вживую.

Чарльз занимается стандартами Веба в W3C почти 14 лет. Раньше он был директором по веб-стандартам в Opera Software, а с июля 2012 года работает в Яндексе, учит русский язык и даже ведёт по-русски свой русскоязычный твиттер.

Кстати — если у вас есть вопросы к Чарльзу, которые мы ещё не задали, — смело задавайте их в комментариях. Обещаю получить у него ответы на стоящие и добавить их в интервью и/или ответить в комментариях же.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «semantic web» - 2

Как микроразметку используют в разных сторонах жизни и зачем это вам

Будущее дизайна веб-систем, попытка прогноза

Преамбула

Базы знаний. Часть 1 — введение

Semantic Forms для MediaWiki

ISO 15926 vs Семантика: сравнительный анализ семантических моделей

Semantic MediaWiki

Редактор онтологий на естественном языке

Как и для чего мы сделали свой валидатор микроразметки

MilkyWeb — Graph of Everything

Как работает W3C, и что там делает Яндекс? Интервью с Чарльзом МакКэтиНевилом