Рубрика «краудсорсинг»

image

Привет. Хорошие новости: мы успешно завершили краудсорсинговый проект «Открой историю Большого» по оцифровке программ, афиш и фотографий, которые хранятся в музее Большого театра. Итогами делимся на сайте openbolshoi.ru, а в этом посте рассказываем, как технически был организован проект.

О том, почему мы начали заниматься этим проектом и что сделали на первом этапе, можно почитать здесь. А что же было дальше? После первой части проекта мы благодаря ABBYY FineReader PDF и с помощью волонтеров подготовили файлы программ и афиш в формате PDF с вычитанным текстовым слоем и передали их музею Большого театра. Теперь все данные хранятся в электронном виде, и сотрудники используют их, чтобы искать и копировать нужную информацию. Это быстрее и удобнее, чем перебирать документы в шкафах и перепечатывать текст из оригиналов.

Но как узнать больше о представлениях, а также о людях, чьи судьбы тесно связаны с историей театра? Как собрать статистику:

Помогли технологии Natural Language Processing (NLP), разработанные в ABBYY. Сегодня мы расскажем, как на втором этапе проекта алгоритмы извлекли из программ и афиш необходимые сведения, заполнили поля базы данных, а затем 7500 волонтеров проверили и дополнили информацию. А в конце поста читайте, как сейчас создается электронный архив музея с удобным поиском по всем представлениям и персонам.
Читать полностью »

Эссе Айзека Азимова о творчестве от 1959 года. Айзек Азимов (1920–1992) – американский писатель и профессор биохимии Бостонского университета, известный как автор научно-фантастических и научно-популярных произведений. Азимов считается одним из «большой тройки» писателей-фантастов своего времени наряду с Робертом Хайнлайном и Артуром Кларком.


Заметка Артура Обермайера, друга автора:

В 1959 году я работал ученым в Allied Research Associates в Бостоне. Компания была порождением MIT и изначально изучала воздействие ядерного оружия на конструкции летательных аппаратов. Компания заключила с ARPA контракт с аббревиатурой GLIPAR (Guide Line Identification Program for Antimissile Research) с целью выявления наиболее творческих подходов к созданию противоракетной оборонительной системы. Правительство понимало, что сколько бы ни было потрачено на совершенствование и дополнение существующих технологий, они все равно останутся неудовлетворительными. Они хотели, чтобы мы и несколько других подрядчиков думали нестандартно.

Когда я только подключился к проекту, я предположил, что Айзек Азимов, который был моим хорошим другом, будет достойным участником. Он согласился и присутствовал на нескольких встречах. Позже он решил не продолжать, потому что не хотел иметь доступ к какой-либо засекреченной информации; это ограничило бы его свободу самовыражения. Однако перед уходом он написал в качестве своего единственного формального вклада это эссе о творчестве. Это эссе никогда не публиковалось и не выходило за рамки нашей небольшой группы. Когда я недавно вновь обнаружил его при разборе старых бумаг, я понял, что его суть столь же актуальна сегодня, как и когда он его написал. Оно описывает не только творческий процесс и природу творческих людей, но и среду, которая способствует творчеству.Читать полностью »

Привет!

При обсуждении одной IT-статьи спонтанно возникла оффтоп-дискуссия о марксизме и экономике. Из уважения к количеству букв я собрал комментарии, и с минимальными правками выкладываю здесь. Считаю, что умеренный экономический дискурс, хоть частично, укладывается в тематику ресурса, посвященного Будущему. Особенно в свете последних событий. Не судите строго программиста, он стреляет как умеет (с).

— Два томика Капитала этому господину :)
— В Капитале три тома. Какой том этому господину не нужен? :)

Капитал мне лично не зашел. Вся его терминология нуждается в уточнении, например:
— что такое средства производства, репутация журналиста сюда входит?
— в чем измеряется труд, надеюсь не в человеко-часах?
— являются ли природные ресурсы капиталом — по бухучету да, но ведь в них не вложено труда?
— патентное право — справедливо?
— акционерные общества — это демократия?
Наука начинается там, где базовым величинам даются метрологически состоятельные определения (длина, масса, заряд), а пока все крутится вокруг эмоционально-окрашенных понятий — Эллиот будет научней чем Маркс.
Читать полностью »

Мы опубликовали первый русскоязычный туториал по краудсорсингу:

Это серия видео о том, как с помощью передачи простых заданий большому числу исполнителей собрать и разметить данные. Исполнителям можно поручить разные задания: найти что угодно в интернете, оценить дизайн, проверить или создать контент, поучаствовать в опросе, добраться до точки на карте и сфотографировать там что-нибудь. Тысячи людей будут одновременно выполнять перечисленные действия, формируя необходимый набор данных. Выпуск туториала — повод вновь поговорить о том, как краудсорсинг радикально меняет процессы в компаниях.
Читать полностью »

Создаем датасет для распознавания счетчиков на Яндекс.Толоке - 1

Как-то два года назад, случайно включив телевизор, я увидел интересный сюжет в программе "Вести". В нём рассказывали о том, что департамент информационных технологий Москвы создает нейросеть, которая будет считывать показания счетчиков воды по фотографиям. В сюжете телеведущий попросил горожан помочь проекту и прислать снимки своих счетчиков на портал mos.ru, чтобы на них обучить нейронную сеть. 

Если Вы — департамент Москвы, то выпустить ролик на федеральном канале и попросить людей прислать изображения счетчиков — не очень большая проблема. Но что делать, если Вы — маленький стартап, и сделать рекламу на телеканале не можете? Как получить 50000 изображений счетчиков в таком случае?Читать полностью »

Толока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов оценок. Для любых исследований и экспериментов, связанных с машинным обучением, необходимы большие объёмы качественных данных. Поэтому мы начинаем публиковать открытые датасеты для академических исследований в разных предметных областях.

Сегодня мы поделимся ссылками на первые публичные датасеты и расскажем о том, как они собирались. А ещё подскажем, где же правильно ставить ударение в названии нашей платформы.

Читать полностью »

В течение нескольких лет я работал над картами, которые используются в русском и других языковых разделах Википедии. Всего мной было создано более 300 карт. Я не являюсь профессиональным картографом, и не имею специального образования в этой области. Видимо, мне просто нравилось делать карты :)

В рамках этой статьи я хочу поделиться опытом создания карт для Википедии, с фокусом на позиционных картах.

Опыт создания позиционных карт для Википедии - 1
Физическая карта Канады

Читать полностью »

Появление криптовалют привлекло внимание к более широкому классу систем, в которых экономические интересы участников совпадают таким образом, что они, действуя ради собственной выгоды, обеспечивают устойчивое функционирование системы в целом. При исследовании и проектировании таких самодостаточных систем выделяются так называемые криптоэкономические примитивы — универсальные структуры, создающие возможность координации и распределения капитала для достижения общей цели посредством использования различных экономических и криптографических механизмов.

Одной из главных проблем краудфандинга является то, что потенциальные спонсоры проектов и организаций часто не имеют достаточного стимула для их финансирования. Особенно это касается общественно значимых проектов, пользу от реализации которых получают многие, в то время как бремя финансовой поддержки ложится на сравнительно небольшое число спонсоров. Долгосрочные проекты также нередко страдают от постепенного угасания интереса со стороны спонсоров и вынуждены постоянно вкладывать усилия в маркетинг. Подобные трудности могут привести к закрытию проекта, несмотря на его востребованность, и в совокупности также именуются проблемой безбилетника.

Технология программируемых денег открыла возможность реализации новых механизмов финансирования, которые помогают решить проблему безбилетника. Существование криптоэкономических примитивов облегчает эту задачу, позволяя создавать системы координации участников с заранее известными свойствами. Читать полностью »

Социальный труд и открытое проектирование. Введение - 1

Эволюция принципов мотивации и стимулирования при разработках информационных систем и других высокотехнологичных продуктов — развивается. Кроме классических, т.е. сугубо монетарно-капиталистических форм, давно присутствуют и находят всё большую популярность альтернативные формы. Пол века назад гигант IBM в рамках своей программы «Делись» призвал к безвозмездному обмену прикладными программами для своих мейнфреймов, разработанными сторонними программистами (не из благотворительных побуждений, но это не меняет сути программы).

День сегодняшний: социальное предпринимательство, краудсорсинг, «Пишем код вместе» («Social Coding», GitHub и другие социальные сети для разработчиков), разнообразные формы лицензирования freeware Open Source проектов, биржи идей и свободный обмен знаниями, технологиями, программами.

Предлагается новый формат взаимодействия «Социальный труд и открытое проектирование» и концепция его информационного ресурса (сайта). Встречаем новый старт ап (если он действительно новый). Формула предлагаемого подхода: networking, co-working, open innovation, co-creation, сrowdsourcing, сrowdfunding, научная организация труда (НОТ), стандартизация и унификация, типизация решений, активность и нефинансовая мотивация, свободный обмен опытом и наработками copyleft, Open Source, freeware и «все-все-все».
Читать полностью »

Собрали всем «Хабром» справочник «Кем выдан…» для паспортов. Качайте на здоровье - 1

С пару месяцев назад мы поэкспериментировали: получится ли на «Хабре» собрать справочник подразделений, выдающих российские паспорта. Дело полезное: эти данные нужны много кому, канонического источника нет, а существующие — очень так себе.

И знаете, все получилось. Пригодный к использованию справочник готов, можно качать и пользоваться. А еще мы сделали подсказки, которые ускоряют ввод подразделений в формы.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js