Компьютерный алгоритм выбирает самых значимых авторов прошлых лет

в 9:33, , рубрики: авторы, искусственный интеллект, компьютерные алгоритмы, копирайт, Научно-популярное

Компьютерный алгоритм выбирает самых значимых авторов прошлых лет - 1

1 января каждого года — не только день, когда все мы внезапно оказываемся в следующем году (у кого-то такой переход сопровождается типичной головной болью). Это еще и день, когда многие произведения различных авторов попадают в общий доступ. 50 или 70 лет (зависит от страны) права на то либо иное произведение принадлежат авторам или издательствам. По прошествии этого времени произведение можно свободно использовать: перепечатывать, оцифровывать и даже изменять. Под «авторами» подразумеваются писатели, поэты, художники и прочие представители мира искусства.

Так вот, каждый год доступными для всех становятся тысячи, десятки тысяч произведений. И только малое количество печатных работ оцифровываются. Все потому, что возможности команд оцифровщиков ограничены. Плюс ко всему, выбирать наиболее значимых авторов очень сложно.

Для того, чтобы упростить процесс выбора, Аллен Риддер из Дартмутского колледжа (Нью-Хемпшир) создал компьютерную программу, алгоритм, способный оценивать значимость различных авторов. Для начала работы программы нужно ввести дату (год), и машина выберет наиболее значимых авторов (по оценке машины), на чьи произведения уже не распространяются авторские права.

Другими словами, при помощи алгоритма можно выбрать автора и произведения, которые необходимо оцифровать в первую очередь. Оценка значимости проводится по большому количество факторов, включая упоминание авторов в Вики, цитируемость авторов, количество просмотров статей на Википедии с описанием биографии автора или его произведений и других данных.

Для работы алгоритма используется две базы данных. Первая — список из миллионов книг Университета Пенсильвании. Вторая — Википедия, о чем уже говорилось выше.

Свою систему оценки автор назвал «public domain ranking», протестировать работу алгоритма можно на одноименном сайте. Алгоритм позволяет провести ранжирование всех авторов, упоминание которых есть в Википедии (англоязычной). Результаты получаются интересными. К примеру, писательница Вирджиния Вулф получает 1081 баллов из 1011304 возможных. А художник Джузеппе Амисани, умерший в один год с Вирджинией Вулф, получил 580363 балла. Чем меньше число баллов — тем значимей автор.

Согласно этой оценке, организации типа Project Gutenberg должны оцифровать работы Вирджинии Вулф, а потом уже — картины художника.

Среди наиболее значимых авторов, чьи работы станут доступными для оцифровки 1 января 2015 года, первое место, по оценке алгоритма, занимает Томас Стернз Элиот. Также доступными станут работы Уинстона Черчилля, Малкольма Икс и некоторых других известных людей.

По словам разработчика алгоритма, оценки машины зачастую совпадают с оценками людей. Но, конечно, эту оценку нельзя принимать за аксиому, особенно с учетом того, что для ранжирования используется только один источник информации об авторе — Википедия.

Кстати, много лет назад я читал какой-то научно-фантастический рассказ по схожей проблеме. Тогда непризнанный никем литератор создал машину для оценки произведений писателей и поэтов. Само собой, он надеялся, что первое место достанется его поэме. Но нет, первое место досталось «Справочнику по радиотехнике». Машины такие машины.

Автор: marks

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js