Рубрика «wikipedia»

С 18-м днём рождения, Википедия; празднуем совершеннолетие хорошего проекта - 1

Во вторник Википедии исполнилось 18 лет. Если бы этот массивный энциклопедический проект, работающий по принципу клаудсорсинга, был человеком, то в большинстве стран его считали бы юридически взрослым. Но на самом деле бесплатная онлайн-энциклопедия уже давно играет роль добросовестного интернетовского взрослого.

С начала своей работы Википедия неимоверно выросла. Она может похвастаться 5,7 млн статей на английском языке и 92 млрд просмотрами страниц за прошлый год.
Читать полностью »

Всем привет.

Представляю вам коллективный (хабра-) перевод основного документа (282 000 знаков), дела всей жизни Дугласа Энгельбарта. (Подробнее: 50 лет спустя. The Mother of All Demos)

image

Я считаю, что:

  1. Первоисточники крайне важны, иначе появляются «трактователи», которые интерпретируют ради своей выгоды (если не тупости).
  2. Проект надо делать открыто, публично и коллективно, а не в втихомолку пилить продукт пару лет, чтоб «завоевывать рынки». И тем более что все «заморочки» закрытой организации наследуются в продукт.
  3. Проект должен быть бесплатным и даже радикальнее — приносить убытки множеству игроков отрасли (гудбай венчурные инвесторы).
  4. Проект должен создаваться вне капиталистической логики, копирайта, текущего права и морали.

Слово Дугласу Энгельбарту:

Augmenting Human Intellect: A Conceptual Framework

By Douglas C. Engelbart
October 1962

1. Введение

А. Общие положения

Под «усилением человеческого интеллекта» мы подразумеваем/понимаем увеличение способности человека браться за сложные (complex) проблемные ситуации, достигать понимания с учетом своих потребностей, и находить решения. В данном контексте под увеличением (расширением) способности (возможностей) подразумевается совокупность следующих пунктов: ускоренное и улучшенное осмысление, возможность достигать полезного уровня понимания в ситуации, которая ранее была слишком сложна, принятие лучших решений с большей скоростью, а также возможность поиска решений для задач, которые раньше казались неразрешимыми. А под «сложными ситуациями» мы понимаем рабочие задачи дипломатов, руководителей, социологов, биологов, физиков, юристов и дизайнеров, т.е. существует ли данная ситуация на протяжении 20 минут или 20 лет. Мы не рассматриваем отдельные хитроумные трюки, которые помогают в определенных ситуациях.
Читать полностью »

image
Люди часто сравнивают работу Энгельбарта с современными технологиями, но это неправильно. Забудьте про сегодня, просто подумайте о том, что он делал, с точки зрения его целей.

Дуглас Энгельбарт умер сегодня (July 3, 2013). Его труды всегда было очень сложно интерпретировать и объяснять.

Многие эксперты, к сожалению, часто упускают суть его работы, потому что они рассматривают всё как техническую задачу. Энгельбарт посвятил свою жизнь проблемам человечества, технологии были лишь частью их решения. Когда я читаю интервью экспертов с Энгельбартом, я представляю, как они брали бы интервью у Джорджа Оруэлла, задавая глубокие вопросы про его пишущую машинку.
Читать полностью »

image

Сложность и срочность вопросов, стоящих перед лицом человечества, растут гораздо быстрее, чем наши способности совместного их понимания и решения. Это очень опасная проблема, но есть стратегические действия, которые мы можем предпринять, коллективно.

Введем «коллективный IQ» как показатель способности сообщества решать сложные вопросы: точно их понимать, выявлять наилучшие варианты решений, оценивать ресурсы и оперативные возможности, выбирать подходящее решение, эффективно организовывать и контролировать его исполнение, быстро и точно справляться с непредвиденными затруднениями.

Я утверждаю, что стратегия «содействия эволюции» коллективного IQ наших сообществ и есть наилучшая стратегия.

Гипертекст будет иметь принципиальное значение, а SIGWeb должна быть лидером.

«Коллективный IQ» – это сборка коллективных способностей из основных способностей человека, таких как ощущение, восприятие, познание, движение и т.д.
Читать полностью »

«Компьютерная революция еще не случилась.
(The computer revolution hasnt happened yet)»
— Алан Кей

image

Всем привет.
Сегодня 50 лет с исторического события, известного как "Мать всех демонстраций" (The Mother of All Demos). И я стартую проект «Энгельбарт» (чтобы это ни было и что бы это ни значило).

Я услышал про Энгельбарта от Данилы Медведева (очень радикальный футуролог, с большинством его идей я не согласен, но есть здравые жемчужины) в 2015 году. С тех пор я заразился. Мир стал иным, я увидел возможную точку приложения усилий. Именно благодаря этой лекции и появился перевод Ванневара Буша (As We May Think), и Энгельбарта, и копания истории ИТ, и исследование Palantir (серия статей на Хабре — палантириада) и хабраинтервью с Аланом Кеем, перевод книги «The Dream Machine». Идея стала определяющей в моей жизни.

Задача очень актуальна и волнует многих: Пост m1rko "Моё разочарование в софте" (+443, 263 000 прочтений, 2400 комментов). Это только в России. И с железом тоже все не оптимально: «Время отклика компьютеров: 1977−2017»

Невозможная задача для проекта «Энгельбарт» — «перезагрузить матрицу», «пересобрать» всю область информационных технологий, интернета и компьютерного железа, учитывая все ошибки первой (нынешней версии).

Ближайшие действия — переводы и сбор в одном месте ключевых концептуальных документов и поиск единомышленников (проснись, Нео! То что ты ищешь, тоже ищет тебя.) Под прицелом — Ванневар Буш, Джозеф Ликлайдер, Пол Отлет, Алан Кей, Дуглас Энгельбарт, Глушков, Лебедев, Ершов, WikiPedia, Web Archive, Knol, Quora, Cybersyn, Xanadu, DARPA, IARPA.
Читать полностью »

Суть

Оказывается для этого достаточно запуcтить всего лишь такой набор команд:

git clone https://github.com/attardi/wikiextractor.git
cd wikiextractor
wget http://dumps.wikimedia.org/ruwiki/latest/ruwiki-latest-pages-articles.xml.bz2
python3 WikiExtractor.py -o ../data/wiki/ --no-templates --processes 8 ../data/ruwiki-latest-pages-articles.xml.bz2

и потом немного отполировать скриптом для пост-процессинга

python3 process_wikipedia.py

Результат — готовый .csv файл с вашим корпусом.

Читать полностью »

Исследование обнаружило, что фразы из статей Википедии, касающихся активно развивающихся научных областей, попадают в научные работы

Wikipedia превратилась в источник цитат для научных работ, хотя учёные не ссылаются на неё - 1

Википедия решает застольные споры и спасает тех, кто пытается схитрить на вечере эрудиции. Быстро: в какой стране берёт начало Нил? В каком году Гершвин написал "Рапсодию в стиле блюз"? В Википедии можно найти ответы на все подобные вопросы – включая и научные.

В Википедии содержатся сотни тысяч научных статей, и она предоставляет способ быстро сослаться на молекулярную формулу "Золофта", изобретателя 3D-принтера и то, что теории тектонических плит всего около 100 лет. Этот сайт – золотая жила для любителей науки, научных блогеров и самих учёных. Но хотя учёные и используют Вики, они не спешат в этом признаваться. Сайт редко попадает в список цитат, как источник, допустим, истории изучения оси мозг-кишечник или химической формулы поливинилхлорида.
Читать полностью »

«Один из самых важных уроков, который я узнал благодаря Википедии, заключается в том, что есть огромное количество людей, рвущихся сделать что-либо.»
— Джимми Уэйлс, со-основатель Википедии

Интервью 2014 года.

Вопрос: Что вдохновило вас на создание Википедии?

Ответ: Я наблюдал за ростом свободного программного обеспечения и программного обеспечения с открытым исходным кодом. Я видел, как программисты со всего света сотрудничают друг с другом, чтобы построить замечательное программное обеспечение, на котором держится интернет: GNU/Linux, Apache, Perl, MySQL, PHP.

Фундаментальные инструменты, которые люди использовали, чтобы создать сеть, были проектами с открытым исходным кодом и, по большей части, написаны волонтерами.

Это заставило меня задуматься над тем, что еще можно создать таким образом.

У нас была замечательная возможность. Благодаря интернету мы можем легко общаться друг с другом. Так что же можно создать?

Я додумался до идеи энциклопедии. Я решил, что мы можем собрать всех людей вместе и предоставить бесплатную энциклопедию абсолютно каждому человеку на этой планете на его родном языке.

Я загорелся этой идеей, и вот что мы имеем сейчас.

В: Когда это было?
Читать полностью »

Тысячная избранная статья. Как устроено рецензирование в Википедии - 1

21 апреля русская Википедия выбрала свою тысячную по счету Избранную статью: Двадцать восемь панфиловцев. Так выпало, что писал её, в основном, я. Интересно, что после этого я получил много вопросов о том, по каким критериям выбираются статьи. Пользуясь случаем, хотелось бы рассказать о том, как устроено общественное рецензирование в этом потрясающем краудсорсинговом проекте и как можно поднять свой уровень критического мышления, участвуя в написании энциклопедии.

А давайте ее удалим?

Сначала кто-то пишет маленькую статью, а кто-то другой сразу выставляет ее на удаление. Например, потому что она маленькая. Или потому что она по неактуальной теме.
Создается раздел обсуждения, такой как вот этот.

Обсуждение является не голосованием, а, скорее, дискуссией. Участники ругаются, апеллируя к правилам. Подводящий итоги (судья) взвешивает доводы за и против. Если принимается решение страницу оставить, об этом появляется соответствующая плашка на ее страничке обсуждения. После этого выставить на удаление статью становится значительно сложнее.

Читать полностью »

О чём хорошие боты спорят в Википедии - 1

В августе 2011 года Игорь Лабутов и Джейсон Йосински, два аспиранта Корнелльского университета, запустили пару чат-ботов напротив друг друга. Начав с простого приветствия, разговор ботов быстро превратился в словесную перепалку с обвинениями и спором о Боге. Первая беседа представителей ИИ завершилась конфликтом.

На страницах Википедии война правок уже давно ведётся с привлечением слабого ИИ, но иногда даже «хорошие» боты вступают в бесконечный конфликт.
Читать полностью »