- PVSM.RU - https://www.pvsm.ru -

«Секреты» существования Всезнайки

Википедия – один из 10 лидирующих сайтов в мире. Она имеет около 500 млн уникальных посетителей в месяц [1]. Это порядка 200 запросов каждую секунду! Википедия целиком и полностью некоммерческая структура, пожертвования – ее основной способ финансирования. Это значит, что MediaWiki [2], лежащая в основе Википедии, не только держит сайт в топе, но и делает это на очень скромные средства. И потому во главу угла ставится работа над производительностью, кэшированием и оптимизацией.

«Секреты» существования Всезнайки - 1

«Простои серверов – наш излюбленный способ заработка, — шутит инженер по производительности Википедии, Дома Митузас (Domas Mituzas), — фишка в том, что пока серверы недоступны, на страницу выводится просьба о пожертвовании на новое оборудование. Будучи наиболее востребованной некоммерческой структурой, Википедия являет собой показательный пример высокоэффективности работы веб-сайта. В то время, как Google и Microsoft могут потратить полмиллиарда долларов на строительство дата-центра, Википедия спокойно располагается на скромном количестве серверов в ЦОДах городов Тампа и Ашберн. Также есть серверы в Сан-Франциско и Амстердаме.

«Секреты» существования Всезнайки - 2

«Традиционный подход к доступности сайта – не совсем наш выбор, — высказался Митузас на конференции O’Reilly Velocity [3], — и я не говорю, что вам следует поступать также. Но потеря нескольких секунд не критична для нашего дела. И пока мы ни столкнемся с серьезными сложностями, никаких проблем не будет».

«Секреты» существования Всезнайки - 3

И пусть инженеры Википедии не слишком серьезные люди, к своей работе они относятся очень серьезно. В соответствии с принципами Википедии, где признается приоритет общества над коммерцией (на сайте мы не встретим рекламы!), ресурс получает хороший доход от пожертвований. Википедия поддерживает практически 100% доступность. И это еще не все ошеломляющие цифры [4]:

  • 23,130 млн зарегистрированных пользователей;
  • 34,246 млн страниц (английская версия);
  • 8,790 млн просмотров в час (английская версия);
  • 4,701 млн статьей (английская версия).

Также, кому интересно, доступна интерактивная статистика [5], где можно найти данные по разным версиям Википедии, в том числе и русской.

«Секреты» существования Всезнайки - 4

Сайт появился в 2001 г и работал на скрипте CGI Perl, размещаясь на одном сервере. Во второй половине 2000-х годов у Википедии было 200 серверов приложений, 20 серверов с данными и 70 Squid [6] кэш-серверов. На данный момент количество серверов выросло до 885. Работает она на софте MediaWiki, который написан специально для нее, а сейчас уже является проектом с открытым исходным кодом. MediaWiki использует PHP на базе MySQL. В дополнение к Squid, Википедия использует Memcached [7] и балансировщик нагрузки для виртуальных серверов Linux (LVS [8]). Википедия также использует шард-приложения для установки взаимосвязей между базами данных. Больше технических деталей можно получить в презентации [9] Митузаса и Марка Бергсма (Mark Bergsma) из WikiMedia.

«Секреты» существования Всезнайки - 5

Митузас резюмировал свое видение работы Википедии в блоге [10], а именно в посте о презентации Velocity: «Я думаю, в таком контексте Википедия интересна как пример не совсем удачной работы – крохотный бюджет, смелый подход к инфраструктуре, консервативный метод развития, обман и куча дешевых трюков (кэширование, кэширование и еще раз кэширование)».

Пока в интернете будут существовать такой ресурс как Википедия, мы с уверенностью можем сказать за кем будет закреплена первая позиция результатов поиска в не менее эрудированных Google и Яндекс.

Автор: Osaul

Источник [11]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/vikipediya/74601

Ссылки в тексте:

[1] уникальных посетителей в месяц: http://reportcard.wmflabs.org/#core-graphs-tab

[2] MediaWiki: http://www.mediawiki.org/wiki/MediaWiki/

[3] конференции O’Reilly Velocity: http://velocityconf.com/

[4] ошеломляющие цифры: http://stats.wikimedia.org/EN/Sitemap.htm

[5] интерактивная статистика: http://www.wikistatistics.net/wiki/ru

[6] Squid: http://www.squid-cache.org/

[7] Memcached: http://memcached.org/

[8] LVS: http://www.linuxvirtualserver.org/

[9] презентации: http://domasmituzas.files.wordpress.com/2011/09/mysqluc2007-wikipedia-workbook.pdf

[10] блоге: http://dom.as/2008/06/19/wikipedia-at-velocity-conference/

[11] Источник: http://habrahabr.ru/post/243159/