- PVSM.RU - https://www.pvsm.ru -

Когда каждый день как DDOS. Крупнейшие китайские сайты

Вот есть в России VK и Яндекс. Всё у них замечательно, молодцы вообще ребята: и предельно высокая посещаемость, и сложность инфраструктуры, и применяемые технологии, но в мире они не столь популярны. Вот и Китай у большинства любителей, из тех, чей взгляд устремлен в Калифорнию, где каждые 3 месяца появляется hitech-компания в миллиард долларов [1], в картине мира просто отсутствует. Эта страна во многих вопросах, где дело касается количества, необычная, постоянно ведь на слуху города Китая, метро, мосты, порты; так вот я тут — о массивных китайских сайтах. Сравнивать с DDOS как атакой глупо, та совсем разная и она не обыденность, но есть сайты где инфраструктура заточена для миллионов, хотя бы только поэтому они показались мне интересными.

baidu.com

Лидер не только китайского интернета, но и мирового [2] (хотя по некоторым численным показателям это почти синонимы), Baidu находится сразу за Google, Facebook, Youtube и Yahoo. Baidu — это внутренняя замена Google, и поиска и многих-многих других сервисов от карт и википедии до Google Drive (и да, у него есть свой форк Chromium и Android).

Когда каждый день как DDOS. Крупнейшие китайские сайты
А это четвертое поколение Baidu Maps, например

В китайском интернете вот-вот будет половина населения, в сети около 600 млн. пользователей по разным данным. С помощью Baidu ищет подавляющее большинство этой аудитории (83% [3]), что переходит в $500 млн. чистой прибыли в III квартале 2012 [4] и шестнадцать тысяч сотрудников в штате. И бренд есть и всякие красивые офисы, конференции и свой небоскреб, планируемый к 2015.

Когда каждый день как DDOS. Крупнейшие китайские сайты
проект Baidu Science and Technology Campus

У Baidu R&D есть какой-то блог baidu-tech.com со статьями вроде Intelligent algorithm in site quality rating system [5] или очень даже неплохая статья "почему php такой медленный [6]" на китайском. Даже если взять то, что у Baidu нет конкурентов из-за особенности страны, очевидно, что он бы просто не смог функционировать с таким количеством пользователей, не применяя и не пользуясь передовым опытом. Нельзя просто так взять и нанять сто тысяч китайцев, чтобы обслужить много http-запросов.

Например, новый дата-центр [7] Baidu — один из самых больших в мире (по количеству инвестиций в 1.6 миллиарда самый). 700,000 CPU на 120 тысячах квадратных метров. Построен будет [8] вроде как на инфрастуктуре opencompute.org, рожденного в фейсбуке. Но даже сейчас у них сотни дата центров и CDN нод по всему Китаю, чтобы обслуживать миллиарды запросов.

На таких CDN крутится как обычно всякая статика и tangram.js [9] один из примеров, это такая jquery-подобная javascript библиотека для разработки фронтенда, «эффективная и надежная». И как у jquery есть jquery UI, так и тут имеется Magic [9]. А сам tangram из примеров выглядит знакомо, и понятно почему заимствует стиль всем известного API:

function request() {
	baidu.ajax({
		url: '../../demos/baidu.ajax()/sleep.php',
		type: 'POST',
		data: {
			time: baidu.dom('#sleep-time').val()
		},					
		async: baidu.dom('#chk-async').attr('checked') === 'checked',

		success: function(responseText){
			baidu.dom('#status').html(responseText);
		}
	});
}

baidu.dom('#request').on('click', function(){ baidu.dom('#status').html('...');setTimeout(request, 50);});

Baidu поисковый гигант в первую очередь. Он спонсор [10] распределенного хранилища HyperTable, клона BigTable. Утверждается, что HyperTable значительно быстрее [11] HBase II на всех тестах, кроме случайного чтения равномерно распределенных ключей (the random read uniform test), где они на равных.

taobao.com

Китайский Amazon, хоть пока и уступающий в списке Alexa Top Sites [12] оригиналу одну позицию (#11), но со строго положительной динамикой. Полмиллиарда зарегистрированных пользователей, 213 млн. из которых посетили сеть taobao.com всего 24 часа. Представьте себе что такое интернет магазин: это много статики, страницы с несколькими десятками изображений (как например эта [13]), пользовательскими сессиями, процессами заказа и оформления товаров, алгоритмами рекомендации. 11 ноября на сайте этой сети tmall.com была распродажа, зафиксировавшая 10 млн. посетителей [14], пришедших за первую минуту, купившие за сутки товара на 3 миллиарда долларов. Всю эту статистику, кстати, выложили в китайский же аналог твиттера, weibo, в виде инфографики, которая очень даже забавная [15].

Когда каждый день как DDOS. Крупнейшие китайские сайты
Снова PHP на главной странице, www.taobao.com/index_global.php [16]

Однако php здесь только на фронтенде. Бизнес-логика написана на Java и судя по всему частично на Lua (иначе зачем модуль ngx_lua). Код многих вещей открыт code.taobao.org [17] и можно видеть как связано одно с другим.

У taobao весьма интересный веб-сервер с открытым исходным кодом — tengine [18]. Например, там есть динамическая загрузка модулей без перезапуска сервера, встроенный файрволл, ngx_lua, конкатенация статики nginx-http-concat [19] ( когда-нибудь и ngx_pagespeed [20] выйдет из альфы). Или распределенная файловая система TFS [21] (как обычно в таки случаях high availability, high performance and low cost), также доступная под GPL 2.0. В README svn-репозитария даже предлагают присоединится к разработке.

В 2010 году поисковый гигант Baidu и японский Rakuten вложили $50 млн [22]. в свой гигантский интернет-молл, но, не выдержав конкуренции, в 2012 его закрыли [23].

weibo.com

Ставший уже культовым, китайский аналог твиттера, который к слову даже в чем-то превосходит своего американского собрата. Недавний пик твиттера во время выборов — 327,452 сообщений в минуту [24], у weibo.com ещё в начале нового 2012 года было 481,207 [25]. Вообще weibo обозначает микроблог, а в Китае помимо собственно Sina Weibo (http://weibo.com), есть и Tencent Weibo (http://t.qq.com/), и Netease (http://163.com). И это не просто копии, у каждой из них своя большая аудитория, по итоговому количеству зарегистрированных пользователей [26] у Sina 368 миллионов, у Tencent 469, у Netease Weibo 200 млн. Дневная активная аудитория приблизительно в десять раз меньше. Twitter больше с некоторыми оговорками — 500M+ пользователей, из которых активных 170M (techcrunch [27]).

В Китае судя по всему очень мало хипстерского, академического и гиковского, но очень много разного php. Вот, например, один из ведущих разработчиков PHP core team перешел [28] из Baidu в Sina Weibo.

Когда каждый день как DDOS. Крупнейшие китайские сайты
Свежий октябрьский редизайн Sina Weibo

Sina Weibo не только богата возможностями для пользователями, но и довольно современна технологически. Согласно блогу другого разработчика (http://timyang.net/) первая версия weibo была полностью построена на стандартном стеке LAMP (MyISAM). Вторая уже была архитектурно разделена на несколько слоев, использовала асинхронные сообщения, memcachedq, innodb в MySQL. Позднее weibo начинает использовать в больших количествах Redis, Percona, обработку падений, для каждого из слоев свое api, в презентации приводятся многие-многие тонкости, например в json-сериализации в java, бенчмарки. А ведь на подходе пятая версия. Презентации с www.qconbeijing.com/2011/ [29] сложно понимать, хоть и очень хочется, потому что они на китайском и не переводятся на английский так легко, как обычные страницы.

qq.com

Девятый в рейтинге Alexa, один из самых посещаемых интернет-порталов Китая принадлежит Tencent Holdings. Пик одновременно подключенных к QQ Messenger пользователей больше 100 миллионов пользователей [30] (Skype в октябре достиг только 45M [31]). Протокол QQ protocol закрыт, но reverse инжиниринг решает, поэтому поддержка есть во многих мессенджерах. Причем 30 млн. пользователей QQ-сервисов — пользователи с платными аккаунтами [32].

Tencent, как упомянуто выше, также имеет и самый большой по количеству пользователей аналог твиттера, или, например, PaiPai.com — аналог аукциона ebay.

Qzone.qq.com просто поражает воображение. Это 700 млн социальная сеть. В неё загружают по 200-300 млн. фотографий [33] в день, половина из которых — через мобильный клиент. Показатели сравнимые с Facebook.

yooku.com, renren, kaixin и другие

yooku.com — замена для Youtube. Есть свои сервисы и Baidu, и у Tencent. У каждого по несколько сотен миллионов [34] часов просмотров за август, но Yooku всё равно самый крупный. У него недельная аудитория в 310 миллионов уникальных посетителей [35] (у Youtube месячная аудитория 800M [36]).

Понятно, что какую бы нишу сайт не занимал, если он находится вверху, это автоматически означает миллионы пользователей. Очень надеюсь, кто-нибудь добавит больше конкретики, ведь тему я раскрыл так себе — за счет чего китайцы делают сайты, выдерживающие запредельные нагрузки, только ли за счет своего менталитета, и почему в мире о них так мало разговоров.

Автор: potomushto

Источник [37]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/china/20228

Ссылки в тексте:

[1] появляется hitech-компания в миллиард долларов: http://blog.minming.net/post/35553963889/a-billion-dollar-software-tech-company-is-founded-every

[2] мирового: http://www.alexa.com/siteinfo/baidu.com#

[3] 83%: http://cdn.thenextweb.com/wp-content/blogs.dir/1/files/2012/02/DigimindInfographic-1-520x4188.jpg

[4] в III квартале 2012: http://ir.baidu.com/phoenix.zhtml?c=188488&p=irol-newsArticle&ID=1751298&highlight=

[5] Intelligent algorithm in site quality rating system: http://stblog.baidu-tech.com/?p=104

[6] почему php такой медленный: http://stblog.baidu-tech.com/?p=1343

[7] новый дата-центр: http://www.datacenterdynamics.com/focus/archive/2012/08/china-data-center-roundup-big-cloud-news-big-cloud-players

[8] будет: http://www.datacenterdynamics.com/focus/archive/2012/05/open-compute-merge-facebook%E2%80%99s-custom-rack-specs-baidu%E2%80%99s

[9] tangram.js: http://tangram.baidu.com/magic/

[10] спонсор: http://www.hypertable.org/pr/BaiduSponsorship.html

[11] быстрее: http://hypertable.com/why_hypertable/hypertable_vs_hbase_2/#conclusion

[12] Alexa Top Sites: http://www.alexa.com/topsites

[13] как например эта: http://yilaishenshou90hou.taobao.com/?spm=0.0.0.168.9VnuHK

[14] 10 млн. посетителей: http://westiseast.co.uk/blog/taobao-sales-19-billion-bonanza/

[15] очень даже забавная: http://e.weibo.com/1768198384/z4Oktu59i?ref=http%3A%2F%2Fe.weibo.com%2Ftmall%3Fref%3Dhttp%253A%252F%252Fwww.weibo.com%252Fu%252F1748121853

[16] www.taobao.com/index_global.php: http://www.taobao.com/index_global.php

[17] code.taobao.org: http://code.taobao.org

[18] tengine: http://tengine.taobao.org/

[19] nginx-http-concat: https://github.com/taobao/nginx-http-concat

[20] ngx_pagespeed : https://github.com/pagespeed/ngx_pagespeed

[21] TFS: http://code.taobao.org/p/tfs/src/

[22] вложили $50 млн: http://techcrunch.com/2010/01/27/baidu-rakuten/

[23] закрыли: http://www.marketing-interactive.com/news/32430

[24] 327,452 сообщений в минуту: http://blog.twitter.com/2012/11/election-night-2012.html

[25] 481,207: http://www.donews.com/net/201201/1073641.shtm

[26] итоговому количеству зарегистрированных пользователей: http://www.techinasia.com/netease-weibo-260-million-users-numbers/

[27] techcrunch: http://techcrunch.com/2012/07/31/twitter-may-have-500m-users-but-only-170m-are-active-75-on-twitters-own-clients/

[28] перешел: http://www.venturedata.org/?i440286_PHP-only-Chinese-official-team-has-joined-Sina-microblogging-worked-at-Baidu

[29] www.qconbeijing.com/2011/: http://www.qconbeijing.com/2011/

[30] 100 миллионов пользователей: http://www.techxav.com/2010/03/07/qq-msn/

[31] 45M: http://techcrunch.com/2012/10/14/skype-reaches-a-45m-concurrent-user-peak-and-what-looks-like-a-new-stage-of-momentum/

[32] пользователи с платными аккаунтами: http://www.techinasia.com/qq-proud-paying-members/

[33] 200-300 млн. фотографий: http://thenextweb.com/asia/2012/08/09/picture-this-chinese-internet-giant-tencents-qzone-social-network-now-hosts-over-150-billion-photos/

[34] по несколько сотен миллионов: http://www.techinasia.com/china-web-video-sites-comscore-august-2012/

[35] в 310 миллионов уникальных посетителей: http://www.techinasia.com/youku-tudou-310-million-weekly-unique-viewers-16-billion-hours-video-month/

[36] 800M: http://www.youtube.com/t/press_statistics

[37] Источник: http://habrahabr.ru/post/158591/