Рубрика «Статистика в IT»

«Яндекс» отчитался о выручке за 2019 год, которая составила почти 175,4 млрд рублей - 1

14 февраля 2020 года российская поисковая система и интернет-портал «Яндекс» обнародовал неаудированные финансовые результаты за четвертый квартал 2019 года и 2019 год.

Выручка «Яндекса» в четвертом квартале 2019 года составила 51,7 млрд рублей и выросла на 33% по сравнению с аналогичным показателем за четвертый квартал 2018 года. Консолидированная выручка «Яндекса», без учета сервиса «Яндекс.Маркет», выросла по сравнению с 2018 годом на 39% и составила 175,4 млрд рублей.

Размер скорректированной чистой прибыли компании за 2019 год составил 23,5 млрд рублей, что на 6% больше, чем за 2018 год.
Читать полностью »

Подборка графиков и результатов различных исследований c короткими аннотациями от автора Телеграм канала Groks.

Подборка занимательных статистических фактов #4 - 1

Занимательная инфографика про триллионную экономику смартфонов. Продажи самих телефонов составляют почти половину всех доходов. На покупку приложений приходится четверть от этой суммы, на рекламу — ещё больше. Аксессуары к телефонам добавляют 16% их стоимости. Доля музыки больше таковой у видео.
Читать полностью »

Как изменилась структура российского (постсоветского) общества с середины XX века. Спойлер: она изменилась кардинально.

Поделиться моими исследованиями половозрастной пирамиды России с общественностью посоветовали мои знакомые и друзья. Некоторые из них утверждают, что в исследованиях есть научная ценность. Хотя я не демограф, а просто любопытный программист.
Читать полностью »

Визуальная теория информации (часть 2) - 1

Вторая часть перевода лонгрида посвященного визуализации концепций из теории информации. Во второй части рассматриваются энтропия, перекрестная энтропия, дивергенция Кульбака-Лейблера, взаимная информация и дробные биты. Все концепции снабжены прекрасными визуальными объяснениями.

Для полноты восприятия, перед чтением второй части, рекомендую ознакомиться с первой.

Читать полностью »

Визуальная теория информации (часть 1) - 1

Перевод интересного лонгрида посвященного визуализации концепций из теории информации. В первой части мы посмотрим как отобразить графически вероятностные распределения, их взаимодействие и условные вероятности. Далее разберемся с кодами фиксированной и переменной длины, посмотрим как строится оптимальный код и почему он такой. В качестве дополнения визуально разбирается статистический парадокс Симпсона.

Теория информации дает нам точный язык для описания многих вещей. Сколько во мне неопределенности? Как много знание ответа на вопрос А говорит мне об ответе на вопрос Б? Насколько похож один набор убеждений на другой? У меня были неформальные версии этих идей, когда я был маленьким ребенком, но теория информации кристаллизует их в точные, сильные идеи. Эти идеи имеют огромное разнообразие применений, от сжатия данных до квантовой физики, машинного обучения и обширных областей между ними.

К сожалению, теория информации может казаться пугающей. Я не думаю, что есть какая-то причина для этого. Фактически, многие ключевые идеи могут быть объяснены визуально!

Читать полностью »

Время отчётности в Excel стремительно уходит — тренд на удобные инструменты представления и анализа информации виден во всех сферах. Мы давно обсуждали внутри цифровизацию построения отчётности и выбрали систему визуализации и self-service аналитики Tableau. Александр Безуглый, руководитель отдела аналитических решений и отчётности Группы «М.Видео-Эльдорадо», рассказал об опыте и итогах построения боевого дашборда.

Скажу сразу, не все, что было задумано, удалось реализовать, но опыт был интересный, надеюсь, он будет полезен и вам. А если у кого-то возникнут идеи, как можно было сделать лучше – буду очень признателен за советы и идеи.

Tableau в рознице, реально? - 1

Под катом о том, с чем мы столкнулись и о чем узнали.
Читать полностью »

Хабра-анализ: когда лучше публиковать свой пост? - 1
Вы ведь заходите на Хабр больше одного раза в день? Не чтобы прочитать что-то полезное, а просто пролистать главную в поисках "чего бы добавить в список на прочитать позже"? Когда-то замечали, что посты, опубликованные посреди ночи, собирают меньше просмотров и рейтинга, чем дневные? А что скажете о публикациях, вишедших посреди выходных?

Когда я опубликовал предыдущий пост-анализ о зависимости показателей публикации от её длины, Exosphere в комментариях сказала, что "есть некоторая связь времени выхода и показателей публикации (но также корелляция слабая)". Вы ведь понимаете, что я не мог пройти мимо?

Итак, важно ли публиковаться на Хабре с 09:00 до 18:00? Или может только во вторники? А что скажете о дне после зарплаты? Период отпусков? Ну, вы поняли. Сегодня попробуем узнать временной рецепт лучшей публикации на свете.

Читать полностью »

Подборка графиков и результатов различных исследований c короткими аннотациями от автора Телеграм канала Groks.

Подборка занимательных статистических фактов #3 - 1

Только одна компания среди крупнейших дебютантов на бирже в этом году прибыльная. Котировки 10 из 14 технологических компаний, совершивших IPO в 2019 году, упали с первого дня открытия торгов. И все компании, кроме Zoom, планово убыточные. Причём у некоторых расходы почти в два раза превышают доходы.
Читать полностью »

Хабра-анализ: важна ли длина публикации? - 1
Вы ведь знаете, что Хабр — это вам не одна популярная социальная площадка с ограничением на длину публикации в 280 символов? И хотя периодически появляются посты длиной в один абзац, они достаточно редко встречают одобрение от вас, Хабра-жители.

Сегодня мы узнаем, правда ли, что длинные публикации более популярны, а короткие — наоборот. Или снова наоборот? В общем, есть ли на Хабре дискриминация по длине статьи.

Итак, 5 самых популярных хабов из раздела "Разработка". Все профильные, у всех по более чем 100 000 подписчиков. Что же они могут нам рассказать? Приступим!

Читать полностью »

image

  • 42 миллиарда посещений за год. В среднем 115 миллионов посещений в день. Это больше чем население Канады, Австралии, Польши и Нидерландов вместе взятых.
  • 6,83 миллиона новых видео загружено за год. 1,36 млн часов = 169 лет контента.
  • 6,597 экзабайт данных передано за год, это примерно 18 петабайт в день, 209 гигабайт в секунду. (Если это всё залить на жесткие диски, то высота будет выше 100км.)
  • 70 миллионов сообщений послали пользователи друг другу.
  • 11,5 миллиона комментариев к видео.
  • 98 000 новых моделей присоединились к ресурсу.
  • Самые популярные темы: «japanese», «hentai», «lesbian» .
  • Самые активные страны: США, Япония, Британия (Россия на 18 месте).
  • Среднее время, проведенное на сайте — 10 минут 28 секунд. (Самые долгие в Тайланде: 11 минут 21 сек, а русские еле попали в 20-ку со своими 8 минутами и 35 секундами.)
  • Самое популярное время — полночь.
  • Самый популярный день — воскресенье.
  • Самый непопулярный день — пятница.
  • Средний возраст посетителей — 36 лет.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js