Рубрика «Статистика в IT» - 19

Цена изменений: во сколько на самом деле обойдется переработка кода

2018-12-26 в 11:23, admin, рубрики: Wirex, Блог компании Wirex, дедлайн, оценка времени, оценка стоимости проекта, оценка трудозатрат, Программирование, сроки, Статистика в IT, управление разработкой

Автор этого материала делится способом оценки времени, которое будет затрачено на переписывание уже внедренного проекта.

Цена изменений: во сколько на самом деле обойдется переработка кода - 1

По мере разрастания кода работать с ним становится все труднее. Годы разработки и отлавливания багов приводят к желанию перечеркнуть все и начать с чистого листа. Действительно, очень заманчива мысль о том, чтобы оставить ошибки в прошлом, вооружиться новыми технологиями и на этот раз все сделать правильно. Однако перед прыжком в бездну я все же предлагаю внимательнее присмотреться к реальной стоимости этого шага.

Модель оценки объема работ

Вы можете свести в один список все фичи своего приложения, а после оценить этапы и приблизительное время их переработки. Большинство именно так и поступает перед тем, как приступить к работе. Но почему тогда на практике выходит, что подобные проекты занимают в 4, 8 или даже 10 раз больше времени, чем разработчики заложили на старте?

Читайте также

Публикация о временных затратах на написание программного кода, которая пригодится при оценке объема работ: «Правило 10:1 в программировании и писательстве»

Есть три ключевых фактора, которые существенно растягивают процесс. И обычно при оценке затрат их игнорируют. Речь идет о
1) необходимости наверстать разницу между уровнями текущего и нового приложений,
2) объеме непредусмотренных изменений,
3) улучшениях, которые придется сделать, чтобы пользователи захотели перейти на новое приложение.

Цена изменений: во сколько на самом деле обойдется переработка кода - 2

Сокращение разницы

Первый фактор — новому приложению необходимо догнать текущее.Читать полностью »

Хабраутилита для сбора хабрастатистики в хабраблогах

2018-12-25 в 7:49, admin, рубрики: java, open source, opensource, открытый исходный код, парсинг контента, Статистика в IT, унылое отсутствие API, хабрахабр, Хабрахабр API

Новый год — время подводить итоги. И если вы ведёте блог на хабре, или вам интересно посмотреть статистику по чьему-нибудь чужому блогу — то вам может пригодиться моя опенсорсная утилитка.

Читать полностью »

Выводы о будущем ритейла после «черной пятницы»

2018-12-05 в 11:19, admin, рубрики: black friday, e-commerce, Wirex, Блог компании Wirex, мобильные устройства, онлайн-ритейл, онлайн-шоппинг, платежные системы, смартфон, Статистика в IT, финансы в IT

«Черная пятница» для онлайн-ритейла была очень продуктивной.

Ностальгия по-прежнему приводила потребителей в обычные магазины. Но не за выгодными предложениями, а больше ради той неповторимой атмосферы скидок и праздничного настроения, по-настоящему ощутить которую можно только в пышно украшенных моллах.

Но в этом году миллионы людей оставили машину в гараже и воспользовались выгодными акциями, не вставая с дивана. Компания Adobe провела анализ 80 из 100 наиболее популярных интернет-ритейлеров и выяснила, что в период между Днем благодарения и концом «черной пятницы» потребители со своих смартфонов сделали покупки на общую сумму в 2 млрд долларов.

С любым другим днем для шопинга «черную пятницу» объединяет то, что большая часть потребителей, как обычно, были в поиске выгодных предложений и удобного покупательского опыта, для чего активно пользовались смартфонами.

Шопинг на кончиках пальцев

Согласно данным проведенного в 2016 году исследования, люди берут смартфон в руки 2617 раз в день, то есть почти каждые 33 секунды.

Тогда эта статистика казалась удивительной. Сейчас она не только вполне правдоподобна, но и указывает на важность мобильных устройств в решении повседневных пользовательских задач. Смартфоны стали катализатором, который каждые 33 секунды ускоряет стирание грани между онлайн и офлайн-мирами как для потребителей, так и для бизнеса.

Влияние мобильных устройств сильнее всего ощущается в процессах поиска и покупки желаемых товаров. Второе ежегодное исследование аналитической группы PYMNTS, проведенное совместно с Visa, позволяет оценить скорость и энтузиазм, с которыми потребители впускают в свою жизнь новые интернет-устройства и сценарии, делающие шопинг более контекстным.Читать полностью »

Алгоритм резервуарной выборки

2018-11-30 в 12:30, admin, рубрики: c++, Reservoir sampling, Алгоритмы, Блог компании Инфопульс Украина, Спортивное программирование, Статистика в IT

Резервуарная выборка (eng. «reservoir sampling») — это простой и эффективный алгоритм случайной выборки некоторого количества элементов из имеющегося вектора большого и/или неизвестного заранее размера. Я не нашел об этом алгоритме ни одной статьи на Хабре и поэтому решил написать её сам.

Итак, о чём же идёт речь. Выбрать один случайный элемент из вектора — это элементарная задача:

auto result = vect[rand() % vect.size()]; // С++

Задача «вернуть K случайных элементов из вектора размером N» уже хитрее. Здесь уже можно ошибиться — например, взять K первых элементов (это нарушит требование случайности) или взять каждый из элементов с вероятностью K/N (это нарушит требование взять ровно K элементов). Кроме того, можно реализовать и формально корректное, но крайне неэффективное решение «перемешать случайно все элементы и взять K первых». И всё становится ещё интереснее, если добавить условие того, что N — число очень большое (нам не хватит памяти сохранить все N элементов) и/или не известно заранее. Для примера представим себе, что у нас есть какой-то внешний сервис, присылающий нам элементы по одному. Мы не знаем сколько их придёт всего и не можем сохранить их все, но хотим в любой момент времени иметь набор из ровно K случайно выбранных элементов из уже полученных.

Алгоритм резервуарной выборки позволяет решить эту задачу за O(N) шагов и O(K) памяти. При этом не требуется знать N заранее, а условие случайности выборки ровно K элементов будет чётко соблюдено.
Читать полностью »

Исследование IFR: количество промышленных роботов в России по-прежнему ничтожно

2018-11-28 в 7:14, admin, рубрики: ITIF, промышленные роботы, робототехника, Статистика в IT

Исследование IFR: количество промышленных роботов в России по-прежнему ничтожно - 1
Количество роботов на 10 000 работников в 2017 году. Источник: ITIF

Россия опять заняла одно из последних мест в мировом рейтинге роботизации производства. Ежегодно такие рейтинги выпускает Международная федерация робототехники (IFR) для Фонда информационных технологий и инноваций (ITIF). Рейтинг включает в себя количество промышленных роботов на 10 000 производственных рабочих в стране.

Согласно информации, опубликованной IFR в Фонде информационных технологий и инноваций (ITIF), средний мировой показатель в 2017 году составил 85 роботов на 10 000 работников. Это на 15% больше, чем в прошлом году.
Читать полностью »

Правдоподобия, P-значения и кризис воспроизводимости

2018-11-19 в 6:59, admin, рубрики: байесовские методы, математика, математическая статистика, Научно-популярное, статистика, Статистика в IT

Или: Как переход от публикации P-значений к публикации функций правдоподобия поможет справиться с кризисом воспроизводимости: личное мнение Элиезера Юдковского.

Если Монро нарисовал комиксы про 75% существующих интересных проблем, а четверть моих статей интересные, то какова вероятность, что рано или поздно мне придётся искать КДПВ где-то ещё?

Комментарий переводчика: Юдковский, автор HPMOR, создатель Lesswrong и прочая и прочая, изложил свою позицию по поводу пользы байесовской статистики в естественных науках в форме диалога. Прямо классический такой диалог из античности или эпохи возрождения, с персонажами, излагающими идеи, обменом колкостями вперемешку с запутанными аргументами и неизбежно тупящим Симплицио. Диалог довольно длинный, минут на двадцать чтения, но по-моему, он того стоит.

Дисклеймеры

Этот диалог был написан сторонником байесовского подхода. Реплики Учёного в нижеприведённом диалоге могут и не пройти идеологический тест Тьюринга на фреквентизм. Возможно, что они не отдают должное аргументам и контраргументам сторонников частотного подхода к вероятности.
Автор не рассчитывает, что описанные ниже предложения будут приняты широким научным сообществом в ближайшие десять лет. Тем не менее, это стоило написать.

Если вы ещё не знакомы с правилом Байеса, на сайте Arbital есть подробное введение.

Модератор: Добрый вечер. Сегодня в нашей студии: Учёный, практикующий специалист в области… химической психологии или чего-то типа того; его оппонент Байесовец, который намерен доказать, что кризис воспроизводимости в науке можно как-то преодолеть с помощью замены P-значений на что-то из Байесовской статистики…
Студент: Извините, как это пишется?
Модератор:… и, наконец, ничего не понимающий Студент справа от меня.
Читать полностью »

Mail.Ru назвала «абсурдным» рейтинг сайтов от «Яндекса» и требует удалить из него свои бренды

2018-11-13 в 8:07, admin, рубрики: Исследования и прогнозы в IT, медийная реклама, рейтинг, Статистика в IT, Управление медиа, Яндекс. Mail.ru

Mail.Ru назвала «абсурдным» рейтинг сайтов от «Яндекса» и требует удалить из него свои бренды - 1 Вчера компания «Яндекс» запустила проект «Яндекс.Радар» — рейтинг самых популярных ресурсов в рунете, который строится по математический модели на основании агрегированных данных «Яндекс.Браузера». При желании площадки могут подключать данные из «Яндекс.Метрики», чтобы добавить в статистику демографические данные по аудитории и др.

Новый сервис понравился не всем. Главный конкурент «Яндекса» в российском сегменте Mail.Ru сразу же заявил о недоверии этой метрике и попросил убрать из рейтинга свои сайты.

Mail.Ru считает, что «Яндекс» сам является игроком рекламного рынка, и поэтому ему некорректно вести такой рейтинг. Кроме того, он заведомо неправильно отражает аудиторию сайтов, поскольку опирается на данные «Яндес.Браузера». То есть завышенные показатели будут у сайтов, где высока доля пользователей «Яндекс.Браузера». Очевидно, что это лояльные «Яндексу» ресурсы.

На иллюстрации: топ-10 самых популярных сайтов рунета по версии «Яндекса» за период с 1 по 9 ноября 2018 года (в млн). Синим обозначены сайты, которые предоставили свои данные, красным — оценка математической модели «Яндекса»
Читать полностью »

Анализ потребительского чека: что покупают на Amazon

2018-11-06 в 12:20, admin, рубрики: alexa, amazon, amazon pay, ecommerce, Wirex, анализ покупательских корзин, Блог компании Wirex, платежные системы, покупки, потребительское поведение, Статистика в IT, финансы в IT, электронная коммерция

В 2009 году потребители стали использовать выражение «целая зарплата» для ироничного описания ценового шока после покупок в Whole Foods — сети бакалейных магазинов с качественными натуральными продуктами, которую приобрела компания Amazon в июне 2017 года за 13,7 млрд долларов.

В 2018 году этой фразой можно смело описывать ту долю потребительских расходов и розничных продаж в целом, которую Amazon завоевала вместе с расширением своей экосистемы.

Конечно, есть разница: сеть Whole Foods вызвала такой отклик из-за своих высоких цен, в то время как покупки в Amazon отвоевывают большую часть зарплаты потребителей из-за приемлемой стоимости товаров, быстрой доставки и отличного сервиса. Иными словами, покупателям нравится Amazon.

Аналитическая группа PYMNTS провела подробное исследование и определила, что на покупки в Amazon потребители тратят в среднем до 2,1% годовой зарплаты. Так, семья, зарабатывающая около 63 тыс. долларов в год, отдает Amazon 1320 долларов. Показатели среднегодовых расходов в 2018 году спрогнозированы на основе данных Бюро трудовой статистики США за 2014–2017 годы.

В основном это связано с тем, что потребители стали чаще приобретать через Amazon товары повседневного спроса. Расходы на еду, одежду, электронику, мебель и товары для ухода за здоровьем занимают до 31% от общей суммы покупок.

По подсчетам аналитиков, сегодня на покупки в Amazon приходится 1243 (или 6,4%) из 19 556 долларов, расходуемых средней американской семьей на товары перечисленных категорий.

За последние четыре года этот показатель увеличился втрое — с 2,2% в 2014 году до 6,4% в 2018 году, а среднегодовой темп роста составил 30,7%.Читать полностью »

Голосовые помощники за рулем автомобиля: за кем будущее

2018-10-22 в 12:11, admin, рубрики: alexa, amazon, Bixby, google assistant, siri, Wirex, Блог компании Wirex, голосовая система, голосовое управление, голосовой помощник, искусственный интеллект, платежные системы, Статистика в IT, экосистема

До появления Alexa, Bixby, Siri и Google Assistant была Эмма Нут.

Эмма Нут

Голосовые помощники за рулем автомобиля: за кем будущее - 2

Эмма родилась в 1860 году в маленьком городке штата Мэн, а в 1878 году Александр Грейам Белл принял ее на работу и сделал первой в истории женщиной-оператором телефонной станции.

Первые телефоны, изобретенные Беллом, продавались парами и могли созваниваться только друг с другом. Белл понимал, что для роста продаж и широкого распространения телефонов необходимо создать сеть, позволяющую соединять разных телефонных пользователей. Уровень развития технологий в то время еще не позволял автоматизировать этот процесс, поэтому для реализации идеи Беллу понадобились люди, которые выполняли бы подобные подключения вручную.

Сначала для этой цели наняли группу мальчиков. Они перехватывали звонки, поступившие на центральный коммутатор, и спрашивали у звонившего, с кем его соединить. Перемещаясь по комнате, от пола до потолка покрытой коммутационными щитами, они переключали провода. Решение оказалось неидеальным. Мальчишки часто были невежливы с клиентами и устраивали розыгрыши, на фоне которых даже их ловкость и проворство переставали казаться преимуществом.

Тогда Белл решил, что женщины лучше подойдут для этой роли.

Соискательниц подбирали длинноруких (из-за высоты коммутационных панелей) и незамужних, так как работа была круглосуточной. Чтобы воплотить такой график в реальность, Белл решил устанавливать коммутационные щиты в дома своих работниц.

И первым его сотрудником стала Эмма Нут в 1878 году.

Как вскоре выяснилось, это была гениальная идея, ставшая поворотным моментом в истории телефонии.
Читать полностью »

Считаем статистику по экспериментам на hh.ru

2018-10-10 в 9:38, admin, рубрики: Hadoop, Hive, presto, Zeppelin, аналитика, Блог компании HeadHunter, веб-аналитика, Статистика в IT, Управление продуктом

Всем привет!

Сегодня я расскажу вам, как мы в hh.ru считаем ручную статистику по экспериментам. Мы посмотрим откуда появляются данные, как мы их обрабатываем и на какие подводные камни натыкаемся. В статье я поделюсь общими архитектурой и подходом, реальных скриптов и кода будет по минимуму. Основная аудитория — начинающие аналитики, которым интересно, как устроена инфраструктура анализа данных в hh.ru. Если данная тема будет интересна — пишите в комментариях, можем углубиться в код в следующих статьях.

О том, как считаются автоматические метрики по АБ-экспериментам, можно почитать в нашей другой статье.