Довольно часто встречаются неполные наборы данных, в которых некоторые переменные не определены. В языке R содержимое таких переменных задается как «Not Available» — или сокращенно NA. Соответственно, возникает вопрос, как поступать с неопределенными значениям: стоит ли их игнорировать или откорректировать каким-либо образом?
Читать полностью »
Рубрика «statistics» - 3
Let’s fix NAs!
2014-02-02 в 0:41, admin, рубрики: data analysis, data mining, statistics, статистика, метки: data analysis, statistics, статистикаПлан обслуживания «на каждый день» – Часть 2: Автоматическое обновление статистики
2014-01-21 в 7:27, admin, рубрики: automatization, maintenance plan, sql, sql server, statistics, Администрирование баз данных, метки: automatization, maintenance plan, sql, sql server, statistics
В предыдущем посте мы рассматривали автоматическое обслуживание фрагментированных индексов. Теперь пришла очередь статистики.
Собственно для чего она нужна?
При выполнении любого запроса, оптимизатор запросов, в рамках имеющейся у него информации, пытается построить оптимальный план выполнения — который будет отображать из себя последовательность операций, за счет выполнения которых можно получить требуемый результат, описанный в запросе.
В процессе выбора той или иной операции, оптимизатор запросов к числу наиболее важных входных данных относит статистику, описывающую распределение значений данных для столбцов внутри таблицы или индекса. Фактически, строится диаграмма распределения с числом элементов по определенному диапазону значений. Такая оценка количества элементов позволяет оптимизатору запросов создавать более эффективные планы выполнения.
Читать полностью »
Хабрастатистика
2013-10-28 в 17:31, admin, рубрики: statistics, Статистика в IT, метки: habrahabr, statistics От делать нечего решил собрать статистику хабра.
Статистика может быть не совсем отражать действительность, т.к. из 199к статей лишь 75к были открытыми, остальные удаленыскрыты в черновикдоступ к публикации закрыт.
Можно предположить, что большая часть отсутствующих статей заминусована.
Собственно, сами данные:
Среднее количество постов в год:

Средние кол. во. комментариев в постах по годам:

За все время: 46.
Средняя оценка постах по годам:

Средняя оценка за все время: 31.
Визуализация статистики использования компьютера с R
2013-01-10 в 14:46, admin, рубрики: data mining, keylogger, linux, python, shiny, sqlite, statistics, анализ данных, метки: keylogger, linux, python, shiny, sqlite, statistics, анализ данных 
Думаю, многим интересно (хотя бы из любопытства), как именно они используют свой компьютер: самые нажимаемые кнопки, пройденное мышью расстояние, среднее время работы и другую информацию. В этой статье я расскажу один из вариантов того, как можно собрать такую информацию и затем представить её в виде интерактивных графиков. Все описанные действия производились на ноутбуке с ОС Debian Wheezy, Python 2.7.3, R 2.15.

Читать полностью »
Каков возраст среднего хаброюзера?
2012-09-25 в 3:32, admin, рубрики: statistics, веб-аналитика, метки: statistics Делать было нечего, решил написать небольшой парсер что бы узнать средний возраст. За основу были взяты данные вконтакта (довольно долгое время на хабре был баннер с темой вступления в группу, следовательно логично предположить что бОльшая часть людей которые есть на сайте записаны и в группу). Но, я не исключаю что многие даже не имеют вконтакта по этому данные не следует брать за абсолютную истину.
Было пропарсено около 80к страниц людей, состоящих в группе, год рождения указан лишь у 22199, что примерно 14 часть.
…
1978 -109 – 0.5%
1979 -134 – 0.6%
1980 -192 – 0.9%
1981 -238 – 1.1%
1982 -273 – 1.3%
1983 -434 – 2.1%
1984 -651 – 3.1%
1985 -867 – 4.1%
1986 -1225 – 5.8%
1987 -1530 – 7.2%
1988 -1941 – 9.2%
1989 -2214 – 10.5%
1990 -2282 – 10.8%
1991 -2150 – 10.1%
1992 -2019 – 9.6%
1993 -1517 – 7.2%
1994 -1142 – 5.4%
1995 -679 – 3.2%
1996 -548 – 2.6%
1997 -409 – 1.9%
1998 -431 – 2.0%
1999 -167 – 0.8%
…
Читать полностью »
«Войны в свободное время 2» или CS сервер + статистика в офисе
2012-08-24 в 10:50, admin, рубрики: counter-strike, linux, statistics, Серверное администрирование, метки: counter-strike, linux, statisticsДоброго времени суток Хабра-сообщество!
После долгих часов игры в BattleField 2, протяженных поездок на танках и джипах, сумасшедших падений на вертолетах и пары сотни метров собранной статистики по всему этому веселью, пришла пора задуматься о террористической обстановке на игровом фронте. Как же там заложники поживают? А не засыпало ли пылью старый, добрый de_dust2?
Сегодня я расскажу вам как установить и настроить игровой сервер Counter-Strike 1.6 и прикрутить к нему локальную статистику игроков. Данная статья является второй из серии «Войны в свободное время».
Предыдущие статьи:
BattleField 2 Ranked Server

Читать полностью »
