Рубрика «математическая статистика» - 2

Cжатие и улучшение рукописных конспектов

2018-03-15 в 11:49, admin, рубрики: EM-алгоритм, HSV, Hue-Saturation-Value, open source, PDF, PNG, python, RGB, Алгоритмы, артефакты JPEG, бинаризация, векторное квантование, евклидово расстояние, квантование цвета, кластерный анализ, математическая статистика, метод k-средних, обработка изображений, сканирование, цветовое пространство

Я написал программу для очистки отсканированных конспектов с одновременным уменьшением размера файла.

Исходное изображение и результат:

Cжатие и улучшение рукописных конспектов - 1
Слева: исходный скан на 300 DPI, 7,2 МБ PNG / 790 КБ JPG. Справа: результат с тем же разрешением, 121 КБ PNG ^[1]

Примечание: описанный здесь процесс более-менее совпадает с работой приложения Office Lens. Есть другие аналогичные программы. Я не утверждаю, что придумал нечто радикальное новое — это просто моя реализация полезного инструмента.

Если торопитесь, просто посмотрите репозиторий GitHub или перейдите в раздел результатов, где можно поиграться с интерактивными 3D-диаграммами цветовых кластеров.
Читать полностью »

RandLib. Библиотека вероятностных распределений на C++17

2017-11-01 в 16:24, admin, рубрики: c++, c++17, open source, randlib, математика, математическая статистика, теория вероятностей

Библиотека RandLib позволяет работать с более чем 50 известными распределениями, непрерывными, дискретными, двумерными, циклическими и даже одним сингулярным. Если нужно какое-нибудь распределение, то вводим его имя и добавляем суффикс Rand. Заинтересовались?
Читать полностью »

Как перестать гадать и начать считать

2017-02-18 в 17:01, admin, рубрики: анализ, аналитика, Аналитика мобильных приложений, веб-аналитика, графики, интернет-маркетинг, маркетинг, математика, математическая статистика, Повышение конверсии, статистика, теория вероятностей, трафик

Привет всем, меня зовут Чудинов Денис и сегодня мы будем искать математику в веб-аналитике.
Трафик, из всех физических явлений, является достаточно сложным с точки зрения природы процесса, так как, насколько мне известно, еще никто не сформулировал математические законы, описывающие трафик. Тем не менее, попробуем применить элементарные методы теории вероятности и математической статистики для формализации и оценки правдоподобия наших суждений.
Читать полностью »

Статистика для математика

2016-10-31 в 12:41, admin, рубрики: CAU, data mining, лекции, математика, математическая статистика, машинное обучение, теория вероятностей

В современных условиях интерес к анализу данных постоянно и интенсивно растет в совершенно различных областях, таких как биология, лингвистика, экономика, и, разумеется, IT. Основу этого анализа составляют статистические методы, и разбираться в них необходимо каждому уважающему себя специалисту в data mining.

К сожалению, действительно хорошая литература, такая что умела бы предоставить одновременно математически строгие доказательства и понятные интуитивные объяснения, встречается не очень часто. И данные лекции, на мой взгляд, необычайно хороши для математиков, разбирающихся в теории вероятностей именно по этой причине. По ним преподают магистрам в немецком университете имени Кристиана-Альбрехта на программах «Математика» и «Финансовая математика». И для тех, кому интересно, как этот предмет преподается за рубежом, я эти лекции перевел. На перевод у меня ушло несколько месяцев, я разбавил лекции иллюстрациями, упражнениями и сносками на некоторые теоремы. Замечу, что я не профессиональный переводчик, а просто альтруист и любитель в этой сфере, так что приму любую критику, если она конструктивна.

Вкратце, лекции вот о чем:
Читать полностью »

Знание физики помогает обыграть казино в рулетку

2016-06-06 в 15:46, admin, рубрики: diy или сделай сам, азартные игры, игры, математическая статистика, Научно-популярное, Носимая электроника, рулетка, теория вероятности, физика

Знание физики помогает обыграть казино в рулетку - 1

Когда дело касается азартных игр, то казино всегда в выигрыше. Особенно в рулетке, где шансы игрока на победу особенно низки. Но из каждого правила есть исключения, тем более когда в игру вступает человек с отличными знаниями физики.

В 1970-е годы профессор математики, специалист по теории хаоса, общей теории систем и эконофизике Джей Дойн Фармер (J. Doyne Farmer) сконструировал известный гаджет, который настолько повышал шансы выигрыша в рулетку, что учёному запретили вход во все казино Невады.

Теперь коллега Фармера объяснил подробно, как работает это устройство.
Читать полностью »

Статистическая проверка случайности двоичных последовательностей методами NIST

2014-11-12 в 9:09, admin, рубрики: Блог компании Код Безопасности, криптография, математическая статистика, случайные числа

Статистическая проверка случайности двоичных последовательностей методами NIST

Любой, кто, так или иначе, сталкивался с криптографией, знает, что без генераторов случайных чисел в этом деле не обойтись. Одно из возможных применений таких генераторов, например, – генерация ключей. Но не каждый при этом задумывается, а насколько «хорош» тот или иной генератор. А если и задумывался, то сталкивался с тем фактом, что в мире не существует какого-либо единственного «официального» набора критериев, который бы оценивал, насколько данные случайные числа применимы именно для данной области криптографии. Если последовательность случайных чисел предсказуема, то даже самый стойкий алгоритм шифрования, в котором данная последовательность будет использоваться, оказывается, уязвим — например, резко уменьшается пространство возможных ключей, которые необходимо «перебрать» злоумышленнику для получения некоторой информации, с помощью которой он сможет «взломать» всю систему. К счастью, разные организации все же пытаются навести здесь порядок, в частности, американский институт по стандартам NIST разработал набор тестов для оценки случайности последовательности чисел. О них и пойдет речь в данной статье. Но сначала — немного теории (постараюсь изложить не нудно).

Читать полностью »

Закон Бенфорда и распределения под него попадающие

2014-10-19 в 15:06, admin, рубрики: big data, бесконечная дисперсия, борьба с фальсификациями, закон Бенфорда, математика, математическая статистика, Научно-популярное, правило первой цифры, скоро зима, списки стран, теория вероятностей, устойчивое распределение

В теории вероятностей и статистике правило первой цифры, или закон Бенфорда, показывает любопытное проявления частот первой цифры данных из реальной жизни. Для школьников и домохозяек этот закон можно вольно сформулировать так: есть наборы данных, у которых первая цифра будет единицей примерно в 6 раз чаще, чем девятка и это соотношение не изменится при масштабировании исходного набора. Более строго можно сформулировать так: набор чисел удовлетворяет закону Бенфорда, если первая цифра d появляется с вероятностью

Здесь N – основание системы счисления, должно быть больше 2, далее будем рассматривать 10.
Для строгих математиков это правило формулируется так: существуют такие случайные величины, для которых распределение вероятностей дробной части логарифма по любому основанию большему 1 сходится к равномерному на отрезке [0; 1] распределению. Далее я постараюсь писать как можно популярнее и подробнее, укажу примеры, ограничения, применение и случайные величины, для которых закон применим.
Читать полностью »

Методы экспертных оценок

2013-08-16 в 3:49, admin, рубрики: математика, математическая статистика, пятничный пост, метки: математическая статистика, пятничный пост

Зачастую необходимо выбрать среди множества альтернатив, при этом каждая обладает различными преимуществами. И как же выбрать лучшую, имея мнение десятков, а то и сотен экспертов?
Методы экспертных оценок
Читать полностью »

Тестирование в Mail.Ru Group

2013-01-16 в 9:21, admin, рубрики: bloom filter, chef, mail.ru group, python, selenium-webdriver, unittest, автоматизация рутины, автоматизация тестирования, Блог компании Mail.Ru Group, виртуальная машина, математическая статистика, тестирование, управление конфигурацией, управление конфигурациями, фильтр блума, функциональное тестирование, метки: bloom filter, chef, mail.ru group, python, selenium-webdriver, unittest, автоматизация рутины, автоматизация тестирования, виртуальная машина, математическая статистика, тестирование, управление конфигурацией, управление конфигурациями, фильтр блума, функциональное тестирование

Тестирование в Mail.Ru Group Эта статья написана по мотивам одноименного доклада на Highload++'2012. Предназначена она для руководителей, которые смогут, взглянув на наше тестирование, сравнить его с тестированием в своем проекте, для программистов и системных администраторов, которым представится возможность посмотреть на тестирование как на очень интересную работу, и, конечно, для тестировщиков.

В статье я расскажу, о том, каким на самом деле может быть тестирование, как мы сделали тестирование продуктивной и интересной работой, какие задачи мы решаем, и почему работать у нас хорошо.
Читать полностью »

Алгоритм моделирования многомерного массива данных, распределенных по нормальному закону

2012-06-06 в 7:38, admin, рубрики: c++, алгоритм, Алгоритмы, математическая статистика, Программирование, метки: c++, алгоритм, математическая статистика

При разработке или исследовании готовых алгоритмов часто требуется определить качество их работы. Использовать для этой цели данные из реальных источников не всегда возможно, так как их свойства зачастую неизвестны и потому нельзя спрогнозировать результат выполнения исследуемых алгоритмов. В таком случае применяется моделирование данных по одному из хорошо известных законов распределения. Применяя исследуемый алгоритм к модельным данным, можно заранее предположить, каким окажется результат его выполнения. Если он окажется удовлетворительным, можно попробовать применить его и к реальным данным. Естественно, что это относится только к непараметрическим алгоритмам, то есть не зависящим от закона распределения данных.

Чаще всего используется моделирование данных, распределённых по нормальному закону. К сожалению, MS Excel и распространённые статистические пакетаы (SPSS, Statistica) позволяют моделировать только одномерные статистические распределения. Конечно, можно составить многомерное распределение из нескольких одномерных, но только в том случае, если переменные независимы. Если же нужно исследовать данные с зависящими друг от друга переменными, придётся писать программу.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «математическая статистика» - 2

Cжатие и улучшение рукописных конспектов

RandLib. Библиотека вероятностных распределений на C++17

Как перестать гадать и начать считать

Статистика для математика

Знание физики помогает обыграть казино в рулетку

Статистическая проверка случайности двоичных последовательностей методами NIST

Закон Бенфорда и распределения под него попадающие

Методы экспертных оценок

Тестирование в Mail.Ru Group

Алгоритм моделирования многомерного массива данных, распределенных по нормальному закону

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «математическая статистика» - 2

Новости

Актуальные темы

Архив