Рубрика «математика» - 164

     Каждое натуральное число обладает очень многими известными и, по-видимому, еще в большем числе неизвестными свойствами. Четные — нечетные, простые — составные, рациональные — иррациональные, целые — дробные, конечные — бесконечные и др. свойства способствуют введению классификации чисел, некоторого порядка в их множестве. Традиционный подход предполагает, что не располагая самим числом (его значением) невозможно определить и его свойства. Но это не совсем так. Ряд полезных свойств для некоторых чисел можно определять не зная их значений, но имея данные об их положении в натуральном ряде чисел (НРЧ). Простыми числами, кроме 2, могут быть только нечетные, а их положение НРЧ определяется нечетной позицией. Сами эти позиции не все равнозначны. Про некоторые большие нечетные N(x1, x2) числа (разумеется в нечетных позициях НРЧ) можно, не пользуясь традиционными (вероятностными) и детерминированным (весьма трудоемким) алгоритмами, однозначно утверждать, они не могут быть простыми.Читать полностью »

image
Иллюстрация к последней задаче.

Существуют задачи с простыми и, казалось бы, очевидными решениями, которые, однако, трудно найти. При их решении опасно полагаться на интуицию, ведь правильный ответ зачастую совсем не совпадает с тем, который она подсказывает. В данной статье я предлагаю подборку из 10 таких заданий, упорядоченных по возрастанию сложности; их решения убраны под спойлер. Для получения верных ответов не нужно обладать какими-то специальными знаниями, достаточно лишь находчивости и знания школьной программы.

Читать полностью »

Продолжаем разговор. Прошлая статья была переходной от предыдущего цикла о графических моделях вообще (часть 1, часть 2, часть 3, часть 4) к новому мини-циклу о тематическом моделировании: мы поговорили о сэмплировании как методе вывода в графических моделях. А теперь мы начинаем путь к модели латентного размещения Дирихле (latent Dirichlet allocation) и к тому, как все эти чудесные алгоритмы сэмплирования применяются на практике. Сегодня – часть первая, в которой мы поймём, куда есть смысл обобщать наивный байесовский классификатор, и заодно немного поговорим о кластеризации.

Вероятностные модели: от наивного Байеса к LDA, часть 1
Читать полностью »

В статье рассказывается об одной статистической закономерности, объяснение которой приведет к интересным задачам как прикладного, так и чисто теоретического характера.

Моделирование мира и динамические системы
(Первые цифры площадей стран, записанных в десятичной записи)

Читать полностью »

image

Друзья!

Похоже, я нарисовал парочку клёвых иллюстраций с утятками. На первой — которая выше — показано, как работает чёрная дыра. Здесь нарисован участок бесконечного пруда с утятками. Правила игры такие:
— Утятки плавают только по поверхности; нырять они не умеют.
— В этом пруду так повелось, что утятки хотя и научились разгоняться почти до скорости звука (относительно воды), но никогда–никогда не могут превышать скорость звука. И никакие их сигналы не могут превышать скорость звука. Вот не могут — и всё тут.

На картике выше в этом участке пруда есть бездонная дыра, куда вода утекает.
Вдали от этой дыры вода течёт к ней тихонечко–тихонечко и утята почти не замечают этого. Вдали от дыры им ничего не стоит плыть против этого течения.

Но на некотором расстоянии R от дыры вода течет уже со скоростью звука. И если утёнок подплывает к дыре ближе, чем это расстояние — то с ним ничего примечательного не случается. Он даже может не знать, что пересёк эту «черту невозврата» (оранжевый пунктир). Но теперь даже если он развернётся и изо всех сил начнёт грести прочь от дыры — он никогда не выплывет, поскольку навстречу ему вода будет течь быстрее скорости звука, а сам он не может превысить скорость звука. С этого момента утёнок обречён, хотя может и не знать этого. Он в любом случае будет падать в дыру и неизбежно свалится в чёрную бездну в центре.

Этот оранжевый пунктир и называется «горизонтом чёрной дыры». Всё, что пересекает его, уже не сможет вернуться и не может послать сигнал наружу. Хотя с точки зрения самих объектов, пересёкающих горизонт, с ними ничего особенного не произошло. А для утяток снаружи эти объекты фактически исчезают.

Надо сказать, что идею этой иллюстрации придумал не я, а канадский физик Уильям Унру. Только у него были рыбки, а не утятки.

А другой физик — Леонард Сасскинд — придумал на примере того же пруда показать, как работает раздувание пространства при расширении Вселенной. Этот случай даже занятней. Я покажу его внутри поста.
Читать полностью »

Смех и грех псевдорейтинга
Вчера мне на глаза попалась новость «Россия занимает %какое-то-низкое-место в рейтинге хороших стран». Новость как новость, «рейтинги» такого типа делаются регулярно и во множестве. Но в новости указывался список «самых хороших» стран и сайт-источник. Данные, которые там приведены, вызывают здоровый смех, а методика подсчета — возмущение. О рейтингах и манипуляции данными этот пост.
Читать полностью »

     Существующие подходы к решению задачи факторизации больших чисел (ЗФБЧ), интенсивно используемые в мире математики последние 20-30 лет свидетельствуют, что для них эта задача достаточно сложная, она упорно сопротивляется внешнему натиску специалистов и позиций не сдает. Вместе с тем, не могу упомянуть работ, авторы которых предложили бы глубокий анализ проблемы, состояния вопроса или выступили бы с критикой используемого подхода. Основной принцип в подходе — просеивание множества чисел (принцип решета) доминирует в этой области, но думается это не единственный путь [7,8] и возможно не лучший. Большие надежды исследователями ЗФБЧ возлагаются на вычислительные средства новых типов, на новых физических принципах (квантовые, молекулярные и др.), но о смене подхода речь не идет [10,11]. Тем не менее, некоторые выводы уже сегодня как бы напрашиваются сами собой.
Читать полностью »

И снова здравствуйте! Сегодня я продолжаю серию статей в блоге Surfingbird, посвящённую разным методам рекомендаций, а также иногда и просто разного рода вероятностным моделям. Давным-давно, кажется, в прошлую пятницу летом прошлого года, я написал небольшой цикл о графических вероятностных моделях: первая часть вводила основы графических вероятностных моделей, во второй части было несколько примеров, часть 3 рассказывала об алгоритме передачи сообщений, а в четвёртой части мы кратко поговорили о вариационных приближениях. Цикл заканчивался обещанием поговорить о сэмплировании — ну что ж, не прошло и года. Вообще говоря, в этом мини-цикле я поведу речь более предметно о модели LDA и о том, как она помогает нам делать рекомендации текстового контента. Но сегодня начну с того, что выполню давнее обещание и расскажу о сэмплировании в вероятностных моделях — одном из основных методов приближённого вывода.
Вероятностные модели: сэмплирование
Читать полностью »

Введение

Друзья, рассмотрим нынче же задачу линейной регрессии в присутствии выбросового (некоррелированного с сигналом) шума. Эта задача часто возникает при обработке изображений (напр., при цветовой сегментации [1]), в том числе — акустических [2]. В случаях, когда координаты случайных величин можно грубо дискретизовать, а размерность задачи низка (2-3), кроме стандартных методов робастной регрессии можно воспользоваться быстрым преобразованием Хафа (БПХ) [3]. Попробуем сравнить этот последний метод по точности и устойчивости с «классическими».

Использование БПХ для линейной регрессии

Задача линейной регрессии на плоскости состоит в восстановлении линейной зависимости между двумя переменными, заданными в виде множества пар (x, y). Задавшись некоторым уровнем дискретизации координат, можно отобразить это множество на однобитном или целочисленном изображении (в первом случае мы отмечаем только факт наличия в исходных данных точки с примерно такими координатами, во втором — еще и их число). Фактически, речь идет о двумерной гистограмме исходных данных. Таким образом, неформально задача может быть сведена к поиску на изображении прямой, которая наилучшим образом описывает изображенное распределение точек.В обработке изображений в подобных случаях используется преобразование Хафа.

Преобразование Хафа является дискретным аналогом преобразования Радона и ставит в соответствие каждой прямой на изображении сумму яркостей пикселей вдоль нее (то есть одновременно вычисляет всевозможные суммы вдоль дискретных прямых). Можно ввести разумную дискретизацию прямых по сдвигам и наклонам так, чтобы параллельные дискретные прямые плотно упаковывали плоскость, а выходящие из одной точки на одном крае изображения прямые расходились по наклону на противоположном крае на целое число пикселей. Тогда таких дискретных прямых на квадрате n2 будет примерно 4 * n2. Для этой дискретизации существует алгоритм быстрого вычисления преобразования Хафа с ассимптотикой O(n2 * log n). Этот алгоритм является близким аналогом алгоритма быстрого преобразования Фурье, хорошо параллелизуется и не требует никаких операций, кроме сложения. В работе [3] можно прочитать об этом чуть больше, кроме того, там объясняется, почему преобразование Хафа от сглаженного гауссовским фильтром изображения вообще можно применять в задаче линейной регресии. Здесь же мы продемонстрируем устойчивость этого метода.
Читать полностью »

Всем добрый день! Этот короткий пост посвящен рассмотрению моделей процессов разработки Waterfall и Agile (на примере Scrum и/или Kanban). И вот в чем дело: с точки зрения заказчика, процесс не столь важен, сколько срок и бюджет удовлетворительного с точки зрения функционала результата. И если известно, что (изменения не учитываются) затраты Waterfall-процесса идут по S-кривой, а затраты Agile-процесса накапливаются линейно (так как ресурсы используются одновременно все), то как они должны различаться по эффективности. Чтобы исследовать этот вопрос, необходимо построить модели и сравнить их, и для этого будет использована несложная математика.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js