Рубрика «neural network»

[AI ⊂ TM] Машина Тьюринга и искусственный интеллект

2025-12-31 в 10:15, admin, рубрики: neural network, Q-learning, reinforecement learning, turing machine, генетические алгоритмы, генетическое программирование, машина Тьюринга, нейронная сеть

Пререквизиты

Обязательно - основы теории вычислений, искусственные нейронные сети.

Желательно - генетические алгоритмы, RL-агенты.

Почему машина Тьюринга?

Действительно, почему машина Тьюринга (TM) сегодня в теме про искусственный интеллект (AI) ? Ведь AI сегодня это все больше про машинное обучение (ML), искусственные нейронные сети (Читать полностью »

Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO

2020-12-07 в 16:05, admin, рубрики: AI, artificial intelligence, computer vision, deep learning, neural network, object detection, real-time object detection, yolo, YOLOv4, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обнаружение объектов, обработка изображений, Программирование

Научная статья
Pytorch: YOLOv4-CSP, YOLOv4-P5, YOLOv4-P6, YOLOv4-P7 (main repository — use to reproduce results)
YOLOv4-CSP
YOLOv4-tiny
YOLOv4-large
Darknet: YOLOv4-tiny, YOLOv4-CSP, YOLOv4x-MISH
Структура YOLOv4-CSP

Scaled YOLO v4 является самой точной нейронной сетью (55.8% AP) на датасете Microsoft COCO среди всех опубликованных нейронных сетей на данный момент. А также является лучшей с точки зрения соотношения скорости к точности во всем диапазоне точности и скорости от 15 FPS до 1774 FPS. На данный момент это Top1 нейронная сеть для обнаружения объектов.

Scaled YOLO v4 обгоняет по точности нейронные сети:

Google EfficientDet D7x / DetectoRS or SpineNet-190 (self-trained on extra-data)
Amazon Cascade-RCNN ResNest200
Microsoft RepPoints v2
Facebook RetinaNet SpineNet-190

Мы показываем, что подходы YOLO и Cross-Stage-Partial (CSP) Network являются лучшими с точки зрения, как абсолютной точности, так и соотношения точности к скорости.

График Точности (вертикальная ось) и Задержки (горизонтальная ось) на GPU Tesla V100 (Volta) при batch=1 без использования TensorRT:

Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO - 1

Читать полностью »

Ультимативное сравнение embedded платформ для AI

2019-09-23 в 16:22, admin, рубрики: 2801, 2803, coral, embedded, GAP8, google coral, Grove AI, gyrfalcon, intel, intel ncs2, Intel NUC, Jetson AGX, Jetson Nano, jetson tx1, mobilnet, movidius, myriad, neural network, open vino, Raspberry Pi4, Rockchip, RPi4, Snapdragon, ssd, TensorFlow, tensorrt, tftrt, Анализ и проектирование систем, Блог компании Recognitor, искусственный интеллект, машинное обучение, обработка изображений

Нейронные сеточки захватывают мир. Они считают посетителей, контролируют качество, ведут статистику и оценивают безопасность. Куча стартапов, использование в промышленности.
Замечательные фреймворки. Что PyTorch, что второй TensorFlow. Всё становиться удобнее и удобнее, проще и проще…
Но есть одна тёмная сторона. Про неё стараются молчать. Там нет ничего радостного, только тьма и отчаяние. Каждый раз когда видишь позитивную статью — грустно вздыхаешь, так как понимаешь что просто человек что-то не понял. Или скрыл.
Давайте поговорим про продакшн на embeded-устройствах.
Ультимативное сравнение embedded платформ для AI - 1
Читать полностью »

Треугольник Паскаля vs цепочек типа «000…-111…» в бинарных рядах и нейронных сетях

2019-09-09 в 13:23, admin, рубрики: ata analysis, big data, binary Lyndon words, binomial coefficient, Binomial Theorem, boolean, data mining, machine learning, neural network, Pascal's Triangle, rules-based, tests of randomness, Алгоритмы, анализ данных, белый шум, бинарная последовательность, биномиальный коэффициент, вероятность ошибки, ГСПЧ, кластеризация данных, марковский процесс, математика, нейрон, нейронная сеть, открытые данные, ошибки первого и второго рода, Перцептрон, поиск закономерностей, последовательность, проверка гипотезы, распределение вероятностей, синапс, слова Линдона, случайный процесс, статистика, теорема Эрдёша-Реньи, треугольник Паскаля, фрактальные свойства, экспертные системы

Серия «Белый шум рисует черный квадрат»

История цикла этих публикаций начинается с того, что в книге Г.Секей «Парадоксы в теории вероятностей и математической статистике» (стр.43), было обнаружено следующее утверждение:

Треугольник Паскаля vs цепочек типа «000…-111…» в бинарных рядах и нейронных сетях - 1
Рис. 1.

По анализу комментарий к первым публикациям (часть 1, часть 2) и последующими рассуждениями созрела идея представить эту теорему в более наглядном виде.

Большинству из участников сообщества знаком треугольник Паскаля, как следствие биноминального распределения вероятностей и многие сопутствующие законы. Для понимания механизма образования треугольника Паскаля развернем его детальнее, с развертыванием потоков его образования. В треугольнике Паскаля узлы формируются по соотношению 0 и 1, рисунок ниже.

Треугольник Паскаля vs цепочек типа «000…-111…» в бинарных рядах и нейронных сетях - 2
Рис. 2.

Для понимания теоремы Эрдёша-Реньи составим аналогичную модель, но узлы будут формироваться из значений, в которых присутствуют наибольшие цепочки, состоящие последовательно из одинаковых значений. Кластеризации будет проводиться по следующему правилу: цепочки 01/10, к кластеру «1»; цепочки 00/11, к кластеру «2»; цепочки 000/111, к кластеру «3» и т.д. При этом разобьём пирамиду на две симметричные составляющие рисунок 3.

Треугольник Паскаля vs цепочек типа «000…-111…» в бинарных рядах и нейронных сетях - 3
Рис. 3.

Первое что бросается в глаза это то, что все перемещения происходят из более низкого кластера в более высокий и наоборот быть не может. Это естественно, так как если цепочка размера j сложилась, то она уже не может исчезнуть.
Читать полностью »

Нейросеть научилась рисовать сложные сцены по текстовому описанию

2019-06-24 в 7:00, admin, рубрики: github, microsoft, neural network, open source, Блог компании Microsoft, искусственный интеллект, машинное обучение, нейросеть

Нейросеть научилась рисовать сложные сцены по текстовому описанию - 1

Исследовательская группа Microsoft Research представила генеративно-состязательную нейросеть, которая способна генерировать изображения с несколькими объектами на основе текстового описания. В отличие от более ранних подобных алгоритмов text-to-image, способных воспроизводить изображения только базовых объектов, эта нейросеть может справляться со сложными описаниями более качественно.

Читать полностью »

Лопнул ли пузырь машинного обучения, или начало новой зари

2019-06-14 в 0:17, admin, рубрики: CAE, embedding, memory, neural network, tesla, VAE, Блог компании Recognitor, будущее, искусственный интеллект, Исследования и прогнозы в IT, машинное обучение, нейронные сети, обработка изображений, роботы всё захватят

Недавно вышла статья которая неплохо показывает тенденцию в машинном обучении последних лет. Если коротко: число стартапов в области машинного обучения в последние два года резко упало.

Ну что. Разберём “лопнул ли пузырь”, “как дальше жить” и поговорим откуда вообще такая загогулина.
Читать полностью »

Окей, Google: как пройти капчу?

2019-04-26 в 6:11, admin, рубрики: automation, captcha, computer vision, Google, machine learning, neural network, optical character recognition, python, recaptcha, автоматизация, безопасность, информационная безопасность, капча, Компьютерное зрение, машинное обучение, нейросети, обработка изображений, оптическое распознавание символов

Здравствуйте. Меня зовут Ибадов Илькин, я студент Уральского федерального университета.

В данной статье я хочу рассказать о своем опыте автоматизированного решения капчи компании «Google» — «reCAPTCHA». Хотелось бы заранее предупредить читателя о том, что на момент написания статьи прототип работает не так эффективно, как может показаться из заголовка, однако, результат демонстрирует, что реализуемый подход способен решать поставленную задачу.
Читать полностью »

Металлопоиск и… нейросеть

2019-01-27 в 10:27, admin, рубрики: ANN, discrimination, Go, metal detector, neural network, pulse induction, дискриминация, импульсный металлодетектор, ИНС, машинное обучение, металлодетектор, нейросеть, физика

Принцип работы импульсного металлодетектора
Одним из популярных вариантов конструктивного исполнения устройств для металлопоиска является импульсный (pulse induction (PI)) металлодетектор- неприхотливый и надежный аппарат (хорошая глубина обнаружения, устойчивость к повышенной минерализации грунта, способность работать в соленой воде), имеющий различные сферы применения — от военного дела (традиционные пользователи «импульсников») до поиска золота (особенно популярно это хобби в Австралии).
Но и у него есть существенный недостаток — большие сложности с дискриминацией, т.е. определением типа мишени, например, узнать — из цветного металла она или из черного, или отличить противопехотную мину в пластиковом корпусе от кучки металлического мусора? Какая же причина этой проблемы?
Рассмотрим принцип работы импульсного металлодетектора.
Металлопоиск и… нейросеть - 1
Читать полностью »

Программный модуль оцифровки поврежденных документов

2018-11-09 в 16:38, admin, рубрики: github, image, mashine learning, neural network, neural networks, python, python3, segmentation, unet

Оптическое распознавание символов (OCR) — это процесс получения печатных текстов в оцифрованном формате. Если вы прочитали классический роман на цифровом устройстве или попросили врача поднять старые медицинские записи через компьютерную систему больницы, вы, вероятно, воспользовались OCR.

OCR делает ранее статический контент доступным для редактирования, доступным для поиска и для обмена. Но многие документы, стремящиеся к оцифровке, содержат кофейные пятна, выцветшие солнечные пятна, страницы с загнутыми уголками и множество морщин сохраняют некоторые печатные документы в не оцифрованном виде.

Всем давно известно, что существуют миллионы старых книг, которые хранятся в хранилищах. Использование этих книг запрещено по причине их ветшалости и дряхлости, и поэтому оцифровка этих книг столь важна.

В работе рассматривается задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат.

Для обучения использовалось 144 картинки. Размер может быть разным, но желательно должен быть в пределах разумного. Картинки должны иметь формат PNG. После считывании изображения используется бинаризация – процесс преобразования цветного изображения в черно-белое, то есть каждый пиксель нормализуется в диапазон от 0 до 255, где 0 – это черный, 255 – белый.

Чтобы обучить сверточную сеть, нужно больше изображений, чем имеется. Было принято решение разделить изображения на части. Так как обучающая выборка состоит из картинок разного размера, каждое изображение было сжато до 448х448 пикселей. В результате получилось 144 изображения в разрешении 448х448 пикселей. После чего все они были нарезаны на неперекрывающиеся окна размером 112x112 пикселей.

Читать полностью »

Машинное обучение в MatLab-Octave: примеры алгоритмов, подкрепленные формулами

2018-10-31 в 15:52, admin, рубрики: artificial intelligence, data science, machine learning, Matlab, neural network, neural networks, искусственный интеллект, машинное обучение, Программирование

Недавно я начал изучать machine learning. Начал с прекрасного, на мой взгляд, курса от Andrew Ng. И чтобы не забыть, а так же повторить выученное решил создать репозиторий Machine Learning in Octave. В нем я собрал математические формулы для гипотез, градиентных спусков, "cost function"-ов, сигмоидов и прочих фундаментальных для машинного обучения "штук". Так же добавил туда упрощенные и доработанные примеры реализации некоторых популярных алгоритмов (нейронная сеть, линейная/логистическая регрессия и пр.) для MatLab/Octave. Надеюсь эта информация будет полезна для тех из вас, кто планирует начать изучение machine learning-а.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «neural network»

[AI ⊂ TM] Машина Тьюринга и искусственный интеллект

Пререквизиты

Почему машина Тьюринга?

Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO

Ультимативное сравнение embedded платформ для AI

Треугольник Паскаля vs цепочек типа «000…-111…» в бинарных рядах и нейронных сетях

Серия «Белый шум рисует черный квадрат»

Нейросеть научилась рисовать сложные сцены по текстовому описанию

Лопнул ли пузырь машинного обучения, или начало новой зари

Окей, Google: как пройти капчу?

Металлопоиск и… нейросеть

Программный модуль оцифровки поврежденных документов

Машинное обучение в MatLab-Octave: примеры алгоритмов, подкрепленные формулами