Рубрика «извлечение данных»

Можно ли доверить важные документы open-source LLM: эксперимент Рег.облака и Raft

2026-01-21 в 11:25, admin, рубрики: AI, llm, raft, договор, извлечение данных, извлечение информации, исследование, нейросети, рег.облако, эксперимент

Привет! На связи команды Рег.облака и Raft.

Читать полностью »

Парсинг pdf-отчётов публичных компаний для получения трейдерских инсайтов

2025-09-24 в 4:30, admin, рубрики: bloomberg terminal, xbrl, извлечение данных, мониторинг отчетов, парсинг PDF, сервис для трейдинга, сигналы для трейдинга

Здравствуйте! В этой статье рассмотрим, как с помощью Python мониторить сайты компаний, парсить отчёты из PDF, извлекать ключевые данные и отправлять обработанные результаты в Telegram.

Публичные компании обязаны публиковать свою отчётность (финансовые результаты, годовые отчёты, пресс-релизы) на своих сайтах, часто в формате PDF. Для трейдера или инвестора скорость получения и анализа этой информации критически важна: тот, кто первым увидит тренд или аномалию в отчёте, может принять лучшее решение и получить преимущество на рынке.

Читать полностью »

Три причины не выбрасывать старый айфон

2025-02-25 в 12:35, admin, рубрики: checkm8, iphone, iphone X, айфоны, аппаратная уязвимость, данные пользователя, данные приложения, извлечение данных, файловые системы

Читать полностью »

Машинное обучение на Android

2020-02-09 в 18:12, admin, рубрики: data mining, DataLearner, open source, алгоритм, Алгоритмы, визуализация данных, извлечение данных, искусственный интеллект, приложение

Привет! Представляю вашему внимаю перевод статьи из журнала APC.

Машинное обучение и интеллектуальный анализ данных – это практические разработки ИИ, благодаря которым появляются приложения различных тематик, начиная от воздухоплавания и заканчивая зоологией. Эти процессы чаще всего выполняются в облаке, на ПК или ноутбуке, гораздо реже – в смартфоне.

Однако недавно в Google Play появилось новое бесплатное приложение под названием «DataLearner», с помощью которого можно добывать данные. Оно не требует внешних ресурсов и доступа с полномочиями суперпользователя.

Вычислительные ресурсы смартфонов

Многие ошибочно полагают, что для машинного обучения и добычи данных требуется много ресурсов облачной вычислительной системы или по меньшей мере мощный компьютер. Однако в конечном счёте всё сводится к размеру анализируемых данных и типу машинного обучения, которое вы хотите применить.

У компьютерного обучения есть свои уровни сложности. Если представить, что такая недавно появившаяся техника глубокого обучения, как свёрточная нейросеть (CNN) – это автомобиль с высокой удельной мощностью, то другие техники, например, дерево поиска решений и многие прочие «лесные» методы обучения – это горячие «хэтчбеки». Они показывают отличные результаты, быстры и легки даже при ограниченных вычислительных возможностях CPU.
Читать полностью »

Web scraping с помощью R. Сравнение оценок фильмов на сайтах Кинопоиск и IMDB

2019-08-08 в 9:41, admin, рубрики: data mining, dataviz, R, scraping, анализ данных, визуализация данных, извлечение данных, скраппинг

Всемирная паутина — это океан данных. Здесь можно посмотреть практически любую интересующую Вас информацию. Однако, "вытащить" эту информацию из интернета уже сложнее. Есть несколько способов получить данные и web-scraping один из них. Читать полностью »

Им было нечего скрывать

2019-08-07 в 6:53, admin, рубрики: fappening, icloud, iOS Forensic Toolkit, iphone, Phone Breaker, блокировка, Восстановление данных, защита данных, извлечение данных, информационная безопасность, криптография, мобильная криминалистика, пароль, паскод, смартфон, смартфоны

Мы не первый год работаем на рынке информационной безопасности. Основные наши клиенты – правоохранительные органы разных стран, спецслужбы, а также отделы IT безопасности в крупных компаниях. Иногда наши клиенты делятся с нами интересными историями; о некоторых из них можно прочитать и в средствах массовой информации. Сегодня я хочу рассказать несколько историй о людях, которым было «нечего скрывать» и у которых в результате возникли серьёзные проблемы буквально на ровном месте.

В чём проблема?

Я часто пишу статьи на тему информационной безопасности. Иногда получается понятно для неспециалиста, иногда, вероятно, не очень. «Что-то я вообще не понял посыла статьи […] в чем проблема?», «имхо, проблема с icloud, слегка притянута за уши», ну и бессмертное – «я не стал заморачиваться, мне нечего скрывать». Отлично, давайте посмотрим, стоит ли вам что-либо скрывать.

Celebgate: «проблема с iCloud слегка притянута за уши»

С момента выхода нашего первого продукта для извлечения данных из iCloud прошло более пяти лет. Ключ от продукта Elcomsoft Phone Password Breaker (сейчас у него другое название), который на тот момент мы продавали исключительно правоохранительным органам, был украден и попал в руки хакерской группировки.
Читать полностью »

Как научить машину понимать инвойсы и извлекать из них данные

2019-02-19 в 12:44, admin, рубрики: ABBYY, data augmentation, LSTM, machine learning, ner, ocr, Блог компании ABBYY, высокая производительность, документы, извлечение данных, инвойсы, искусственный интеллект, машинное обучение, нейронные сети, технологии

Как научить машину понимать инвойсы и извлекать из них данные - 1 Привет! Меня зовут Станислав Семенов, я работаю над технологиями извлечения данных из документов в R&D ABBYY. В этой статье я расскажу об основных подходах к обработке полуструктурированных документов (инвойсы, кассовые чеки и т.д.), которые мы использовали совсем недавно и которые используем прямо сейчас. А еще мы поговорим о том, насколько для решения этой задачи применимы методы машинного обучения.
Читать полностью »

Разработка веб-скрапера для извлечения данных с портала открытых данных России data.gov.ru

2017-03-04 в 11:04, admin, рубрики: .net, C#, web scraping, извлечение данных, Программирование, разработка, скрапинг, метки: извлечение данных, скрапинг

Иногда возникает необходимость получить данные c веб-страниц и сохранить их в структурированном виде.

Инструменты веб-скрапинга (web scraping) разрабатываются для извлечения данных с веб-сайтов. Эти инструменты бывают полезны тем, кто пытается получить данные из Интернета. Веб-скрапинг — это технология, позволяющая получать данные без необходимости открывать множество страниц и заниматься копипастом. Эти инструменты позволяют вручную или автоматически извлекать новые или обновленные данные и сохранять их для последующего использования. Например, с помощью инструментов веб-скрапинга можно извлекать информацию о товарах и ценах из интернет-магазинов.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «извлечение данных»

Можно ли доверить важные документы open-source LLM: эксперимент Рег.облака и Raft

Парсинг pdf-отчётов публичных компаний для получения трейдерских инсайтов

Три причины не выбрасывать старый айфон

Машинное обучение на Android

Вычислительные ресурсы смартфонов

Web scraping с помощью R. Сравнение оценок фильмов на сайтах Кинопоиск и IMDB

Им было нечего скрывать

В чём проблема?

Celebgate: «проблема с iCloud слегка притянута за уши»

Как научить машину понимать инвойсы и извлекать из них данные

Разработка веб-скрапера для извлечения данных с портала открытых данных России data.gov.ru