Рубрика «парсинг» - 3

Как я сделал PR на 14К строк в проект YDB будучи студентом

2025-01-15 в 9:33, admin, рубрики: antlr4, ydb, базы данных, парсинг, яндекс

В этой статье я хотел бы рассказать о задаче, решение которой легло в основу моей дипломной работы. В ноябре 2023 года я был студентом Физтеха — учился на базовой кафедре Яндекса, программа обучения которой реализуется совместно с ШАД. Задача заключалась в переводе парсера языка запросов YQL (диалект SQL для Читать полностью »

GUI для исследования внутренностей PDF

2024-12-15 в 18:51, admin, рубрики: 010 Editor, Interactive PDF Analysis, ipa, iText RUPS, PDF, PDF Dissector, pdf-rs, PDFViewer, PDFXplorer, Polyfile, zynamics, анализ PDF, Дидье Стивенс, извлечение ресурсов, парсинг, форматы документов

Как известно, PDF-файлы часто используются как контейнеры для вирусов и эксплоитов. Они применяются в фишинговых кампаниях и социальной инженерии, когда жертве присылают для просмотра «безобидный документ» в формате PDF, а тот запускает на исполнение вредоносный код через незакрытую уязвимость в браузере или PDF-ридере.

Перед открытием документа всегда желательно посмотреть, что находится внутри. Для этих целей существуют парсеры, которые разбирают PDF. Например, Interactive PDF Analysis (IPA, на скриншоте вверху) и другие.

Даже если перед нами чистый PDF, иногда нужно изучить содержимое и извлечь полезные ресурсы в нетронутом виде — например, оригинальные изображения в JPG.
Читать полностью »

Слабоумие и отвага: как найти ликвидные облигации с доходностью до 40% и ежемесячными фиксированными выплатами

2024-12-05 в 0:25, admin, рубрики: MOEX, moexalgo, инвестиции, Мосбиржа, Московская Биржа, облигации, парсинг

Что может быть привлекательнее депозита в Сбербанке под 21%? Видимо только депозит в ВТБ под 24%. А еще можно рассмотреть облигации с доходностью до 40% и ежемесячной выплатой купонов. Посмотрим, что они предлагают и какие существуют риски.

В статье будем искать варианты при помощи скрипта поиска ликвидных облигаций, который выложен на GitHub.

Читать полностью »

Парсинг котировок ценных бумаг в Microsoft Excel и Google Таблицы с любого сайта

2024-10-21 в 0:32, admin, рубрики: Банк России, Мосбиржа, Московская Биржа, парсинг, скрапинг

Бывает, что частные инвесторы не доверяют сервисам для ведения портфеля ценных бумаг и ведут учет своих инвестиций в «Экселе» или «Гугл Таблицах».

Если количество ценных бумаг не так велико, то подобное использование таблиц оправдано:

не требуется платить кому-либо за хранение данных;
никто не удалит ваш файл, например, за неактивность;
отчеты можно сделать такие, как вам нравится.

Читать полностью »

Как я искал рекомендации аналитиков по покупке российских ценных бумаг в JSON формате

2024-10-14 в 0:32, admin, рубрики: котировка, парсинг, рекомендации

Четыре года назад я написал систему поиска поиска недооцененных американских акций, используя данные Яху Финанс, ведь на американском рынке торгуется больше 10 тысяч бумаг, из которых около 4 тысяч бумаг имеют рекомендации аналитиков о прогнозируемой цене. Это большие цифры, с которыми сложно работать. Но что по России?

Я вялотекуще пытался найти систему которая бы также отдавала рекомендации аналитиков по российским компаниям, пока недавно не нашёл такой API. Вот например какие рекомендации Читать полностью »

OSINT в работе IT-рекрутера: Достаем кандидатов из Telegram чата с помощью Telethon и Snoop

2024-09-08 в 11:15, admin, рубрики: OSINT, recruiting, snoop, sourcing, telegram, парсинг, рекрутинг, рекрутинг в it, сорсинг

В этом кейсе вы узнаете, как IT-рекрутеры могут автоматизировать поиск кандидатов по никнеймам в Telegram и перевести его из ручного процесса в почти промышленный.

Мы будем использовать информацию об участниках чата в Telegram в качестве базы никнеймов, но вы можете применить любой другой альтернативный источник данных и начинать с 4-го шага.

Шаг 1. Регистрация аккаунта в Telegram через виртуальный номер

Читать полностью »

Как я улучшил свой пользовательский опыт взаимодействия с фитнес клубом World Class

2024-09-02 в 0:23, admin, рубрики: api, World Class, парсинг

Уже полгода хожу в фитнес клуб World Class или как пишут в самом клубе - являюсь его резидентом. Выбрал этот клуб в основном из-за наличия в нём бассейна. Потом заинтересовался групповыми программами и частенько хожу на сайкл тренировки - это тренировки на специальном велотренажере.

Читать полностью »

Парсинг Амазона на easy без мам, пап и ипотек

2024-08-27 в 17:15, admin, рубрики: python, парсер цен конкурентов, парсинг, парсинг сайтов

Попался мне на глаза на просторах интернета скрипт, который позволяет парсить карточки товаров с Амазона. А мне как раз было необходимо решение подобной задачи.

Читать полностью »

Странная функция Telegram

2023-03-10 в 9:20, admin, рубрики: telegram, анализ данных, анонимность, безопасность, интернет, информационная безопасность, мессенджеры, парсинг

Пару лет назад я начал исследовать приложения телеграм, протокол MTProto. Я использовал некоторые методы API не по назначению, в общем, ничего особенного. Спустя 2 года я заметил некоторую особенность, о которой мало кто упоминает, возможность испытать которую отсутствует в большинстве официальных графических приложений (за исключением Telegram X). Я начал исследовать ее и решил поделиться опытом с читателями хабра.

Telegram X

Читать полностью »

19,6 млн рублей за 2022 год. Парсинг сайтов. 25 советов желающим заняться

2023-02-07 в 9:54, admin, рубрики: Блог компании offlineCRM: Бесплатная CRM для самозанятых, веб-аналитика, интернет-маркетинг, контент-маркетинг, парсеры, парсинг, парсинг html, парсинг json, парсинг контента, парсинг сайта, парсинг сайтов, Управление e-commerce

Меня зовут Максим Кульгин, моя компания xmldatafeed занимается парсингом сайтов в России порядка четырёх лет. По итогам прошедшего 2022 года поделюсь советами для тех, кто думает о подобном бизнесе. Бизнес очень интересный, но наполнен нюансами, которые и расскажу в статье.

Я ранее рассказывал про наш опыт развития бизнеса на парсинге сайтов в двух статьях (часть 1 и часть 2 Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «парсинг» - 3

Как я сделал PR на 14К строк в проект YDB будучи студентом

GUI для исследования внутренностей PDF

Слабоумие и отвага: как найти ликвидные облигации с доходностью до 40% и ежемесячными фиксированными выплатами

Парсинг котировок ценных бумаг в Microsoft Excel и Google Таблицы с любого сайта

Как я искал рекомендации аналитиков по покупке российских ценных бумаг в JSON формате

OSINT в работе IT-рекрутера: Достаем кандидатов из Telegram чата с помощью Telethon и Snoop

Шаг 1. Регистрация аккаунта в Telegram через виртуальный номер

Как я улучшил свой пользовательский опыт взаимодействия с фитнес клубом World Class

Парсинг Амазона на easy без мам, пап и ипотек

Странная функция Telegram

Telegram X

19,6 млн рублей за 2022 год. Парсинг сайтов. 25 советов желающим заняться