Рубрика «pandas»

Лагерь сделал из поэта язычника. Проследил динамику философских взглядов Заболоцкого с помощью Python

2026-01-21 в 12:24, admin, рубрики: nlp обработка текста, pandas, pymorphy2, python, Rusentilex, литература, поэзия, проза, чтение, Эмоции

Промёрзшие кочки, брусника,
Смолистые запахи пней.
Мне кажется: новая книга
Раскрыта искателю мне.
Ведь вечер ветвист и клетчат.
Ах, вечер, как сон в Октябре,
И сосны, как жёлтые свечи
На Божьем лесном алтаре….

В этом стихотворении Николая Заболоцкого, написанного в 1921 году видно, как поэт показывает божественное единоначалие природы. Но тем, кто знает творчество Николая Алексеевича, может показаться, что автор в своих взглядах, выраженных в стихах, больше похож на атеиста. Николай Корнеевич Чуковский, знакомый с поэтом, так писал о нем в своей книге "Литературный воспоминания":

Читать полностью »

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

2025-12-09 в 21:25, admin, рубрики: data science, exploratory data analysis, feature engineering, machine learning, numpy, pandas, sklearn, statistics

Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart»Читать полностью »

Сердце не сыто. Python помогает раскрыть особенности мастерства поэта Вознесенского

2025-12-04 в 6:33, admin, рубрики: nlp, NLTK, pandas, python, stanford, tokenizer, говнокод, поэзия, проза, чтение

Что меня носит по свету транзитом?

Тело намаялось, сердце не сыто.

Бегство от быта — смешная защита,

всё ненасытней растут аппетиты.

Любим сквозь сито, поем через сито.

Сыты по горло — сердце не сыто.

Небо не сыто. Окошки открою —

ты прилетаешь по воздуху кролем.

Читать полностью »

Автоматизация сбора и анализа вакансий с сайта Хэдхантер

2025-06-23 в 10:15, admin, рубрики: api, data science, headhunter, matplotlib, pandas, python

Читать полностью »

Для чего ИТ менеджеру уметь программировать. И главное — зачем

2025-05-12 в 13:16, admin, рубрики: agile, pandas, python, автоматизация, приемка, разработка, требования заказчика, трекер, управление командой, управление проектами

Привет!

Решил свою первую статью на портале сделать легкой, без залезания в дебри и диспуты. Пусть будет своего рода научпоп от менеджмента в ИТ.

Немного предыстории: где-то около года назад мы с коллегами были на загородном выезде для манагеров. В программе было обучение и брейнстормы, в перерывах и вечером - активный движ и застолья.

И вот как-то раз, после дневных учебно-мозгоштурмовых сессий народ разбредался по активностям, а я сел в лобби, достал ноут. Сижу. Подходит коллега:

— Что делаешь? Ботаешь?
— Нет, учусь.
— Что учишь?
— ООП
— А зачем?

Читать полностью »

Экономия RAM с pandas.read_sql

2025-03-28 в 12:16, admin, рубрики: pandas, sql, оптимизация памяти

Рассмотрим потребление оперативной памяти (RAM) при загрузке pandas DataFrame из базы данных (БД).

Для этого воспользуемся мониторингом ресурсов на базе библиотеки psutil. Мониторинг фиксирует pss («Proportional Set Size») память, т. е. физически занимаемую процессом.

Используем небольшую таблицу синтетических транзакций:

Читать полностью »

Как мы искали должников при помощи Pandas

2025-03-17 в 18:12, admin, рубрики: pandas, sql, города, Петербург, Питон, урбанистика

Петербургский Фонд капитального ремонта опубликовал документы, в которых указана задолженность за каждую квартиру в городе по итогам 2024 года. Мы изучили эти файлы, чтобы ответить на вопрос: где и почему хуже всего платят за ремонт в своём доме.

Я занимаюсь анализом данных и дата-журналистикой в газете "Деловой Петербург". Расскажу о том, как объединяли информацию из множества локальных html-таблиц и приведу примеры кода на "Питоне".

Читать полностью »

Python для начинающих дата-аналитиков: как настроить виртуальное окружение?

2025-03-10 в 15:16, admin, рубрики: data analysis, jupyter notebook, pandas, pip, python, UV, venv

Введение

Привет! Меня зовут Женя и я работаю аналитиком данных. В этой статье я бы хотел рассказать начинающим аналитикам о том, как правильно настроить окружение для работы с Python. Когда я только начинал заниматься анализом данных, концепция питоновского виртуального окружения вводила меня в ступор, и здесь я постараюсь показать, что в ней нет ничего сложного.

Для этого мы:

Установим Python
Создадим и активируем виртуальное окружение при помощи базовых инструментов pip и venv
В качестве примера установим библиотеки notebook и pandas
Читать полностью »

Полный цикл аналитической разработки за пару минут

2025-01-14 в 8:15, admin, рубрики: ‎analitycs‬, BI, metabase, pandas

Сталкивались ли вы в вашей компании с проблемами?

Невозможностью по-быстрому создать таблицу. Вместо этого нужно катить миграцию, получать апрувы от DWH, следить за тем чтобы таблица была производительна и тд
Вам не нравится BI вашей компании или нравится но но хотелось бы делать визуализацию быстрее.

Если да, то эта статья для вас!

*Эта статья написана аналитиком для аналитиков! Если вы разработчик, DevOps или не дай бог DBA - уходите!
Читать полностью »

Создаём свой реестр данных на основе ФГИС «Аршин». Часть 1 — добавляем данные в PostgreSQL и сокращаем размер БД

2024-10-19 в 8:15, admin, рубрики: pandas, postgresql, sqlalchemy, АРШИН, обработка данных, реестр данных

Всем привет. Этот практический цикл статей рассчитан на начинающих. Я решил поделиться своим опытом создания реестра данных на основе государственного. Данные будут храниться в базе данных PostgreSQL, доступ к ним будет осуществляться через Fast API. В текущей статье займёмся загрузкой данных в базу и уменьшением её размеров.

Введение

Нам предстоит работать с данными о результатах поверки средств измерений, которые будем загружать из раздела сайта «Результаты поверок СИ Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «pandas»

Лагерь сделал из поэта язычника. Проследил динамику философских взглядов Заболоцкого с помощью Python

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

Сердце не сыто. Python помогает раскрыть особенности мастерства поэта Вознесенского

Автоматизация сбора и анализа вакансий с сайта Хэдхантер

Для чего ИТ менеджеру уметь программировать. И главное — зачем

Экономия RAM с pandas.read_sql

Как мы искали должников при помощи Pandas

Python для начинающих дата-аналитиков: как настроить виртуальное окружение?

Введение

Полный цикл аналитической разработки за пару минут

Создаём свой реестр данных на основе ФГИС «Аршин». Часть 1 — добавляем данные в PostgreSQL и сокращаем размер БД

Введение