Главная

Рубрика «beautifulsoup»

Парсинг сайтов на Python: изучаем BeautifulSoup

2026-01-18 в 11:16, admin, рубрики: beautifulsoup, scraping, парсинг

BeautifulSoup используется для эффективного поиска элементов на html странице.

Установка:

pip install beautifulsoup4, lxml

Для запросов установите библиотеку requests, если она у вас не установлена:

pip install requests

Тренироваться будем на "тренажёре".

Получаем HTML-документ по HTTP и строим DOM-дерево с помощью BeautifulSoup

from bs4 import BeautifulSoup
import requests

response = requests.get('http://parsingme.ru/beautifulsoup/1.html')
soup = BeautifulSoup(response.text, 'lxml')
print(soup)

Первым параметром мы передаем html-код страницы, а вторым парсер. Помимо lxml (это лучший вариант) парсер может быть:

html.parser - не прощает ошибок в html, зато не требует установки
Читать полностью »

Парсинг российских СМИ

2025-07-23 в 6:16, admin, рубрики: beautifulsoup, python, selenium, парсинг, сбор данных

Разбираем на примере Russia Today, Коммерсант и Meduza*

Читать полностью »

Простые лайфхаки для автоматизации работы с помощью Python

2025-02-18 в 13:00, admin, рубрики: autopep8, beautifulsoup, Excel, json, python, shutil, автоматизация, веб-скрапинг, отправка отчётов, скрипты для автоматизации

Когда только начинаешь кодить, многое приходится делать вручную: переименовывать файлы, проверять данные, снова и снова запускать тест. Это нормально, но рано или поздно приходит мысль: «А можно ли сделать так, чтобы всё работало само?»

Всё, конечно, не заработает, но Python заметно сокращает рутину. Например, с его помощью можно скачивать файлы, отправлять отчёты, проверять API, заходить в браузер и кликать по кнопкам. Если какое-то действие приходится выполнять слишком часто — значит, пора его автоматизировать.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «beautifulsoup»

Парсинг сайтов на Python: изучаем BeautifulSoup

Парсинг российских СМИ

Разбираем на примере Russia Today, Коммерсант и Meduza*

Простые лайфхаки для автоматизации работы с помощью Python