BeautifulSoup используется для эффективного поиска элементов на html странице.
Установка:
pip install beautifulsoup4, lxml
Для запросов установите библиотеку requests, если она у вас не установлена:
pip install requests
Тренироваться будем на "тренажёре".
Получаем HTML-документ по HTTP и строим DOM-дерево с помощью BeautifulSoup
from bs4 import BeautifulSoup
import requests
response = requests.get('http://parsingme.ru/beautifulsoup/1.html')
soup = BeautifulSoup(response.text, 'lxml')
print(soup)
Первым параметром мы передаем html-код страницы, а вторым парсер. Помимо lxml (это лучший вариант) парсер может быть:
-
html.parser - не прощает ошибок в html, зато не требует установки

