Файлы к уроку: Файлы доступны только спонсорам канала. Оформите спонсорскую подписку всего за 49 — 149 рублей, если хотите получить максимум от обучения.
В этом уроке мы разберем следующие темы:
- Как автоматизировать браузер
- Как автоматически получать информацию с сайтов с Python Selenium
- Как автоматически скачивать файлы с Python Selenium
- Как автоматически получать информацию из ЕГРЮЛ
- Как автоматически скачивать выписки из ЕГРЮЛ
Для решения этих задач мы будем использовать Selenium — модуль Python. Этот модуль позволяет автоматизировать работу браузера. В данном уроке мы разберем его работу на примере браузера Mozilla Firefox.
Задачи, которые чаще всего решают с помощью Python Selenium:
- Открытие веб-страниц
- Получение текстового содержимого из определенных блоков веб-страниц
- Заполнение форм на веб-страницах
- Скачивание файлов
Мы познакомимся с модулем Selenium на примере сайта egrul.nalog.ru. Имея большой список ИНН мы получим информацию по каждому ИНН и запишем эту информацию в CSV файл. Также мы научимся скачивать PDF выписки из ЕГРЮЛ.