Конструкторский проект «Парсеры. Сбор информации с сайта читай-город»
Автор: Сидиков Никита Александрович
Место работы/учебы: МОУ Гимназия г. Малоярославца, Калужская область, 11 класс
Научный руководитель: Калашников Виктор Сергеевич, учитель информатики
Аннотация
За последние годы результатом технического прогресса является переизбыток информации. Порой человек просто не в состоянии систематизировать гигантский объем информации вручную. Программа-парсер способна автоматизировано собирать информацию с различных сайтов, что намного увеличивает производительность работы человека.
Цель — создание парсера, который выборочно сохраняет информацию о книгах определенного жанра.
Задачи проекта:
- Узнать больше информации о парсинге, видах парсеров.
- Научиться создавать парсер на основе языка программирования Python.
- Написать код, учитывая все нюансы сайта и браузера.
- Написать ошибки, которые могут возникнуть во время работы программы.
- Сделать выводы по окончании работы.
Срок выполнения проекта — 9 месяцев.
Результаты
Результатом проекта является программа-парсер, стабильно работающая на сайте Читай-города. Время работы программы варьируется от 30 секунд до нескольких минут. При ручном сборе информации время работы могло составить от нескольких минут до часа. Программа упрощает жизнь обычному пользователю в несколько раз. При доработке или модернизации программы она может быть использована в более масштабных проектах (например, сбор статистики о посещаемости гос. сайтов). Результатом работы программы является txt-файл с описанием книг определенного жанра (ссылка на книгу, аннотация, автор, цена, характеристики)
Содержание работы
Если прикрепленный файл не отображается, перегрузите, пожалуйста, страницу
Дата публикации работы: 28.12.2022
Добавить комментарий