Название | Содержание |
---|---|
news_parsing.py | Файл с функциями |
theeconomist.pkl | Статьи за март/апрель в The Economist |
march_newyorktimes.pkl | Статьи за март в New York Times |
april_newyorktimes.pkl | Статьи за апрель в New York Times |
requirements.txt | Требуемые библиотеки |
Парсинг новостей в The Economist (консервативный новостной источник) и New York Times (либеральный новостной источник) за март и апрель 2022.
Часто в рамках проектов, исследовательских работ нужно собирать данные из первоисточников: наиболее свежие и релевантные данные легче собрать самим, чем ждать пока кто-нибудь выложит датасет с необходимой вам информацией. Чтобы не возникало проблем с отсутствием данных, в рамках этого проекта мы научимся их собирать сами.
Наша команда преследовала две основные задачи:
- Проанализировать наиболее популярные темы среди новостных сайтов, либерального и консервативного, и сравнить их
- Оптимизировать поиск информации на просторах Интернета в будущем благодаря тому, что код можно будет переиспользовать
Для настройки необходимых пакетов python для скрипта введите в командной строке:
pip install -r "requirements.txt"
Telegram: @sophi_nikol, @neonoir453, @Polyanka003, @allmoon18
VK: https://vk.com/nik_sophi, https://vk.com/societyfk, https://vk.com/id174055319, https://vk.com/id194134042
Email: nikolenko.sofiya@list.ru, max2003-02@mail.ru, Pashinskaya03@list.ru, alelse24@yandex.ru