Dados públicos (Open Data) do GOV.BR - Agência Nacional de Petróleo, Gás Natural e Biocombustíveis.
Facilitar o download ou a atualização dos dados da ANP (Agência Nacional do Petróleo, Gás Natural e Biocombustíveis). Atualmente o projeto possui 2 soluções de downloads possíveis, carga e unificação dos dados consolidados das últimas 4 semanas e carga e unificação dos dados históricos de Combustíveis Automotivos.
- Faz uma captura no HTML da página do site que os dados são disponibilizados, obtem o url das bases que tem a atualização dos dados das últimas 4 semanas.
- Transforma o resultado da requisição em um dataframe
- Executa a unificação dos arquivos em um só e consolida como um .csv legível no diretório ./dados/
![image](https://private-user-images.githubusercontent.com/69797535/319053251-f8084826-2b94-43de-8acf-af833c835df2.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MzkxMTA2MzQsIm5iZiI6MTczOTExMDMzNCwicGF0aCI6Ii82OTc5NzUzNS8zMTkwNTMyNTEtZjgwODQ4MjYtMmI5NC00M2RlLThhY2YtYWY4MzNjODM1ZGYyLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNTAyMDklMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjUwMjA5VDE0MTIxNFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWQ3Y2NmMWRmNzVjNjViZDJjY2ZmZWMyOWVlYzU2NDBmNGM5ODcxZDNmNzE0MDA2ZTM0YmM2N2IzYWM4NzM0ZjImWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.RqnGiUREUOX-HV1Tew-LjJ-oV-x9PpHRu-NBIU2vUPM)
- Output: ./dados/dados_consolidados_combustivel.csv
- Executa uma série de funções responsáveis por identificar as URLs dentro do HTML da página, armazená-los e depois executar seus downloads.
- Extração dos arquivos zipados
- Definição do schema final para os dados
- Processamento dos arquivos em um só arquivo unificado
- Output: ./dados/historico_combustivel_auto.csv
A forma de utilização é simples, necessário ter python >3.9 instalado e as dependências abaixo. Após isso é só clonar o repositório localmente e executar os scripts conforme necessidade.
pip install requests
pip install polars