使用 python+selenium 完成对 boss 互联网相关岗位的数据爬取以及数据清洗,
并分析数据,生成图表仪表盘,显示于 web 页面。以及热力图。
数据分析建议:数据分析建议
-
Environment
python -m venv .venv .\.venv\Scripts\activate # Depends on your OS pip install -r requirements.txt
本人使用的环境:
软件 版本 python 3.9.13 mysql 8.3 -
Run
python main.py
初次使用需要先 init 数据库 数据清洗如果选择 csv 方式(参考 Config),需要爬取的数据导出到 csv 文件,放在
input_data
目录下。 清洗的数据会存入数据库,以及导出到output_data
目录。
config.json
配置文件
修改其中参数,如数据库连接信息,爬虫参数,Server 参数,web 页面的一些信息等。