Skip to content

Latest commit

 

History

History
27 lines (13 loc) · 619 Bytes

README.md

File metadata and controls

27 lines (13 loc) · 619 Bytes

ZhihuCrawler

爬取知乎所有用户信息~仅供学习使用

技术栈

  • 支持账号池,多账号轮流爬取信息,登录参考zhihu-py3
  • 社交关系爬取采用BFS,沿着关注关系爬取
  • 采用redis存储搜索队列,支持断点续爬
  • 采用mongodb存储用户信息
  • 采用elasticsearch,kibana做数据分析(待完成)

使用方式

具体参考我的博客: happyfarmer