Skip to content

Latest commit

 

History

History
28 lines (22 loc) · 457 Bytes

README.md

File metadata and controls

28 lines (22 loc) · 457 Bytes

Tgdd Crawler

Crawler để cào thông tin sản phẩm từ website https://www.thegioididong.com/

Hiện tại chỉ cào được các category sau:

  • may-tinh-bang
  • dtdd
  • lap-top
  • dong-ho-thong-minh
  • dong-ho-deo-tay

Installation

Install Scrapy

pip install Scrapy

Usage

  • Cào hết các category, hơi lâu tẹo :v
scrapy crawl tgdd
  • Cào theo category
scrapy crawl tgdd -a category=may-tinh-bang