博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scrapy docker 基本部署使用
阅读量:6476 次
发布时间:2019-06-23

本文共 1531 字,大约阅读时间需要 5 分钟。

1. 简单项目
pip install scrapy scrapy startproject appdemo
 
 
2. 项目代码
a. 项目代码结构├── Dockerfile├── README.md├── appdemo│   ├── __init__.py│   ├── __pycache__│   ├── items.py│   ├── middlewares.py│   ├── pipelines.py│   ├── settings.py│   └── spiders│       ├── __init__.py│       ├── __pycache__│       └── book_spider.py└── scrapy.cfgb. 主要代码是book_spider.pyimport scrapyclass BookSpider(scrapy.Spider):    name="appdemo"    start_urls=["http://books.toscrape.com/"]    def parse(self,response):        for book in response.css("article.product_pod"):            name= book.xpath("./h3/a/@title").extract_first()            price=book.css("p.price_color::text").extract_first()            yield {                "name":name,                "price":price,            }            next_url=response.css("ul.pager li.next a::attr(href)").extract_first()            if next_url:                next_url=response.urljoin(next_url)                yield scrapy.Request(next_url,callback=self.parse)c. DockerfileFROM python:3.5RUN  pip install scrapyVOLUME [ "/data" ]WORKDIR /myappCOPY . /myappENTRYPOINT [ "scrapy","crawl","appdemo","-o","/data/appdemo.csv" ]备注: 为了简单使用了python:3.5 基础镜像,alpine 镜像存在包依赖的问题
 
3. 运行
a. 命令行运行scrapy crawl appdemo -o myinfo.csvb. docker builddocker build -t myscrapy .docker run -it -v $PWD/mydata:/data myscrapycat $PWD/mydata/appdemo.csvc. 直接使用dockerhub 镜像运行docker run -it -v $PWD/mydata:/data dalongrong/scrapydockerdemo
docker
 
4. 参考文档
https://docs.scrapy.org/en/latest/https://github.com/rongfengliang/scrapydockerdemo
 
 
 
 

转载地址:http://uelko.baihongyu.com/

你可能感兴趣的文章
【学习笔记】阿里云Centos7.4下配置Nginx
查看>>
VuePress手把手一小時快速踩坑
查看>>
dnsmasq安装使用和体验
查看>>
学习constructor和instanceof的区别
查看>>
Vijos P1881 闪烁的星星
查看>>
ABP理论学习之领域服务
查看>>
Qt 控制watchdog app hacking
查看>>
让所有IE支持HTML5的解决方案
查看>>
RDD之五:Key-Value型Transformation算子
查看>>
percona 5.7.11root初始密码设置
查看>>
Cognitive Security的异常检测技术
查看>>
Impress.js上手 - 抛开PPT、制作Web 3D幻灯片放映
查看>>
生活杂事--度过十一中秋
查看>>
Pyrex也许是一个好东西
查看>>
Java内部类总结
查看>>
WINFORM WPF字体颜色相互转换
查看>>
能力不是仅靠原始积累(三)
查看>>
实战:使用终端服务网关访问终端服务
查看>>
彻底学会使用epoll(一)——ET模式实现分析
查看>>
路由器的密码恢复
查看>>