基于scrapy的redis安装和配置方法_Python

基于scrapy的redis安装和配置方法

2021-03-04 00:22成吉思潇 Python

今天小编就为大家分享一篇基于scrapy的redis安装和配置方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

在定向爬虫的制作过程中，使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库，它把数据保存在内存里。因此可以有非常快的数据读写速度。

1 2	`pip install scrapy-redis` `easy_install scrapy-redis`

下载

http://redis.io/download

版本推荐

1	`stable` `3.0.2`

运行redis

1	`redis-server redis.conf`

清空缓存

1	`redis-cli flushdb`

scrapy配置redis

settings.py配置redis

									SCHEDULER = "scrapy_redis.scheduler.Scheduler"

									SCHEDULER_PERSIST = True

									SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'

									REDIS_URL = None # 一般情况可以省去

									REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost

									REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

									class tempSpider(RedisSpider) 

									name = "temp"

									redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持服务器之家。

原文链接：https://blog.csdn.net/xx1710/article/details/51187356

基于scrapy的redis安装和配置方法

延伸 · 阅读

python 列表转为字典的两个小方法(小结)

python直接访问私有属性的简单方法

使用NumPy和pandas对CSV文件进行写操作的实例

Python3以GitHub为例来实现模拟登录和爬取的实例讲解

Python的dict字典结构操作方法学习笔记

在Windows系统上搭建Nginx+Python+MySQL环境的教程

python 插入Null值数据到Postgresql的操作

Python实现ping指定IP的示例

PyCharm设置SSH远程调试的方法

Python安装图文教程 Pycharm安装教程

python是什么意思？python有什么用？

使用Python抓取模板之家的CSS模板

Python 列表(List)操作方法详解