scrapy中使用ip代理

在scrapy中使用ip代理需要借助中间件的功能

首先在settings中设置好中间件,中间件优先级数字越小的越先被调用

'DOWNLOADER_MIDDLEWARES':{
            'spider.spider.middlewares.ProxyMiddleWare':542,
            'spider.spider.middlewares.SelenuimDownloaderMiddleware':543
        }

然后编写中间件,拦截请求设置代理

class ProxyMiddleWare(object):
    def process_request(self, request, spider):
        '''对request对象加上proxy'''
        proxy = RedisClient().pop_proxy().decode("utf8")
        print("-------this is request ip----------:" + proxy)
        request.meta['proxy'] = proxy

    def process_response(self, request, response, spider):
        '''对返回的response处理'''
        # 如果返回的response状态不是200,重新生成当前request对象
        if response.status != 200:
            proxy = RedisClient().pop_proxy().decode("utf8")
            print("this is response ip:" + proxy)
            # 对当前reque加上代理
            request.meta['proxy'] = proxy
            return request
        return response

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

衣乌安、

嘿嘿,好心人赏俩钱儿~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值