您现在的位置是：首页 > 技术笔记网站首页 技术笔记

No78：Scrapy重写start_requests方法

Gilmty
技术笔记
2022年3月20日
1268已阅读
6

爬虫

简介scrapy的start_requests方法重写，添加更多操作。

有时scrapy默认的start_requests无法满足我们的需求，例如分页爬取，那就要对它进行重写，添加更多操作。

def start_requests(self):
    # 自定义功能
    yield scrapy.Request(url="http://test.com", method="GET", callback=self.parse)


def parse(self, response):
    print(response.url)

上一篇： No77：Scrapy管道的open_spider、close_spider

下一篇： No79：十大经典排序算法

No65：Charles证书设置为系统信任证书(root)
No66：Hadoop常用命令
No67：Python的URL解析方法
No68：Scrapy修改User-Agent
No69：Scrapy命令基本用法
No70：Scrapy在下载中间件中对URL进行修改
No71：Scrapy多个item时指定pipeline
No72：Scrapy多个spider时指定pipeline
No73：Scrapy多个爬虫同时运行
No74：Scrapy安装方法

新码农博客

您现在的位置是：首页 > 技术笔记网站首页 技术笔记

No78：Scrapy重写start_requests方法

相关文章

文章评论

特别推荐

推荐文章

点击排行

标签云

关注公众号

您现在的位置是：首页 > 技术笔记 网站首页技术笔记

No78：Scrapy重写start_requests方法

相关文章

文章评论

特别推荐

推荐文章

点击排行

标签云

关注公众号

您现在的位置是：首页 > 技术笔记网站首页技术笔记