您当前的位置: 首页 >  scrapy
  • 3浏览

    0关注

    2393博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Crawler之Scrapy:基于scrapy框架实现爬虫两个网址下载网页内容信息之详细攻略

一个处女座的程序猿 发布时间:2018-03-17 22:52:15 ,浏览量:3

Crawler之Scrapy:基于scrapy框架实现爬虫两个网址下载网页内容信息之详细攻略

目录

输出结果

实现代码

输出结果

后期更新……

实现代码
import scrapy
class DmozSpider(scrapy.Spider): 
    name ="dmoz" 
    allowed_domains = ["dmoz.org"] 
    start_urls = [
        "https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
        "https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
        ]
    def parse(self,response): 
        filename = response.url.split("/")[-2] 
        with open(filename, 'wb') as f:  
            f.write(response.body) 

相关文章Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

关注
打赏
1664196048
查看更多评论
立即登录/注册

微信扫码登录

0.0465s