您当前的位置: 首页 >  ide

Peter_Gao_

暂无认证

  • 1浏览

    0关注

    621博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

pyspider 基础应用

Peter_Gao_ 发布时间:2019-11-28 13:25:56 ,浏览量:1

系统初始示例

#!/usr/bin/env python # -*- encoding: utf-8 -*- # Created on 2019-11-28 11:25:10 # Project: foodmate

from pyspider.libs.base_handler import *

class Handler(BaseHandler):     crawl_config = {     }

    @every(minutes=24 * 60)     def on_start(self):         self.crawl('http://down.foodmate.net/standard/sort/1/', callback=self.index_page)

    @config(age=10 * 24 * 60 * 60)     def index_page(self, response):         for each in response.doc('a[href^="http"]').items():             self.crawl(each.attr.href, callback=self.detail_page)

    @config(priority=2)     def detail_page(self, response):         return {             "url": response.url,             "title": response.doc('title').text(),         }

 

 

数据库设置

关注
打赏
1664521772
查看更多评论
立即登录/注册

微信扫码登录

0.0382s