发布于 2015-09-04 06:57:08 | 308 次阅读 | 评论: 0 | 来源: 网络整理

内置异常参考手册(Built-in Exceptions reference)

下面是Scrapy提供的异常及其用法。

DropItem

  • exception scrapy.exceptions.DropItem
  •  

该异常由item pipeline抛出,用于停止处理item。详细内容请参考 Item Pipeline

CloseSpider

  • exception scrapy.exceptions.CloseSpider(reason='cancelled')
  • 该异常由spider的回调函数(callback)抛出,来暂停/停止spider。支持的参数:

    参数: reason (str) – 关闭的原因

样例:

def parse_page(self, response):
    if 'Bandwidth exceeded' in response.body:
        raise CloseSpider('bandwidth_exceeded')

IgnoreRequest

  • exception scrapy.exceptions.IgnoreRequest
  •  

该异常由调度器(Scheduler)或其他下载中间件抛出,声明忽略该request。

NotConfigured

  • exception scrapy.exceptions.NotConfigured
  •  

该异常由某些组件抛出,声明其仍然保持关闭。这些组件包括:

  • Extensions
  • Item pipelines
  • Downloader middlwares
  • Spider middlewares

该异常必须由组件的构造器(constructor)抛出。

NotSupported

  • exception scrapy.exceptions.NotSupported
  •  

该异常声明一个不支持的特性。

最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务