scrapy中ROBOTSTXT_OBEY = True的相关说明「建议收藏」

scrapy中ROBOTSTXT_OBEY = True的相关说明「建议收藏」转载自  https://blog.csdn.net/you_are_my_dream/article/details/60479699在scrapy中创建项目以后,在settings文件中有这样的一条默认开启的语句:#Obeyrobots.txtrulesROBOTSTXT_OBEY=True观察代码可以发现,默认为True,就是要遵守robots.txt的规则,那么ro…

大家好,又见面了,我是你们的朋友全栈君。

转载自  https://blog.csdn.net/you_are_my_dream/article/details/60479699

在scrapy中创建项目以后,在settings文件中有这样的一条默认开启的语句:

# Obey robots.txt rules  
ROBOTSTXT_OBEY = True  

观察代码可以发现,
默认为True
,就是要遵守robots.txt 的规则,那么 robots.txt 是个什么东西呢?

通俗来说, robots.txt 是遵循 Robot协议 的一个文件,它保存在网站的服务器中,它的作用是,告诉搜索引擎爬虫,本网站哪些目录下的网页 不希望 你进行爬取收录。在Scrapy启动后,会在第一时间访问网站的 robots.txt 文件,然后决定该网站的爬取范围。

当然,我们并不是在做搜索引擎,而且在某些情况下我们想要获取的内容恰恰是被 robots.txt 所禁止访问的。所以,某些时候,我们就要将此配置项设置为 False ,拒绝遵守 Robot协议

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130366.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月14日 下午1:36
下一篇 2022年6月14日 下午1:46


相关推荐

  • linux安装python_精通Python自动化脚本-第一章 Python脚本概述

    linux安装python_精通Python自动化脚本-第一章 Python脚本概述精通 Python 自动化脚本 运维人员宝典完整目录 第一章 Python 脚本概述第二章 Python 脚本调试和性能测试第三章单元测试 单元测试框架的介绍第四章自动化常规运维活动第五章文件 目录和数据处理第六章文件存档 加密和解密第七章文本处理和正则表达式第八章文档和报告第九章操作各类文件第十章网络基础 Socket 编程第十一章使用 Python 脚本处理邮件第十二章使用 Telne

    2026年3月27日
    2
  • MANIFEST.MF是个什么?

    MANIFEST.MF是个什么?MANIFEST.MF是个什么?写这篇文件主要记录JRA文件里面到底是什么?然后MANIFEST.MF又是什么?Springboot如何只有Main方法就可以运行的?Springboot项目打包

    2022年7月1日
    19
  • 视频编码格式不支持_缺少编码解码器

    视频编码格式不支持_缺少编码解码器AVI格式视频文件编码格式缺少编码解释器且该项目的编码格式不受支持产生0xc00d5212错误(见下图)解决方案:将AVI格式视频转换为MP4格式视频文件。方式:通过格式工厂软件(见下图)。下载链接:点击下载格式工厂4.8.0.0官方免费版操作:一、下载好软件(格式工厂)之后,点击启动软件进去,点击红色箭头指向的红色框的内容(->MP4)。二、点击红色箭头指向的红色框的…

    2026年4月19日
    6
  • deepin uos 是否开源_deepin docker

    deepin uos 是否开源_deepin docker国产操作系统UOSDeepinLinux源码编译安装Nginx

    2022年10月5日
    5
  • tkmapper教程_tkr和tka的区别

    tkmapper教程_tkr和tka的区别tkMapper入门1、tkMapper介绍1.1SpringBoot整合MyBatis以及tkMapper1.2在启动类上修改注解`@MapperScan`2、tkMapper的使用2.1创建数据表2.2创建实体类2.3创建Mapper接口2.4测试3、tkMapper的常用方法3.1类别实体类3.2类别接口增加修改删除查询查询所有根据主键查询条件查询分页查询带条件的分页查询关联查询1、通过多个单表操作实现2、自定义连接查询2.1、在DAO接口自定义方法2.2、创建Mapper文件1、

    2022年10月7日
    6
  • java findwindow_Windows 的FindWindow函数使用

    java findwindow_Windows 的FindWindow函数使用函数功能 该函数获得一个顶层窗口的句柄 该窗口的类名和窗口名与给定的字符串相匹配 这个函数不查找子窗口 在查找时不区分大小写 函数型 HWNDFindWind LPCTSTRIpCla LPCTSTRIpWin 参数 IpClassName 指向一个指定了类名的空结束字符串 或一个标识类名字符串的成员的指针 IpWindowName 指向一个指定了窗口名 窗

    2026年3月16日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号