Scrapy307重定向

Scrapy307重定向最近在用 Scrapy 写爬虫 但是爬取有的网站时会出现 307 重定向的错误 使得无法爬取到正确网站 这往往是因为原网站采用了反爬虫机制导致的 在 StackOverFlo 上有人提出了这个问题 scrapy307red 这里的答案指出了 307 是 Cookie 的问题 它的建议是打开 Cookie 并需要自己分析哪些是网站真正需要的用来鉴别是机器访问还是认为访问的数据

在这里插入图片描述
是否是我这种情况,可以通过一个简单的方式来鉴别,请仔细看红框部分,即真实爬取的网页的URL后面比起预先定义的URL多了个UUID和vid,那么就表示开启了cookie,使用上述方式关闭即可。
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/226483.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午10:47
下一篇 2026年3月16日 下午10:48


相关推荐

  • django 验证码_rhino5授权验证失败

    django 验证码_rhino5授权验证失败验证和授权概述Django有一个内置的授权系统。他用来处理用户、分组、权限以及基于cookie的会话系统。Django的授权系统包括验证和授权两个部分。验证是验证这个用户是否是他声称的人(比如用户名

    2022年7月30日
    7
  • STM32与S3C2440的区别

    STM32与S3C2440的区别在学习嵌入式的路上,我们可能会接触到这两个比较典型的MCU。其中最大的区别就是S3C2440能跑linux操作系统,常常作为学习嵌入式linux的硬件平台。可能大家会问既然S3C2440能跑linux操作系统,似乎比stm32厉害多了,为什么不直接去学习S3C2440呢?下面我就大概解释一下大家遇到的困惑:1.先来说说stm32stm32是ST公司推出的基于Cortex-M3内核的

    2022年4月30日
    62
  • 大数据—Hadoop生态圈

    大数据—Hadoop生态圈前言整理了一下目前常用的 hadoop 组件 后续将会对这些组件的具体应用场景和使用细节进行展开分析 如果大家发现有更好的建议欢迎大家在下方留言

    2026年3月17日
    2
  • 评价类模型——层次分析法,一致性检验

    评价类模型——层次分析法,一致性检验

    2021年11月22日
    66
  • 磁盘分区方案GPT和MBR的区别浅谈 – 教程

    磁盘分区方案GPT和MBR的区别浅谈 – 教程

    2026年3月15日
    2
  • 关系数据库基础理论[通俗易懂]

    关系数据库基础理论[通俗易懂]mysql系列之一关系数据库基础理论正是数据库管理的需要催生了数据库管理系统DBMS,而关系型数据库管理系统为RDBMS常见的数据模型有三种:-层次模型-网状模型-关系模型一、关系数据库的产生在DBMS出现之前,人们用文件来管理数据,但存在很多缺陷:1.数据冗余和不一致性。数据冗余表示在每个shell脚本中基本上都是/bin/bash,但很多用户使用…

    2022年10月16日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号