python3.8安装scrapy_python为什么叫爬虫

python3.8安装scrapy_python为什么叫爬虫安装Scrapy与安装其他Python包没有区别,同样使用如下命令来安装:pipinstallscrapy如果在命令行窗口中运行该命令,将会看到程序并不立即下载、安装Scrapy,而是不断地下载大量第三方包。如果在命令行窗口中提示找不到pip命令,则也可以通过python命令运行pip模块来安装Scrapy,例如python-mpipinstallscrapy…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

安装 Scrapy 与安装其他 Python 包没有区别,同样使用如下命令来安装:

pip install scrapy

如果在命令行窗口中运行该命令,将会看到程序并不立即下载、安装 Scrapy,而是不断地下载大量第三方包。

如果在命令行窗口中提示找不到 pip 命令,则也可以通过 python 命令运行 pip 模块来安装 Scrapy,例如 python -m pip install scrapy。

这是因为 Scrapy 需要依赖、大量第三方包。典型的,Scrapy 需要依赖如下第三方包:

pyOpenSSL:Python 用于支持 SSL(Security Socket Layer)的包。

cryptography:Python 用于加密的库。

CFFI:Python 用于调用 C 的接口库。

zope.interface:为 Python 缺少接口而提供扩展的库。

lxml:一个处理 XML、HTML 文档的库,比 Python 内置的 xml 模块更好用。

cssselect:Python 用于处理 CSS 选择器的扩展包。

Twisted:为 Python 提供的基于事件驱动的网络引擎包。

……

如果在 Python 环境下没有这些第三方包,那么 Python 会根据依赖自动下载并安装它们。这个过程原本没啥好讲的,pip 通常会自动完成整个过程,我们只需要等待即可。但 pip 在自动下载、安装 Twisted 时会提示以下错误:

error:Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”:http://landinghub.visualstudio.com/visual-cpp-build-tools

按照上面的错误提示,我们需要先下载和安装 Microsoft Visual C++ Build Tools 工具,然后才能安装 Twisted。为了安装一个小小的 Twisted 包,难道就需要安装一个庞大的 Microsoft Visual C++ Build Tools?

答案是否定的,提示上面的错误只是因为 pip 自动下载的 Twisted 安装包有一些缺陷,因此可以先自行下载 Twisted 安装包。登录 www.lfd.uci.edu/~gohlke/pythonlibs/ 站点,在该页面中间查找“Twisted”项目,可以看到如图 1 所示的下载链接。

8-1561110674.gif

图 1 Twisted 包的下载链接

从图 1 所示的链接可以看到,当前 Twisted 的最新版是 18.9.0,Twisted 为 2.7、3.5、3.6、3.7 等不同版本的 Python 提供了对应的安装包。由于本教程内容主要以 Python 3.6 为主,因此应该下载 Twisted 的 Python 3.6 版本,其中文件名带 win32 的是 32 位版本,而带 win_amd64 的则是 64 位版本,此处还需要根据操作系统的位数选择对应的版本。

在下载了合适的 Twisted 安装包后,会得到一个 Twisted-18.9.0-cp36-cp36m-win_amd64.whl 文件(针对 64 位系统的),该文件就是 Twisted 安装包。

运行如下命令来安装 Twisted 包。

pip install Twisted-18.9.0-cp36-cp36m-win_amd64.whl

在安装过程中会自动检查,如有必要,会自动下载并安装 Twisted 所依赖的第三方包,如 zope.interface、Automat、incremental 等。

在安装完成后,会提示如下安装成功的信息:

Successfully installed Twisted-18.9.0

在成功安装 Twisted 包之后,再次执行 pip install scrapy 命令,即可成功安装 Scrapy。在安装成功后,会显示如下提示信息:

Successfully installed Scrapy-1.6.1

在成功安装 Scrapy 之后,可以通过 pydoc 来查看 Scrapy 的文档。在命令行窗口中输入如下命令:

python -m pydoc -p 8899

运行上面命令之后,打开浏览器查看 http://localhost:8899/ 页面,可以在 Python 安装目录的libsite-packages下看到 Scrapy 的文档,如图 2 所示。

8-1561110674.jpeg

图 2 Scrapy 的文档

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/192297.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 命名规范与规则

    命名规范与规则命名规范1、项目名全部小写,就是如果项目名是多个英语单词组成的,每个单词都要全部小写。如:doubanssm。2、包名全部小写。3、类名首字母大写,若类名由多个单词构成,每个单词首字母大写,即

    2022年7月1日
    29
  • 解决TimeWait过多的问题

    解决TimeWait过多的问题原文链接:https://www.tiejiang.org/27040.html1、time_wait的作用:TIME_WAIT状态存在的理由:1)可靠地实现TCP全双工连接的终止在进行关闭连接四次挥手协议时,最后的ACK是由主动关闭端发出的,如果这个最终的ACK丢失,服务器将重发最终的FIN,因此客户端必须维护状态信息允许它重发最终的ACK。如果不维持这个状态信息,那么客户端将响应RST分节,服务器将此分节解释成一个错误(在java中会抛出connectionreset的SocketExc

    2022年6月10日
    42
  • 数据库复习笔记(全覆盖,包括往年部分真题)

    ##1、数据库系统概述**1.1数据库的基本概念**数据库:长期储存在计算机内、有组织的、可共享的大量数据的集合。*基本特征:*数据按一定的数据模型组织、描述和储存可为各种用户共享、冗余度较小、易扩展数据独立性较高数据:描述事物的符号记录数据有结构的:记录是计算机存储数据的一种格式或一种方法数据库管理系统及其功能:位于…

    2022年4月8日
    44
  • Java多线程和线程池

    Java多线程和线程池

    2020年11月12日
    174
  • pycharm运行不了程序_如何完全卸载pycharm

    pycharm运行不了程序_如何完全卸载pycharm在尝试了各种常规操作后,均无法打开,最后终于解决了!!!现在cmd中输入pycharm报错OpenJDK64-BitServerVMwarning:OptionUseConcMarkSweepGCwasdeprecatedinversion9.0andwilllikelyberemovedinafuturerelease.ErroroccurredduringinitializationofVMInitialheapsizesettoa

    2022年8月29日
    0
  • stm32f103c6t6引脚图_74ls163引脚图及功能表

    stm32f103c6t6引脚图_74ls163引脚图及功能表今天准备画一个STM32F103C8T6的最小系统板,就去STM32F103C8的数据手册查看了一下相应的引脚,因为数据手册里面的引脚表有中容量的多种封装描述,看上去比较麻烦,我就单独做了一个LQFP48脚的引脚表。方便后期自己画封装,就图看的省力一点哈。其部分图片如下所示:有需要的朋友可以从我的资源里去下,资源链接:STM32F103C8T6详细引脚表本人水平有限,上述信息仅供学习参考,如有错误和不妥之处,请多多指教。另外创作不易,请勿抄袭,如果有帮助到大家的话希望大家可以点个赞,谢谢~…

    2022年9月25日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号