python常见的5种框架

python常见的5种框架1.scrapy框架scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取web页面并提取出我们关注的结构化数据。scrapy框架的应用领域有许多,比如网络爬虫,数据挖掘、数据监测、自动化测试等。scrapy框架是一套开源的框架,…

大家好,又见面了,我是你们的朋友全栈君。

1.scrapy框架

               scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取web页面并提取出我们关注的结构化数据。

               scrapy框架的应用领域有许多,比如网络爬虫,数据挖掘、数据监测、自动化测试等。

               scrapy框架是一套开源的框架,开源也就意味着我们能够看到并且免费试用scrapy的所有代码。

2.crawley框架

               crawley也是使用python开发出来的一款爬虫框架,该框架致力于改变人们从互联网中提取数据的方式,让大家可以更高效地从互联网中爬取对应内容。

                crawley框架的主要特点有:

                1>高速爬取对应网站内容

                 2> 可以将爬取到内容轻松地存储到数据库中,比如:postgres,mysql,oracle,sqlite等数据库

                 3>可以将爬取到的数据导出为json,xml等格式

                 4>支持非关系型数据库,比如:mongodb,couchdb等

                 5>支持使用命令行工具

                 6>可以使用你喜欢的工具提取数据,比如使用xpath或者pyquery等工具

                 7>支持使用cookie登陆并访问哪些只有登陆才能够访问的网页

                 8>简单易学

3.portia框架

                  portia框架是一款允许没有任何编程基础的用户可视化地爬取网页的爬虫框架,给出你要爬取的网页中感兴趣的数据内容,通过portia框架,可以将你所需要的信息从相似的网页中自动提取出来,如果需要,可以子啊github上的主页进行获取。如果需要,上百度自己查吧,,具体的我就不写了。

 4.newspaper框架

                   newspaper框架是一种用来提取新闻、文章以及内容分析的python爬虫框架。更准确地说,newspaper是一个python的库,只不过这个库是由第三方开发的,可以归为一种框架。

                    newspaper框架在的主要特点:

                     1>比较简单

                     2>速度比较快

                     3>支持多线程

                     4>支持十多种语言

                     由此我们可以知道newspaper框架是轻量级框架,并且就爬取文章信息这一功能来说,使用起来很方便

5.Python-goose框架

                      coose本来是一款用java写的文章提取工具,Xavier Grangier用python重写了goose,并将重写后goose命名为python-goose。

                      所以,python-coose框架实现的功能同样是进行文章提取。

 

 

以上是python常用的5种框架,这是我知道,,如果各位大神,还有其他的 ,也可以留言,相互沟通,学习。另外后面3种框架可以再github上找到。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/134623.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 微型计算机的性能主要由微处理器的什么,微型计算机的性能主要由微处理器的什么决定…「建议收藏」

    微型计算机的性能主要由微处理器的什么,微型计算机的性能主要由微处理器的什么决定…「建议收藏」大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。微型计算机的性能主要由微处理器的控制器决定的。控制器是指按照预定顺序改变主电路或控制电路的接线和改变电路中电阻值来控制电动机的启动、调速、制动和反向的主令装置。微型计算机,是指由微处理器作为CPU的计算机。由大规模集成电路组成的、体积较小的电子计算机。由微处理机(核心)、存储片、输入和输出片、系统总线等组成。特点是体积小、灵活性大…

    2022年6月28日
    28
  • 无应答事务的性能测试方法

    无应答事务的性能测试方法

    2022年4月2日
    37
  • golang 2021激活 3月最新注册码

    golang 2021激活 3月最新注册码,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月15日
    94
  • refseq数据库的特点_eureka如何剔除服务

    refseq数据库的特点_eureka如何剔除服务在SCOTTHANSELMAN博客上看到一个好东西《Exploringrefit,anautomatictype-safeRESTlibraryfor.NETStandard》,他推荐了一个.NET标准1.4的自动类型安全的REST库refit。refit类似于Java的Retrofit,是一套RESTful架构的.NET客户端实现,基于特性,提供把REST…

    2022年10月30日
    0
  • Java_BigDecimal类型比较大小

    Java_BigDecimal类型比较大小这个类是java里精确计算的类1比较对象是否相等一般的对象用equals,但是BigDecimal比较特殊,举个例子:BigDecimala=BigDecimal.valueOf(1.0);BigDecimalb=BigDecimal.valueOf(1.000);在现实中这两个数字是相等的,但是问题来来了…

    2022年7月14日
    21
  • 微型计算机硬件系统的性能主要取决6,大学计算机基础单选试题「附答案」

    微型计算机硬件系统的性能主要取决6,大学计算机基础单选试题「附答案」大学计算机基础单选试题「附答案」一、单选题1.世界上首次提出存储程序计算机体系结构的是(D)A.莫奇莱B.艾仑·图灵C.乔治·布尔D.冯·诺依曼2计算机诞生于(B)A.1941年B.1946年C.1949年D.1950年3、世界上第一台电子数字计算机采用的主要逻辑部件是(A)A.电子管B.晶体管C.继电器D.光电管4、下列叙述正确的是(D)A.世界上第一台电子计算机ENIAC…

    2022年6月28日
    53

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号