python常见的5种框架

python常见的5种框架1.scrapy框架scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取web页面并提取出我们关注的结构化数据。scrapy框架的应用领域有许多,比如网络爬虫,数据挖掘、数据监测、自动化测试等。scrapy框架是一套开源的框架,…

大家好,又见面了,我是你们的朋友全栈君。

1.scrapy框架

               scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取web页面并提取出我们关注的结构化数据。

               scrapy框架的应用领域有许多,比如网络爬虫,数据挖掘、数据监测、自动化测试等。

               scrapy框架是一套开源的框架,开源也就意味着我们能够看到并且免费试用scrapy的所有代码。

2.crawley框架

               crawley也是使用python开发出来的一款爬虫框架,该框架致力于改变人们从互联网中提取数据的方式,让大家可以更高效地从互联网中爬取对应内容。

                crawley框架的主要特点有:

                1>高速爬取对应网站内容

                 2> 可以将爬取到内容轻松地存储到数据库中,比如:postgres,mysql,oracle,sqlite等数据库

                 3>可以将爬取到的数据导出为json,xml等格式

                 4>支持非关系型数据库,比如:mongodb,couchdb等

                 5>支持使用命令行工具

                 6>可以使用你喜欢的工具提取数据,比如使用xpath或者pyquery等工具

                 7>支持使用cookie登陆并访问哪些只有登陆才能够访问的网页

                 8>简单易学

3.portia框架

                  portia框架是一款允许没有任何编程基础的用户可视化地爬取网页的爬虫框架,给出你要爬取的网页中感兴趣的数据内容,通过portia框架,可以将你所需要的信息从相似的网页中自动提取出来,如果需要,可以子啊github上的主页进行获取。如果需要,上百度自己查吧,,具体的我就不写了。

 4.newspaper框架

                   newspaper框架是一种用来提取新闻、文章以及内容分析的python爬虫框架。更准确地说,newspaper是一个python的库,只不过这个库是由第三方开发的,可以归为一种框架。

                    newspaper框架在的主要特点:

                     1>比较简单

                     2>速度比较快

                     3>支持多线程

                     4>支持十多种语言

                     由此我们可以知道newspaper框架是轻量级框架,并且就爬取文章信息这一功能来说,使用起来很方便

5.Python-goose框架

                      coose本来是一款用java写的文章提取工具,Xavier Grangier用python重写了goose,并将重写后goose命名为python-goose。

                      所以,python-coose框架实现的功能同样是进行文章提取。

 

 

以上是python常用的5种框架,这是我知道,,如果各位大神,还有其他的 ,也可以留言,相互沟通,学习。另外后面3种框架可以再github上找到。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/134623.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • php三个数从大到小排列_php常用的流程控制语句

    php三个数从大到小排列_php常用的流程控制语句<?php$a = rand(100,999);$b = rand(100,999);$c = rand(100,999);echo “a=”.”$a”.”<br>”;echo “b=”.”$b”.”<br>”;echo “c=”.”$c”.”<br>”;if(($a > $b ) && ($a > …

    2022年8月18日
    5
  • pycharm 修改镜像源_如何设置linux服务器镜像源

    pycharm 修改镜像源_如何设置linux服务器镜像源由于国外的镜像源安装Python速度较慢,选择国内的镜像速度较快,这篇文章如要讲述如何设置国内镜像源。常用镜像源:清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/方法一:…

    2022年8月29日
    3
  • 主成分分析(PCA)原理详解「建议收藏」

    “微信公众号”本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/Xt1vLQfB20rTmtLjiLsmww本文同步更新在我的知乎专栏里面:主成分分析(PCA)原理详解-Microstrong的文章-知乎https://zhuanlan.zhihu.com/p/377770741.相关背景在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观…

    2022年4月16日
    31
  • mysql phpmyadmin配置_phpmyadmin 配置方法与安装教程[通俗易懂]

    mysql phpmyadmin配置_phpmyadmin 配置方法与安装教程[通俗易懂]今天我们来看看phpmyadmin配置教程吧,也可以叫做phpmyadmin安装吧,安装我就不说了,你直接到网上下载一个phpmyadmin包解压到你的站点目录,就行了.下面我们来看个简单的例子吧.安装目录:/admin/好了我们现在打开我们刚才解压的文件夹找到config.sample.inc.php把它改名为config.inc.php下面我们就打开这个文件.找到$cfg[‘PmaAbs…

    2022年5月6日
    31
  • python 配对t检验_配对t检验的python实现

    python 配对t检验_配对t检验的python实现以真实商业案例为数据基础,课程内容围绕scipy.stats和statsmodels包的相关功能展开,从统计分析实战的角度出发详细介绍了如何在Python中完成数据描述、t检验、单因素方差分析、卡方检验、相关回归等统计分析操作。通过本课程的学习,学员将深入学习如何正确考察这些方法的适用条件,正确选择所需的方法加以应用,从而既满足了相关统计分析功能的需求,又为进一步学习statsmodels包中的复…

    2022年6月19日
    29
  • Java 解析 XML[通俗易懂]

    Java 解析 XML[通俗易懂]Java解析XML标签:Java基础XML解析技术有两种DOMSAXDOM方式根据XML的层级结构在内存中分配一个树形结构,把XML的标签,属性和文本等元素都封装成树的节点对象优点:便于实现增删改查缺点:XML文件过大可能造成内存溢出SAX方式采用事件驱动模型边读边解析:从上到下一行行解析,解析到某一元素,调用相应解析方法优点:不会造成内存溢出,缺点:

    2022年6月4日
    33

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号