大众点评超详细爬虫系列3

大众点评超详细爬虫系列3绝对不容错过的大众点评爬虫系列

大家期待的大众点评系列终于更新啦!!

在上一节中我们已经学会通过xpath或者css选择器来对第二级类目所对应的节点进行定位,并且成功的获取到了我们所需要类目所对应的url链接,那我们获取到之后需要怎么做呢?

是不是应该进入我们获取到url链接所对应的网页呢,在这里我们还需要用到selenium的browser.get方法,拿健身中心来说,它所对应的url链接为‘http://www.dianping.com/beijing/ch45/g147’,所以我们需要browser.get(‘http://www.dianping.com/beijing/ch45/g147’)来进入到三级类目健身中心所对应的网页中,接下来,我们就需要得到在我们所选的城市所对应的区或者县的相关内容,如图所示大众点评超详细爬虫系列3

 拿北京市为例,如果想要获取到到西城区的相关信息需要怎么做呢?没错,我们这里需要用到xpath或者css选择器,我这里用的是css选择器来对节点进行定位,西城区的相关源码内容如下图大众点评超详细爬虫系列3所以我们这里用css选择器进行定位西城区对应的区域链接为(’#region-nav a’).attr(‘href’),同理,西城区的区域名为(’#region-nav a’).text(),至此,我们就成功的获取到了西城区对应的区域名以及它所对应的url链接。

建议大家要亲自动手,多多实践,毕竟实践才是检验真理的唯一标准!!

本期的博文就更新到这里了,下周继续更新哦,不见不散!!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/208670.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 上午11:02
下一篇 2026年3月19日 上午11:03


相关推荐

  • Pycharm添加源与添加库

    Pycharm添加源与添加库Pycharm 添加源与添加库 Pycharm 添加源 1 点击 file 选择 settings 进入到 package 添加界面 2 点击右上角加号 3 点击左下角 managereposi 点击右上角加号 5 输入你需要的源添加库 1 前两步跟上面一样 2 搜索框输入你要的库 3 等待安装成功 Pycharm 添加源 1 点击 file 选择 settings 进入到 package 添加界面 2 点击右上角加号

    2026年3月27日
    1
  • 自制超声波驱狗器(第三版)

    自制超声波驱狗器(第三版)继上次制作的超声波驱狗器,对电路的一些问题做了改进,并开源设计文件。

    2022年7月2日
    44
  • android 扫码二维码_安卓手机二维码扫描器

    android 扫码二维码_安卓手机二维码扫描器最近公司项目App中要集成二维码扫描来适应在户外工作的时候,对码头集装箱等上面贴的A4纸张打印的二维码进行识别,一般App二维码集成后,能扫出来就不管了,但是我们在集成成功后,根据用户反馈,在户外的环境下,很多二维码识别不了,或者识别速度慢,我们自己也是适用了一下,发现也确实是这样. 一般造成这个识别不出来的原因,我们总结了以下几点:A4纸张打印的标签二维码,本来打印就不是特别清晰,…

    2025年7月14日
    5
  • inherits java_Java 继承(Inherits)

    inherits java_Java 继承(Inherits)C 在 P 的空间和逻辑基础上在 Child 构造函数调用下被创建出来 并具有了 Child 类的其他独有属性和方法 同时将 Parent 类中需要重写或重载的方法变更 继续占用多出来的空间 classGrandpa publicString publicGrandp System out println GrandParentC public

    2026年3月17日
    2
  • 安卓 新浪微博随便看看

    安卓 新浪微博随便看看关于 UI 布局中 listView 控件的使用 该篇的功能是实现简单的微博随便看看 1 创建数据源 2 创建适配器 3 建立 Adapter 和数据的关联 建立 AdapterView 和 Adapter 之间的关联 下面分别摘取几个比较重要的代码 MainActivity java 1importjava text SimpleDateFo 2importjava

    2026年3月17日
    2
  • linux lzma命令,linux lzma安装

    linux lzma命令,linux lzma安装Linux 下大部分系统默认自带 python2 x 的版本 最常见的是 python2 6 或 python2 7 版本 默认的 python 被系统很多程序所依赖 比如 centos 下的 yum 就是 python2 写的 所以默认版本不要轻易删除 否则会有一些问题 如果需要使用最新的 Python3 那么我们可以编译安装源码包到独立目录 这和系统默认环境之间是没有任何影响的 python3 和 python2 两个环境并存即可

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号