from lxml import etree报错

from lxml import etree报错写一个小型的爬虫懒得用 scrapy 主要是 scrapy 不太好装 直接使用了 requests 请求 但是要解析数据 那么问题来了问题 1 使用的是 python3 7 的环境 解析数据要用 xpath 系统是 macpipinstal 一分钟后 下载成功开始写代码 fromlxmlimpo 挂了 lxml 中竟然没有 etree 模块换个方法

写一个小型的爬虫懒得用scrapy(主要是scrapy不太好装…),直接使用了requests请求,但是要解析数据,那么问题来了


问题1:

  • 使用的是python3.7的环境,解析数据要用xpath,系统是mac
    pip install lxml 

    一分钟后。。。下载成功

  • 开始写代码,
    from lxml import etree 

    挂了…,lxml中竟然没有etree模块

  • 换个方法
    from lxml import html
    et = html.etree 

    依然挂了…

解决:

  • 开始找解决办法
    百度中。。。,找了一堆的方法,全部失败
    google中。。。,又找了一堆的方法,全部失败
    即将放弃,准备切换python版本,开始水群。。。,群里大佬给了个阿里源的地址,恍然大悟!!!


    pip install -i https://mirrors.aliyun.com/pypi/simple/ lxml 
    from lxml import html
    et = html.etree print(et.HTML(response.content)) 

终于突破了这个问题

问题2:

  • 解析过后发现有些需要整个代码块转为字符串
    import xml.etree.ElementTree as ET print(ET.tostring(dom代码块, encoding='utf8')) 
  • 数据是有了,但是不太对,中文出来的是十六进制的数据,没法继续了啊
    百度/Google,我又来了。。。

解决:

print(str(ET.tostring(dom代码块, encoding='utf8'), 'utf-8')) 

本文链接:时光不写博客

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/230989.html原文链接:https://javaforall.net

(0)
上一篇 2026年2月4日 下午7:01
下一篇 2026年2月4日 下午7:22


相关推荐

  • Java Lambda表达式入门

    Java Lambda表达式入门原文链接 StartUsingJa 下载示例程序 Examples zip 原文日期 2014 年 4 月 16 日翻译日期 2014 年 4 月 27 日翻译人员 铁锚简介 译者认为 超过 3 行的逻辑就不适用 Lambda 表达式了 虽然看着很先进 其实 Lambda 表达式的本质只是一个 语法糖 由编译器推断并帮你转换包装为常规的代码 因此你可以使用

    2026年3月20日
    2
  • 部署禅道至外网

    部署禅道至外网结论:采用Cpolar映射工具和netsh命令netsh命令可以将对本地/局域网的某个端口的请求转发给本地/局域网的另一端口接收处理,假设利用Cpolar映射工具将本地的12345端口映射到外网,再利用netsh命令将本地12345端口转发到192.168.10.188的8000端口,这样,我在外网用http请求本地12345端口时,实际上是在请求禅道(192.168.10.188:8000)网址结论:可行工具:cpolar内网穿透工具和一台内网开着的电

    2022年5月29日
    86
  • BZOJ 1024 SCOI 2009 生日快乐 深搜

    BZOJ 1024 SCOI 2009 生日快乐 深搜

    2022年1月29日
    46
  • Unable to connect to Redis; nested exception is io.lettuce.core.RedisConnectionException: 解决办法

    Unable to connect to Redis; nested exception is io.lettuce.core.RedisConnectionException: 解决办法项目开发的过程中 应业务需求将 Redis 作为缓存服务器整合进了 SpringBoot 的项目中 在初测试的时候 遇到连接超时的情况 错误信息如下 org springframew data redis RedisConnect Unabletoconn nestedexcept lettuce co

    2026年3月17日
    2
  • bios刷写工具_蓝天P750/P751编程器刷BIOS「建议收藏」

    bios刷写工具_蓝天P750/P751编程器刷BIOS「建议收藏」神舟ZX8-SP7是蓝天P751DM2模具,今天在WIN下刷BIOS成功刷黑,开始使用编程器刷BIOS,笔记本BIOS芯片由于是焊在主板上必须用夹子或者脱焊后用烧录座刷写,所以需要买编程器夹子。工具:优硕EZP-XPROV2、优硕SOP8编程器夹子。目标:神舟ZX8-SP7(P751DM2模具)准备工作:去蓝天镜像站下载对应的模具的BIOS蓝天镜像站:https://repo.palkeo.co…

    2022年6月26日
    167
  • httprunner(9)运行测试用例的方式总结「建议收藏」

    httprunner(9)运行测试用例的方式总结「建议收藏」前言用过pytest的小伙伴都知道,pytest的运行方式是非常丰富的,可以说是你想怎么运行怎么运行,想运行哪些运行哪些,那httprunner是否同样可以呢?运行用例的各种方式运行指定路径的用

    2022年7月29日
    10

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号