from lxml import etree报错

from lxml import etree报错写一个小型的爬虫懒得用 scrapy 主要是 scrapy 不太好装 直接使用了 requests 请求 但是要解析数据 那么问题来了问题 1 使用的是 python3 7 的环境 解析数据要用 xpath 系统是 macpipinstal 一分钟后 下载成功开始写代码 fromlxmlimpo 挂了 lxml 中竟然没有 etree 模块换个方法

写一个小型的爬虫懒得用scrapy(主要是scrapy不太好装…),直接使用了requests请求,但是要解析数据,那么问题来了


问题1:

  • 使用的是python3.7的环境,解析数据要用xpath,系统是mac
    pip install lxml 

    一分钟后。。。下载成功

  • 开始写代码,
    from lxml import etree 

    挂了…,lxml中竟然没有etree模块

  • 换个方法
    from lxml import html
    et = html.etree 

    依然挂了…

解决:

  • 开始找解决办法
    百度中。。。,找了一堆的方法,全部失败
    google中。。。,又找了一堆的方法,全部失败
    即将放弃,准备切换python版本,开始水群。。。,群里大佬给了个阿里源的地址,恍然大悟!!!


    pip install -i https://mirrors.aliyun.com/pypi/simple/ lxml 
    from lxml import html
    et = html.etree print(et.HTML(response.content)) 

终于突破了这个问题

问题2:

  • 解析过后发现有些需要整个代码块转为字符串
    import xml.etree.ElementTree as ET print(ET.tostring(dom代码块, encoding='utf8')) 
  • 数据是有了,但是不太对,中文出来的是十六进制的数据,没法继续了啊
    百度/Google,我又来了。。。

解决:

print(str(ET.tostring(dom代码块, encoding='utf8'), 'utf-8')) 

本文链接:时光不写博客

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/230989.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号