python 如何获取百度热点内容

python 如何获取百度热点内容

大家好,又见面了,我是全栈君。

“ 如何获取百度的实时热点信息。”

该文章对需要实时了解热点新闻,以及咨询的同学有一定帮助​。我们需要每天晚上7​:00的时候把这些信息发送给我们。方便我们对信息做出处理​。

01— 我们需要获取的数据内容

我们需要获取到的数据信息是什么,打开百度—》搜索内容,右边栏处有一个百度热榜,那我们就来获取这部分的内容好了​。如图​:

python 如何获取百度热点内容
02— 获取内容实例

以下就是我获取到的数据内容,来看一下吧。这样就大大节省了我们收集信息的时间,快速了解热点信息​。

热点排行:
1 .江西新增确诊同乘火车的人去哪了?    ----478万      
2 .驻英使馆就英对华制裁提出严正交涉    ----461万      
3 .湖南操场埋尸案侦办幕后细节       ----445万      
4 .日本船东就阻塞苏伊士运河道歉      ----429万      
5 .独居老太突发脑梗用鞋敲地2晚获救    ----414万      
6 .足协谴责耐克:保留处理合同权利     ----400万      
7 .李易峰终止与BOSS雨果博斯合作    ----386万      
8 .《顶楼2》秀莲以真实身份回归      ----372万      
9 .日本出生大熊猫香香回国再延期      ----359万      
10.魏凤和凭吊烈士:绝不允许历史重演    ----347万      
11.女子为得999车牌号与公公假结婚    ----334万 
12.驻香港部队狙击手集训          ----323万 
13.乌合麒麟出漫画新作           ----311万 
14.中概股惊魂夜谁是幕后推手?       ----290万 
15.iPhone折叠屏手机曝光       ----280万 
16.韩国农心集团创始人去世         ----270万 
17.薇娅1小时卖出2千多万元新疆棉制品   ----261万 
18.崔天凯谈中美领事馆是否会重开      ----251万 
19.20余省份公务员考试今举行       ----243万 
20.2020中国考古新发现揭晓       ----234万 

03— 代码实现

class hot():
    def baidu_hot(self):
        header={
            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
            "Upgrade-Insecure-Requests": 1,
            "Host": "www.baidu.com",
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36"
        }
        html=requests.get("http://www.baidu.com/s?ie=UTF-8&wd=百度&rsv_spt=1&rsv_iqid=0xb9173f8c00007b8a&issp=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=0&rsv_dl=ib&rsv_sug3=4&rsv_btype=i&inputT=9675&rsv_sug4=9675",params=header)
        html.encoding="utf-8"
        html_text=html.text
        Soup = BeautifulSoup(html_text, "html.parser")
        tbody=Soup.find_all("tbody")[0]
        hot_text="热点排行:\n"
        if tbody!="None":
            for j in range(2):
                tbody_num = Soup.find_all("tbody")[j]
                for i in range(1,11):
                    text=str(tbody_num.find_all("a")[i-1].get_text()).replace(" ","").replace("\n","")
                    # url=t.find_all("a")[i]["href"]
                    hot_num=tbody_num.find_all("td",attrs=({"class":"toplist1-right-num toplist1-td c-color-gray"}))[i-1].get_text()
                    if j==0:
                        hot_text=hot_text+'{0:2}.{1:20}----{2:10}\n'.format(str(i),text, hot_num)
                    else:
                        hot_text=hot_text+'{0:2}.{1:20}----{2:5}\n'.format(str(10+i),text, hot_num)
            return hot_text
        else:
            pass
if __name__=="__main__":
    hot=hot()
    print(hot.baidu_hot())

这样,我们就完成了百度热榜的获取了,还在等什么,​赶快学起来吧。后面还可给他增加一个定时器,发送邮箱,这样我们还可以完成,定时给指定邮箱发送百度热榜信息​。

相关推荐:

如何爬取王者荣耀全皮肤英雄壁纸

给自己的网站添加看板娘

windows IIS+php配置教程

搭建flask web框架及应用

满屏的祝福弹幕,可自由控制弹框文字

关注我们​:

python 如何获取百度热点内容

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111372.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • lldp协议代码阅读_查看链路层发现协议(LLDP)关于交换机的端口状态信息

    lldp协议代码阅读_查看链路层发现协议(LLDP)关于交换机的端口状态信息查看链路层发现协议(LLDP)关于交换机的端口状态信息客观链路层发现协议(LLDP)媒体终端发现(MED)提供另外的功能支持媒体终点设备例如到网络通告为应用程序修正类似语音或视频的enable(event),设备位置发现和故障排除信息。LLDP和思科设备发现协议(CDP)是两个相似的协议,并且区别是LLDP促进供应商互操作性,并且CDP是Cisco业主。LLDP可以用于用户需要工作在设备之间不是…

    2022年5月17日
    46
  • win10 directshow无法释放_windowmode

    win10 directshow无法释放_windowmode现在单独的directshowsdk包已经没有了,从directx9.0c开始directshow和directx分开发布,现在的directshow已经集成到windowsSDK当中了,不需要单独安装。

    2022年10月12日
    0
  • Pycharm写Python脚本 | Python新建文件自动注释

    Pycharm写Python脚本 | Python新建文件自动注释Pycharm写Python脚本|Python新建文件自动注释效果如图所示:1.打开Pycharm,点击File,选择Settings2.点击Editor,选择里面的FileandCodeTemplates,找到并点击PythonScript3.在右侧空白处输入代码#@Time:${DATE}${TIME}#@Author:SHAUN#@File:${NAME}.py#Software:${PRODUCT_NAME}其中:${DATE}表示当前

    2025年6月7日
    0
  • PCI,PCI-X,PCI-E

    PCI,PCI-X,PCI-EPCI-X是PCI总线的扩展架构,PCI-X频率不像PCI那样固定,而是可以随着设备的变化而变化的。PCI-X采用64位PCI总线(PCI為32bit),可以支持66,100,133MHz这些频率。而在未来,可能将提供更多的频率支持。PCI-X标准的提出主要面向服务器I/O结构。PCI-X的设计目标在于提高CPU与外设之间的传输速度,能使服务器的I/O速度提高两倍。与原来的PCI标准开发商不同的是

    2022年5月7日
    53
  • 六大算法之动态规划_动态规划100题

    六大算法之动态规划_动态规划100题在两条独立的水平线上按给定的顺序写下 nums1 和 nums2 中的整数。现在,可以绘制一些连接两个数字 nums1[i] 和 nums2[j] 的直线,这些直线需要同时满足满足:nums1[i] == nums2[j]且绘制的直线不与任何其他连线(非水平线)相交。请注意,连线即使在端点也不能相交:每个数字只能属于一条连线。以这种方法绘制线条,并返回可以绘制的最大连线数。示例 1:输入:nums1 = [1,4,2], nums2 = [1,2,4]输出:2解释:可以画出两条不交叉的

    2022年8月11日
    2
  • 阅读书源最新2020在线导入_最最最最最好用的小说神器,全网书源免费用!

    阅读书源最新2020在线导入_最最最最最好用的小说神器,全网书源免费用!今天给大家分享的是小说软件,为了满足所有小伙伴的需求,今天安卓和苹果都安排上了,一款Android应用,一款iOS应用。两款应用都十分相似,都是可以自行添加书源的软件,几乎覆盖全网小说。阅读(Android)软件本身是没有任何资源的,如果不添加书源地址,也不能搜索到任何小说。书源添加流程:软件想要很好的使用,还需要添加书源,该软件自己有一个在线书源库,内含上千个书源地址,足够满足大家的使…

    2022年6月17日
    73

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号