Python一日一练05—-怒刷点击量[通俗易懂]

全栈程序员-站长 • 2022年1月30日下午11:00 • 未分类 • 阅读 100

Python一日一练05—-怒刷点击量

大家好，又见面了，我是全栈君。

功能

自己主动获取CSDN文章列表，并对每篇文章添加点击量.

源代码

import urllib.request
import re
import time
import random
from bs4 import BeautifulSoup

p = re.compile('/a359680405/article/details/........')

#自己的博客主页
url = "http://blog.csdn.net/a359680405"

#使用build_opener()是为了让python程序模仿浏览器进行訪问
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]

html = opener.open(url).read().decode('utf-8')

allfinds = p.findall(html)
print(allfinds)

urlBase = "http://blog.csdn.net"#须要将网址合并的部分
#页面中的网址有反复的，须要使用set进行去反复
mypages = list(set(allfinds))
for i in range(len(mypages)):
    mypages[i] = urlBase+mypages[i]

print('要刷的网页有：')
for index , page in enumerate(mypages) :
    print(str(index), page)

#设置每一个网页要刷的次数
brushMax = 200

#全部的页面都刷
print('以下開始刷了哦：')
for index , page in enumerate(mypages) :
    brushNum=random.randint(0,brushMax)
    for j in range(brushNum):
        try :
            pageContent = opener.open(page).read().decode('utf-8')
            #使用BeautifulSoup解析每篇博客的标题
            soup = BeautifulSoup(pageContent)
            blogTitle = str(soup.title.string)
            blogTitle = blogTitle[0:blogTitle.find('-')]
            print(str(j) , blogTitle) 
            
        except urllib.error.HTTPError:
            print('urllib.error.HTTPError')
            time.sleep(1)#出现错误。停几秒先
            
        except urllib.error.URLError:
            print('urllib.error.URLError')
            time.sleep(1)#出现错误，停几秒先
        time.sleep(0.1)#正常停顿，以免server拒绝訪问

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/115762.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

Struts2 页面url请求怎样找action

上一篇 2022年1月30日下午11:00

sdut2623–The number of steps（概率dp第一弹，求期望）

下一篇 2022年1月31日上午6:00

根据经纬度计算距离的公式是什么_经纬度距离计算公式

根据经纬度计算距离的公式是什么_经纬度距离计算公式privateconstdoubleEARTH_RADIUS=6378.137;privatestaticdoublerad(doubled){returnd*Math.PI/180.0;}publicstaticdoubleGetDistance(doublelat1,doublelng1,doublelat2,doublelng2){do…

全栈程序员-站长
2026年3月2日
5
cursor

5分钟接入量化信号：QuantToGo MCP Server实战教程

5分钟接入量化信号：QuantToGo MCP Server实战教程

Ai探索者
2026年3月15日
2
UFT对table的操作

UFT对table的操作通常Table（类似电子表格的行和列组成的二维网格）中的数据是动态从后台数据库中抽取并呈现给用户的。下面是HTML的webtable的句法，tr代表一行，td代表所属行中单独的一个小格。<tableborder=”1″><tr><th>Month</th><th>Savings</th></tr><tr><td>January</td

全栈程序员-站长
2022年5月27日
42
机器人SLAM算法漫谈

机器人SLAM算法漫谈本文转载微信公众号 “智能算法”完整的干货，拿来大家分享！http://mp.weixin.qq.com/s/pBpTH0B5AKRGMZ_8rrO4zg1.前言　　开始做SLAM（SimultaneousLocalizationandMapping，机器人同时定位与建图）研究已经近一年了。从一年级开始对这个方向产生兴趣，到现在为止，也算是对这个领域有了大致的了

全栈程序员-站长
2022年6月24日
30
openclaw

FinChain星鏈發布OpenClaw金融解析Skill，全面啟動自主型智能體金融領域布局

FinChain星鏈發布OpenClaw金融解析Skill，全面啟動自主型智能體金融領域布局

Ai探索者
2026年3月14日
3
位运算符之—按位取反运算符(简单易懂)

位运算符之—按位取反运算符(简单易懂)前言位运算符是用来对二进制位进行操作的 c 语言中有 6 种位运算符 amp 按位与链接 https blog csdn net weixin article details 按位或链接 https blog csdn net weixin article details 按位异或链接

全栈程序员-站长
2026年3月17日
2

发表回复

关注全栈程序员社区公众号