python激活成功教程qq密码_央·python编程之QQ数据清洗

python激活成功教程qq密码_央·python编程之QQ数据清洗一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。今天我们拿QQ数据做示范。我们命令行是怎么看数据![Asm]纯文本查看复制代码morezy.txt#然后空格进行翻页效果如图:1.png(11.5KB,下载次数:0)2018-1-3017:54上传从数据中得知:—-中间4个-左边是账号,右边…

大家好,又见面了,我是你们的朋友全栈君。

一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。

今天我们拿QQ数据做示范。

我们命令行是怎么看数据!

[Asm] 纯文本查看 复制代码more zy.txt

#然后空格进行翻页

效果如图:

55fd2b2273b5a8b4531f72773c469d6e.gif

1.png (11.5 KB, 下载次数: 0)

2018-1-30 17:54 上传

从数据中得知:

—- 中间4个-

左边是账号,右边是密码

目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)

我先用python 读取QQ操作

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath=”C:\Users\Administrator\Desktop\zy1.txt”

for line in mylist:

QQlist=line.split(‘—-‘)

print(QQlist[1])

55fd2b2273b5a8b4531f72773c469d6e.gif

2.png (19.57 KB, 下载次数: 1)

2018-1-30 17:55 上传

注:此方法是读取到内存,所以很占空间,会很卡。

数据中我们看到很多垃圾数据,我们看下垃圾数据

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath=”C:\Users\Administrator\Desktop\zy1.txt”

for line in mylist:

QQlist=line.split(‘—-‘)

if len(line)>31:

print(line)#打印垃圾数据

55fd2b2273b5a8b4531f72773c469d6e.gif

22.png (26 KB, 下载次数: 0)

2018-1-30 17:56 上传

进行QQ清洗,在分别保存账号文本和密码文本。

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

savegoodfilepath=r”C:\Users\Administrator\Desktop\zyQQGood.txt”

savebadfilepath=r”C:\Users\Administrator\Desktop\zyQQbad.txt”

filegood=open(savegoodfilepath,”wb”)

filebad=open(savebadfilepath,”wb”)

for line in mylist:

if len(line)>31 or len(line)<=15:#(4+5+6)

filebad.write(line.encode(“utf-8”))

else:

QQlist = line.split(‘—-‘)

if len(QQlist)==2:

filegood.write(line.encode(“utf-8”))

else:

filebad.write(line.encode(“utf-8”))

filebad.close()

filegood.close()

效果图:

55fd2b2273b5a8b4531f72773c469d6e.gif

44.png (38.09 KB, 下载次数: 0)

2018-1-30 17:57 上传

附件:

2b1bef8df4f01fee4fc8b39358cdcfb3.gif

中央纪委pyhon数据清理.zip

(3.81 KB, 下载次数: 25)

2018-1-30 17:58 上传

点击文件名下载附件

下载积分: 吾爱币 -1 CB

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/162202.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 拼多多下载安装_快影下载安装

    拼多多下载安装_快影下载安装SQLite的最新版本可以从这里下载。下面我们以Windows版本sqlite-3_5_1.zip为例介绍其安装方法。(大家可以选择下载安装适合自己的版本)下载后,将sqlite-3_5_1.zip解压缩至C:/sqlite目录即完成安装。C:/sqlite目录构造为:C:/sqlite|+–sqlite3.exe打开一个CMD命令窗口

    2025年7月6日
    3
  • 博客内的百度网盘资源公开目录下载[通俗易懂]

    博客内的百度网盘资源公开目录下载[通俗易懂]本博客下的百度网盘资源公开下载目录,及地址更新。博客园文档与资料(长期更新,2015-10-18Build)欢迎大家,github 推荐方式下载:https://github.co

    2022年7月3日
    28
  • pycharm配置anaconda环境后不能运行无法run_anaconda添加环境变量

    pycharm配置anaconda环境后不能运行无法run_anaconda添加环境变量概述在上节介绍了anaconda管理python环境,而Pycharm作为主流pythonIDE,两者配合使用才算完美。配置File-Setting-ProjectInterpreter贴图:可以看到当前环境下安装的包之类的,管理起来也是很清爽。转载于:https://www.cnblogs.com/mliangchen/p/9939844.html…

    2022年8月25日
    6
  • 关于pfx证书和cer证书

    关于pfx证书和cer证书Pfx证书,同时包含了公钥信息和私钥信息Cer证书只包含公钥信息如果客户端与网站通信时需要用到私钥(基本所有需要数字证书的网站都会用到私钥),则cer证书是无法正常访问网站的,网站会提示“该页要求客户证书”由于cer证书只包含公钥信息,一般只能用于解密使用(解密该公钥对应的私钥加密的数据)。Pfx证书既可以导出为pfx证书,也可以导出为cer证书。Pfx证书导出时,会提示是…

    2022年5月2日
    63
  • 细数家庭安防五大乱象 何时能步入正轨

    细数家庭安防五大乱象 何时能步入正轨虽然智能家居行业在我国的成长已逾十个年头了,但是目前市场离成型仍然有一段距离。市场上可谓“乱象”丛生,这些绊脚石严重阻碍了行业的良性发展。市场乱象繁生,智能家居从概念炒作到价格高抬,相关预测显示,若真如电商一样打起价格战,智能家居就要认输了。“智能家居”(SmartHome)最早被提出和应用是在上世纪80年代的欧美和日本,2000年才被引入中国。世纪…

    2022年6月22日
    23
  • 解决ubuntu虚拟机桥接模式下不能上网

    解决ubuntu虚拟机桥接模式下不能上网①sudovim/etc/network/interfaces修改ip和主机在同一网段,gateway和主机一致(ipconfig-all查看主机ip信息)②重启虚拟机,重启之后配置的静态ip才能生效③配置dnssudovim/etc/resolv.conf和主机一直④重启网络sudo/etc/init.d/networkingrestart…

    2022年6月9日
    63

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号