【原创】python模拟腾讯网页登录

【原创】python模拟腾讯网页登录

    近日,研究Tencent网页模拟登录的过程,过程有些忐忑,但最终还是实现了这一功能。先将结果写于此,供大家参考:

其加密过程在c_login_old.js文件中执行,将JS关键代码提取出来如下:

function hexchar2bin(str) {
        var arr = [];
        for (var i = 0; i < str.length; i = i + 2) {
            arr.push("\\x" + str.substr(i, 2))
        }
        arr = arr.join("");
        eval("var temp = '" + arr + "'");
        return temp
    }
function getEncryption(password, uin, vcode) {
        var str1 = hexchar2bin(md5(password));
        var str2 = md5(str1 + uin);
        var str3 = md5(str2 + vcode.toUpperCase());
        return str3
    }
function uin2hex(str) {
        var maxLength = 16;
        str = parseInt(str);
        var hex = str.toString(16);
        var len = hex.length;
        for (var i = len; i < maxLength; i++) {
            hex = "0" + hex
        }
        var arr = [];
        for (var j = 0; j < maxLength; j += 2) {
            arr.push("\\x" + hex.substr(j, 2))
        }
        var result = arr.join("");
        eval('result="' + result + '"');
    alert(result)
        return result
    }

将其转换为Python脚本如下,测试有效。

# -*- coding: utf-8 -*-
'''
Version : Python27
Author  : Spring God
Date    : 2014-4-26
'''

import md5


def hexchar2bin(hexchar):

    params = ''
    for i in range(0, len(hexchar), 2):
        params += chr(int(hexchar[i:i+2], 16))

    return params

def uin2hex(uin):

    hex_str = str(hex(int(uin)))[2:]#.upper()
    hex_len = len(hex_str)
    hex_str = '0'*(16-hex_len) + hex_str

    return hexchar2bin(hex_str)

def getEncryption(password, uin, vcode):

    str1 = md5.md5(password).hexdigest()
    str2 = md5.md5(hexchar2bin(str1)+uin2hex(uin)).hexdigest()
    str3 = md5.md5((str2+vcode).upper()).hexdigest().upper()

    return str3



if __name__ == '__main__':

    print(getEncryption('密码','QQ','验证码'))

需要注意的是:验证码怎么获取,我在腾讯微博登录时通过分析网络传输数据得到如下方式来获取验证码

def check(account):

    check_page = 'https://ssl.ptlogin2.qq.com/check?uin=%s&appid=46000101&low_login=1' % account
    headers = {
        'Referer': 'https://xui.ptlogin2.qq.com/cgi-bin/xlogin?appid=46000101',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.154 Safari/537.36'}
    res = urllib2.urlopen(check_page)
    data = res.read()
    params = re.search("'(.*?)','(.*?)',", data)
    #print(params.groups())
    '''
    第一个参数:0-默认验证码; 1-需要验证码
    第二个参数:默认验证码; 验证码cap_cd
    获取验证码地址:https://ssl.captcha.qq.com/getimage?uin=1090523513&aid=46000101&cap_cd=cbDkfT8sXEd21HNyJXwSFPDwR2Sw70dK
    第三个参数:用户帐号HEX值
    '''
    if(None == params):
        return None
    if(params.group(1) == '0'):
        return params.group(2)
    elif(params.group(1) == '1'):
        img_page = 'https://ssl.captcha.qq.com/getimage?uin=%s&aid=46000101&cap_cd=%s' % (account, params.group(2))
        img_data = urllib2.urlopen(img_page).read()
        with open(r'verifyCode.jpg', 'wb') as _file:
            _file.write(img_data)
            _file.close()
            os.popen(r'start verifyCode.jpg')
        return verifyCode = raw_input(u'输入验证码:')
    else:
        return None

    return None

 至于登录,就简单了

def login(account, pwd):

    verrifyCode = check(account)
    if(None == verrifyCode):
        return False
    print(u'登录中...')
    pwd = password.getEncryption(pwd, account, verifyCode)
    login_page = 'https://ssl.ptlogin2.qq.com/login?u='+account+'&verifycode='+self.verifyCode+'&p='+pwd+'&pt_rsa=0&ptredirect=1&u1=http%3A%2F%2Ft.qq.com&h=1&t=1&g=1&from_ui=1&ptlang=2052&action=1-11-1398479501082&js_ver=10076&js_type=1&login_sig=AzGRTF28dkUVNnUrx8c0RlDtx4Rl-6gfJ4Z6SIC1VLphoHULwNooXLsFaS12t2p8&low_login_enable=1&low_login_hour=720&aid=46000101&daid=6&'
    res = urllib2.urlopen(login_page)
    data = res.read().decode('utf-8')
    params = re.search("'.*?','.*?','.*?','.*?','(.*?)', '(.*?)'", data)
    print(params.group(1)+params.group(2))

贴上完整代码段

# password.py
# -*- coding: utf-8 -*-
'''
Version : Python27
Author  : Spring God
Date    : 2014-4-26
'''

import md5


def hexchar2bin(hexchar):

    params = ''
    for i in range(0, len(hexchar), 2):
        params += chr(int(hexchar[i:i+2], 16))

    return params

def uin2hex(uin):

    hex_str = str(hex(int(uin)))[2:]#.upper()
    hex_len = len(hex_str)
    hex_str = '0'*(16-hex_len) + hex_str

    return hexchar2bin(hex_str)

def getEncryption(uin, password, vcode):

    str1 = md5.md5(password).hexdigest()
    str2 = md5.md5(hexchar2bin(str1)+uin2hex(uin)).hexdigest()
    str3 = md5.md5((str2+vcode).upper()).hexdigest().upper()

    return str3


if __name__ == '__main__':

    print(getEncryption('QQ','密码','验证码'))

# Tencent.py
# -*- coding: utf-8 -*-
'''
Version : Python27
Author  : Spring God
Date    : 2013-6-28
'''

import urllib
import urllib2
import cookielib
import io
import gzip
import re
import os
import password


class Tencent(object):

    def __init__(self):

        self.verifyCode = None
        self.uin = None
        self.newtask = None
        self.daytask = None

        # 安装cookie 支持登录操作
        cj = cookielib.CookieJar()
        opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
        urllib2.install_opener(opener)

    def check(self, account):

        '''
        应用ID:46000101(微博)
        https://ssl.ptlogin2.qq.com/check?regmaster=&uin=947742112&appid=46000101&js_ver=10076&js_type=1&login_sig=ohbOoy-NhVcIjEGkjmMCUcg4BG6Xn8C9q182ebLKuXLuK1rawH0w0LEuAJYNM9GW&u1=http%3A%2F%2Ft.qq.com&r=0.7585592269897461
        '''
        self.uin = account
        check_page = 'https://ssl.ptlogin2.qq.com/check?uin=%s&appid=46000101&low_login=1' % account
        headers = {
            'Referer': 'https://xui.ptlogin2.qq.com/cgi-bin/xlogin?appid=46000101',
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.154 Safari/537.36'}
        res = urllib2.urlopen(check_page)
        data = res.read()
        params = re.search("'(.*?)','(.*?)',", data)
        #print(params.groups())
        '''
        第一个参数:0-默认验证码; 1-需要验证码
        第二个参数:默认验证码; 验证码cap_cd
        获取验证码地址:https://ssl.captcha.qq.com/getimage?uin=1090523513&aid=46000101&cap_cd=cbDkfT8sXEd21HNyJXwSFPDwR2Sw70dK
        第三个参数:用户帐号HEX值
        '''
        if(None == params):
            return False
        if(params.group(1) == '0'):
            self.verifyCode = params.group(2)
        elif(params.group(1) == '1'):
            img_page = 'https://ssl.captcha.qq.com/getimage?uin=%s&aid=46000101&cap_cd=%s' % (account, params.group(2))
            img_data = urllib2.urlopen(img_page).read()
            with open(r'verifyCode.jpg', 'wb') as _file:
                _file.write(img_data)
                _file.close()
                os.popen(r'start verifyCode.jpg')
            self.verifyCode = raw_input(u'输入验证码:')
        else:
            return False

        return True

    def login(self, account, pwd):

        if(False == self.check(account)):
            return False
        print(u'登录中...')
        pwd = password.getEncryption(account, pwd, self.verifyCode)
        login_page = 'https://ssl.ptlogin2.qq.com/login?u='+account+'&verifycode='+self.verifyCode+'&p='+pwd+'&pt_rsa=0&ptredirect=1&u1=http%3A%2F%2Ft.qq.com&h=1&t=1&g=1&from_ui=1&ptlang=2052&action=1-11-1398479501082&js_ver=10076&js_type=1&login_sig=AzGRTF28dkUVNnUrx8c0RlDtx4Rl-6gfJ4Z6SIC1VLphoHULwNooXLsFaS12t2p8&low_login_enable=1&low_login_hour=720&aid=46000101&daid=6&'
        res = urllib2.urlopen(login_page)
        data = res.read().decode('utf-8')
        params = re.search("'.*?','.*?','.*?','.*?','(.*?)', '(.*?)'", data)
        print(params.group(1)+params.group(2))


if __name__ == '__main__':

    app = Tencent()
    app.login('QQ', '密码')

下面是测试结果

【原创】python模拟腾讯网页登录

 

转载请注明出处http://www.cnblogs.com/doudongchun/p/3694922.html

转载于:https://www.cnblogs.com/doudongchun/p/3694922.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/100838.html原文链接:https://javaforall.net

(0)
上一篇 2021年7月9日 下午5:00
下一篇 2021年7月9日 下午6:00


相关推荐

  • FVWM_fw一流是什么意思

    FVWM_fw一流是什么意思国庆期间,把自己的FVWM好好整理了一下,现在我的桌面看上去是这个样子滴(点击可放大):我的.fvwm2rc可以下载。我的部分FVWM笔记:***   如何使用托盘      $sudoapt-getinstalltrayer      $trayer–widthtypepixel–width128–height32–edgebottom&***  

    2022年10月4日
    4
  • 【R语言】GARCH模型的应用

    【R语言】GARCH模型的应用一 数据来源 沪深 300 指数 是由沪深证券交易所于 2005 年 4 月 8 日联合发布的反映沪深 300 指数编制目标和运行状况的金融指标 并能够作为投资业绩的评价标准 为指数化投资和指数衍生产品创新提供基础条件 因此 本次数据来源于网易财经 研究的数据集对象是沪深 300 指数 股票代码为 000300 此次分析选取了沪深 300 指数 2000 年 1 月到 2019 年 12 月的工作日收盘价格数据 二 数据分析 一 时序图 为了分析数据的波动情况 对其进行对数化和差分得到对数收益率 下图为沪深 3

    2026年3月18日
    1
  • 二传感器尺寸「建议收藏」

    二传感器尺寸「建议收藏」说到传感器的尺寸,其实是说感光器件的面积大小,这里就包括了CCD和CMOS。感光器件的面积越大,CCD/CMOS面积越大,捕捉的光子越多,感光性能越好,信噪比越高。下面是家用小DC图像传感器尺寸换算为公制的大小(单位为毫米):2/3英寸的画幅面积为(8.8×6.6mm)1/1.8英寸的画幅面积为(7.178×5.319mm)1/2英寸的画幅面积为(6.4×4.8mm)1/2.7英寸的画幅面…

    2022年6月12日
    50
  • c#爬取Silverlight网页[通俗易懂]

    c#爬取Silverlight网页[通俗易懂]前言:爬取普通的文本网页非常容易,但爬取Silverlight的网页代码时,有时候可能会加密。这样就会很麻烦了。下面就爬取网站http://zx.bjmemc.com.cn/(北京空气质量网)进行说明。任务:网站http://zx.bjmemc.com.cn/显示的内容如下图所示。我们的任务就是将空气质量数据抓取下来。工具:1、fiddler,http://www.

    2022年10月19日
    4
  • 双代号网络图与双代号时标网络图_双代号网络图和单代号网络图

    双代号网络图与双代号时标网络图_双代号网络图和单代号网络图一、双代号网络图1、压缩关键活动2、压缩可以压的活动3、压缩便宜的活动4、压缩后是否有优化二、双代号时标网络图1、关键途径:起点到终点没有波浪线的路径:ADH或12682、虚工作:是垂直

    2022年8月3日
    10
  • [面试题]25个MySQL经典面试题「建议收藏」

    [面试题]25个MySQL经典面试题「建议收藏」经典题目1、MySQL的复制原理以及流程基本原理流程,3个线程以及之间的关联;2、MySQL中myisam与innodb的区别,至少5点2.1问5点不同;2.2innodb引擎的4大特性2.32者selectcount(*)哪个更快,为什么3、MySQL中varchar与char的区别以及varchar(50)中的50代表的涵义3.1varchar与char的区别3.2…

    2022年8月27日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号