selenium爬取京东评论_分布式爬虫实战

selenium爬取京东评论_分布式爬虫实战今天我们来讲一下如何通过python来实现自动登陆京东,以及签到领取金币。如何自动登陆京东?我们先来看一下京东的登陆页面,如下图所示:【插入图片,登陆页面】登陆框就是右面这一个框框了,但是目前我们遇到一个困呐,默认的登陆方式是扫码登陆,如果我们想要以用户民个、密码的形式登陆,就要切换一下。我们看一下这两种登陆方式是如何切换的,通过浏览器的元素检查,我们看一下两个标签。【插入图片,两种…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

今天我们来讲一下如何通过python来实现自动登陆京东,以及签到领取金币。

如何自动登陆京东?

我们先来看一下京东的登陆页面,如下图所示:
【插入图片,登陆页面】
993869-20171204222040722-997306639.jpg

登陆框就是右面这一个框框了,但是目前我们遇到一个困呐,默认的登陆方式是扫码登陆,如果我们想要以用户民个、密码的形式登陆,就要切换一下。
我们看一下这两种登陆方式是如何切换的,通过浏览器的元素检查,我们看一下两个标签。
【插入图片,两种登陆方式】
993869-20171204222121550-1146638960.jpg

扫码登陆和用户登陆分别在一个div标签里面,我们可以通过css选择器选定用户登陆,使其下面的a标签的class为checked,接下来的一切就比较简单了。
我们要获取到用户名输入框、密码输入框以及登陆按钮即可。
【插入图片,用户登陆框】
993869-20171204222209081-1023608090.jpg

下面看一下实现的代码,假设我们通过FireFox浏览器模拟登陆吧。

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.common.exceptions import TimeoutException import time login_url='https://passport.jd.com/uc/login' uid='********' pwd='********' browser=webdriver.Firefox() wait=WebDriverWait(browser, 10) def login(): try: browser.get(login_url) login_tab_u=wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "div.login-tab:nth-child(3)"))) login_tab_u.click()#这里我们没有获取那个a标签,而是直接获取外层的div标签,比较简单而且方便 uid_input = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#loginname"))) pwd_input=wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#nloginpwd"))) login_button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "#loginsubmit"))) uid_input.send_keys(uid) pwd_input.send_keys(pwd) login_button.click() except TimeoutException: login() def main(): login() time.sleep(5) browser.close() if __name__=='__main__': main()

如何自动签到领金币?

领金币一定要登陆vip页面才可以。
vip页面的url=’https://vip.jd.com/home.html
但是要登陆vip页面的话,还是会跳转到第一步的那个登陆页面,我们利用第一步的方法登陆即可。
【插入图片,签到页面】
993869-20171204222131300-1127741009.jpg

签到的链接在右侧,我们获取到这个链接点击就行了。
【插入图片,签到链接】
993869-20171204222139128-1295412753.jpg

这个标签很简单。

vip_url='https://vip.jd.com/home.html' def user_singin(): try: browser.get(vip_url) login_tab_u=wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "div.login-tab:nth-child(3)"))) login_tab_u.click() uid_input = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#loginname"))) pwd_input=wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#nloginpwd"))) login_button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "#loginsubmit"))) uid_input.send_keys(uid) pwd_input.send_keys(pwd) login_button.click() sign_in_button=wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "#signIn"))) sign_in_button.click() print('您已签到成功!') except TimeoutException: user_singin()

前面的代码跟上面是一样的,只不过要获取到签到的标签。
这种登陆方式基本上可以用于任何网站,只不过做一些修改就可以了。
请大家参考。

993869-20171127210458206-1142783382.jpg

转载于:https://www.cnblogs.com/xingzhui/p/7979331.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/192346.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 视觉惯性里程计 综述 VIO Visual Inertial Odometry msckf ROVIO ssf msf okvis ORB-VINS VINS-Mono gtsam

    视觉惯性里程计 综述 VIO Visual Inertial Odometry msckf ROVIO ssf msf okvis ORB-VINS VINS-Mono gtsam视觉惯性里程计VIO-VisualInertialOdometry视觉−惯性导航融合SLAM方案视觉惯性SLAM专栏VINS技术路线与代码详解VINS理论与代码详解0——理论基础白话篇vio_data_simulationVIO数据测试仿真视觉惯性单目SLAM知识IO和之前的几种SLAM最大的不同在于两点:首先,VIO在硬件上需要传感器的融…

    2022年6月23日
    32
  • ActionContext_session和page view

    ActionContext_session和page view在Struts2.0中,Action已经与Servlet API完全分离,这使得Struts2.0的Action具有了更加灵活和低耦合的特性,与Struts1.0相比较而言是个巨大的进步。虽然Struts2.0的Action已经与Servlet API完全分离,但我们在实现业务逻辑处理时经常需要访问Servlet中的对象,如Session、Application等。Struts2.0 提供了一个名

    2025年10月12日
    3
  • ssl证书怎么用_为什么会ssl证书无效

    ssl证书怎么用_为什么会ssl证书无效1.打开网站:https://freessl.cn/按提示操作,验证类型:离线验证;2.会给出一个域名的访问路径和一个文件内容,按照域名解析的主机配置nginx或其它的web服务,返回文件给出的内容;3.确认文件url和内容无误后点验证;4.通过后可以在KeyManager里的证书管理里看到颁发的证书;5.点更多然后选择导出Nginx证书,crt为证书,key为密钥;6.将文件分发到nginx等其它需要证书的服务上去使用;注意:这里最关键的一步就是,你的域…

    2025年8月12日
    3
  • QQ强制聊天工具,教你如何强制用QQ与陌生人聊天

    QQ强制聊天工具,教你如何强制用QQ与陌生人聊天

    2021年8月13日
    486
  • Java实习入职华为,半年后我跑路了

    Java实习入职华为,半年后我跑路了0前言全是干货的技术殿堂文章收录在我的GitHub仓库,欢迎Star/fork:Java-Interview-Tutorialhttps://github.com/Wasabi1234/Java-Interview-Tutorial1何来?我,一个双非本科渣渣,有幸在19届的秋招中得到前东家华为(以下简称hw)的赏识,当时秋招签订就业协议,当时18年10月签订三方后Hr通知说是入了某java部门,之后一系列组织架构调整原因等等让人无法理解的骚操作,最终在毕业前夕的五

    2022年5月15日
    51
  • hexdump用法_linux dump命令

    hexdump用法_linux dump命令本文乃fireaxe原创,使用GPL发布,可以自由拷贝,转载。但转载请保持文档的完整性,并注明原作者及原链接。内容可任意使用,但对因使用该内容引起的后果不做任何保证。作者:fireaxe_hq@hotmail.com博客:fireaxe.blog.chinaunix.net转自:http://blog.chinaunix.net/uid-20528014-id-4087756.html开发时经常会…

    2022年9月21日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号