Python读取写入TXT正确姿势[通俗易懂]

Python2.7IDEPycharm5.0.3在憋一个豆瓣电影抓取的“大招”,分流记录一下保存过程直奔主题1.自己写入txt直接上核心代码:withopen(“douban.txt”,”w”)asf:f.write(“这是个测试!”)这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!结果就是这样:2.将文件输

大家好,又见面了,我是你们的朋友全栈君。

Python 2.7
IDE Pycharm 5.0.3


爬下来,解析,存储,分析,可视化--一气呵成,当然我还在学前面三个哈哈哈

直奔主题


1.自己写入txt

直接上核心代码:

with open("douban.txt","w") as f:
        f.write("这是个测试!")

这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!

结果就是这样:

这里写图片描述


2.将文件输入(print)的内容写入txt

我并不喜欢手写字符,更多时候用到的就是将程序跑出来的print写到txt中保存,比如说刚从豆瓣抓的内容,我想写进去,该怎么保存呢。这就用到了for循环啦。关于豆瓣的爬取请见我的前面那篇博客

我就是想把输出框的文字保存而已
这里写图片描述

#分模块测试,txt写入测试
# -*- coding: utf-8 -*-
from selenium import webdriver
import selenium.webdriver.support.ui as ui
import time

#driver_item=webdriver.Firefox()
driver_item=webdriver.PhantomJS(executable_path="phantomjs.exe")
url="https://movie.douban.com/subject/3541415/?tag=%E7%A7%91%E5%B9%BB&from=gaia_video"
wait = ui.WebDriverWait(driver_item,10)
driver_item.get(url)

try:
    driver_item.find_element_by_xpath("//img[@class='bn-arrow']").click()
    #wait.until(lambda driver: driver.find_element_by_xpath("//div[@class='review-bd']/div[2]/div/div"))
    time.sleep(1)
    comments_deep = driver_item.find_element_by_xpath("//div[@class='review-bd']/div[2]/div")

    print u"深度长评:"+comments_deep.text
    #print type(comments_deep.text)#<type 'unicode'>

    comments_wr=comments_deep.text.encode('utf-8')
    #print type(comments_wr)#<type 'str'>

    #title="盗梦空间"#中文命名文件名乱码,内容可用 title="Inception"
    with open("%s.txt"%title,"w") as f:#格式化字符串还能这么用!
        for i in comments_wr:
            f.write(i)
except:
    print 'can not caught the comments!'

比较常用MODE

这里写图片描述


不清空连续写入

没有文件时候会自动创建的,但是!如果我重新对此进行写入,那么会先清空,然后再写,就是说以前写的没了,这样搞不好吧,我可是要记录很多东西的啊,万能的a出现了。。。

把核心代码改成这样就可以了,记得把w改成a,至于那个分割线问题,因为后续写入和前面已经有的会混在一块,所以我做分割用:

with open("%s.txt"%title,"a") as f:#格式化字符串还能这么用!
        f.write("\n-------------------------------------我是分割线-----------------------------------------\n")
        for i in comments_wr:
            f.write(i)

效果是这样的,不够好看自己再加细节,比如换行多几次

这里写图片描述



That’s all

用到啥学啥,学得快又学的牢
这里写图片描述


致谢

Python:文件的读取、创建、追加、删除、清空
@王志 –Python: 删除已安装的模块或包(modules or packages)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127568.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • windows密码获取 — LC5暴力激活成功教程Hash密码「建议收藏」

    windows密码获取 — LC5暴力激活成功教程Hash密码「建议收藏」​错,可以改,那,错过呢。。。—-网易云热评一、首先用QuarksPwDump导出hash值并存储到1.txtquarkspwdump–dump-hash-local–output1.txt二、下载并安装LC5并注册1、下载地址:回复2、双击lc5setup一路下一步,3、将hashgen和lc5替换了原文件4、双击lc5,并打开注册机,点击administrator三、使用方法1、点击会话,导入1.txt…

    2022年7月24日
    25
  • java 字符数组 合并_字符数组合并?c数组合并?java数组合并问题「建议收藏」

    java 字符数组 合并_字符数组合并?c数组合并?java数组合并问题「建议收藏」本文关键词数组合并,由教案网整理发布publicstaticString[]getOneArray(){String[]a={“0″,”1″,”2”};String[]b={“0″,”1″,”2”};String[]c=newString[a.length+b.length];for(intj=0;j<a.length;++j)…

    2022年6月23日
    28
  • git如何移除某文件夹的版本控制

    git如何移除某文件夹的版本控制

    2021年10月20日
    39
  • chegg网站_chunked

    chegg网站_chunked服务端给浏览器发送报文时,必须告诉浏览器报文的大小,这样浏览器可以根据报文大小来判断报文的完整性以及在长连接中确定报文的截尾。但是很多服务器的报文是动态创建的,在发送之前是无法确定其大小的。服务器只有等待内容全部创建后,计算出主体的大小,才能响应客户端的请求,这样的处理方法大大延迟了响应。传输编码中的分块编码为这种困难提供了解决方案,服务器可以逐块发送主体,并说明每块的大小就可以了。HTTP协议中

    2025年8月1日
    2
  • ScaleAnimation开始结束位置分析[通俗易懂]

    ScaleAnimation开始结束位置分析[通俗易懂]做项目的时候,需要用到动画,大小和位置都不一样。刚开始想到的是ScaleAnimation和TranslateAnimation进行组合,但实验后发现,目标位置始终不对,只用TranslateAnimation是没有问题,所以ScaleAnimation应该不只是进行了缩放经过查找资料,发现ScaleAnimation还进行起始位置的移动。ScaleAnimation分为两种情况,从本身的位置…

    2022年10月15日
    1
  • AD域服务器的搭建(3)–搭建AD域

    AD域服务器的搭建(3)–搭建AD域DNS前期准备DNS服务器对域来说是不可或缺的原因:域中的计算机使用DNS域名,DNS需要为域中的计算机提供域名解析服务;域中的计算机需要利用DNS提供的SRV记录来定位域控制器域中哪台计算机来负责做DNS服务器呢?要么使用域控制器来做DNS服务器,要么使用一台单独的DNS服务器。1.创建域控制器创建域控制器其实就是在服务器级计算机上安装一个ActiveDirectory数…

    2022年5月17日
    64

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号