Python读取写入TXT正确姿势[通俗易懂]

Python2.7IDEPycharm5.0.3在憋一个豆瓣电影抓取的“大招”,分流记录一下保存过程直奔主题1.自己写入txt直接上核心代码:withopen(“douban.txt”,”w”)asf:f.write(“这是个测试!”)这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!结果就是这样:2.将文件输

大家好,又见面了,我是你们的朋友全栈君。

Python 2.7
IDE Pycharm 5.0.3


爬下来,解析,存储,分析,可视化--一气呵成,当然我还在学前面三个哈哈哈

直奔主题


1.自己写入txt

直接上核心代码:

with open("douban.txt","w") as f:
        f.write("这是个测试!")

这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!

结果就是这样:

这里写图片描述


2.将文件输入(print)的内容写入txt

我并不喜欢手写字符,更多时候用到的就是将程序跑出来的print写到txt中保存,比如说刚从豆瓣抓的内容,我想写进去,该怎么保存呢。这就用到了for循环啦。关于豆瓣的爬取请见我的前面那篇博客

我就是想把输出框的文字保存而已
这里写图片描述

#分模块测试,txt写入测试
# -*- coding: utf-8 -*-
from selenium import webdriver
import selenium.webdriver.support.ui as ui
import time

#driver_item=webdriver.Firefox()
driver_item=webdriver.PhantomJS(executable_path="phantomjs.exe")
url="https://movie.douban.com/subject/3541415/?tag=%E7%A7%91%E5%B9%BB&from=gaia_video"
wait = ui.WebDriverWait(driver_item,10)
driver_item.get(url)

try:
    driver_item.find_element_by_xpath("//img[@class='bn-arrow']").click()
    #wait.until(lambda driver: driver.find_element_by_xpath("//div[@class='review-bd']/div[2]/div/div"))
    time.sleep(1)
    comments_deep = driver_item.find_element_by_xpath("//div[@class='review-bd']/div[2]/div")

    print u"深度长评:"+comments_deep.text
    #print type(comments_deep.text)#<type 'unicode'>

    comments_wr=comments_deep.text.encode('utf-8')
    #print type(comments_wr)#<type 'str'>

    #title="盗梦空间"#中文命名文件名乱码,内容可用 title="Inception"
    with open("%s.txt"%title,"w") as f:#格式化字符串还能这么用!
        for i in comments_wr:
            f.write(i)
except:
    print 'can not caught the comments!'

比较常用MODE

这里写图片描述


不清空连续写入

没有文件时候会自动创建的,但是!如果我重新对此进行写入,那么会先清空,然后再写,就是说以前写的没了,这样搞不好吧,我可是要记录很多东西的啊,万能的a出现了。。。

把核心代码改成这样就可以了,记得把w改成a,至于那个分割线问题,因为后续写入和前面已经有的会混在一块,所以我做分割用:

with open("%s.txt"%title,"a") as f:#格式化字符串还能这么用!
        f.write("\n-------------------------------------我是分割线-----------------------------------------\n")
        for i in comments_wr:
            f.write(i)

效果是这样的,不够好看自己再加细节,比如换行多几次

这里写图片描述



That’s all

用到啥学啥,学得快又学的牢
这里写图片描述


致谢

Python:文件的读取、创建、追加、删除、清空
@王志 –Python: 删除已安装的模块或包(modules or packages)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127568.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • idea2021.5.1激活码【注册码】

    idea2021.5.1激活码【注册码】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月20日
    53
  • arm与stm32的关系_STM32系列处理器常见型号与特性

    arm与stm32的关系_STM32系列处理器常见型号与特性ARM介绍1978年,奥地利籍物理学博士HermannHauser,和他朋友,一位英国工程师ChrisCurry,共同创建了一家名为“CambridgeProcessorUnit,CPU”的公司,中文字面意思就是“剑桥处理器单元”,主要从事研发当地电子仪器设备的业务,比如街头游戏机之类的。1979年,在经营逐渐进入正规后,原来的公司名不怎么合适了,那个年代喜欢找个吉祥物作为公司名字,比如Apple公司。这俩就以橡子为吉祥物,取名为“AcronComputer”,中文字面意思就是“橡果公

    2022年10月9日
    5
  • serial.read函数_过程调用属于面向对象吗

    serial.read函数_过程调用属于面向对象吗1.电源管理的状态Android的Linux内核为系统提供了4种电源状态,内核的源码为当中的3种定义了名字和相应的宏定义,名字定义在kernel/power/suspend.c中:1234567constchar*constpm_states[PM_SUSPEND_MAX]={#ifdefCONFI…

    2026年1月19日
    6
  • 实用cmd指令(1)

    实用cmd指令(1)

    2021年8月19日
    77
  • py文件怎么打包成可执行文件_pycharm写好的程序打包

    py文件怎么打包成可执行文件_pycharm写好的程序打包步骤一:安装pyinstaller推荐使用国内豆瓣镜像源安装,否则很可能会失败。在cmd命令行中输入pipinstallpyinstaller-ihttps://pypi.douban.com/simple步骤二:在pycharm中打开:View-ToolWindows-Terminal打开到所要生成exe文件的该文件目录下,输入Terminal中输入:“pyinstaller-F-w’文件名‘.py”就可以制作出exe。-w的用处是不出现黑色控制台窗口。…

    2022年8月28日
    4
  • document.all的详细解释(document.all基本上所有浏览器可用!)

    document.all的详细解释(document.all基本上所有浏览器可用!)从何而来从IE4开始IE的objectmodel才增加了document.all对象,MSDN中也对Object.all有详细的说明,Object.all是个HTMLCollection,不是数组,它包含document.all:http://msdn.microsoft.com/en-us/library/ms537434%28VS.85%29.aspx自他出现后,IE后续版本也…

    2022年7月12日
    18

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号