Java中获取文件大小的正确方法

Java中获取文件大小的正确方法本文出处:http://blog.csdn.net/chaijunkun/article/details/22387305,转载请注明。由于本人不定期会整理相关博文,会对相应内容作出完善。因此强烈建议在原始出处查看此文。今天写代码时需要实现获取文件大小的功能,目前有两种实现方法,一种是使用File的length()方法;另外一种是使用FileInputStream的available(

大家好,又见面了,我是你们的朋友全栈君。

本文出处:http://blog.csdn.net/chaijunkun/article/details/22387305,转载请注明。由于本人不定期会整理相关博文,会对相应内容作出完善。因此强烈建议在原始出处查看此文。

今天写代码时需要实现获取文件大小的功能,目前有两种实现方法,一种是使用File的length()方法;另外一种是使用FileInputStream的available()方法,当InputStream未进行read操作时,available()的大小应该是等于文件大小的。但是在处理大文件时,后者会发生问题。我们来看一下:

在例子中,我使用了CentOS 6.5 的安装镜像文件,主要是考虑到这个文件足够大(大于2GB)。

Java中获取文件大小的正确方法

1.使用File的length()方法

public static void main(String[] args) {
	File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
	if (f.exists() && f.isFile()){
		logger.info(f.length());
	}else{
		logger.info("file doesn't exist or is not a file");
	}
}

我们看一下输出结果:

4467982336

Java中获取文件大小的正确方法

结果是4.16GB,与Windows上显示的结果一致。

接下来我们看一下通过FileInputStream来获取的文件大小:

public static void main(String[] args) {
	FileInputStream fis= null;
	try{
		File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
		fis= new FileInputStream(f);
		logger.info(fis.available());
	}catch(Exception e){
		logger.error(e);
	} finally{
		if (null!=fis){
			try {
				fis.close();
			} catch (IOException e) {
				logger.error(e);
			}
		}
	}
}

下面是运行结果:

2147483647

这个结果是不是很眼熟?它是Integer.MAX_VALUE,也就是有符号整型能表示的最大数值。

那么换算成熟悉的单位,这种方式获取的文件大小是多大呢?

Java中获取文件大小的正确方法

约等于2GB,这显然不是正确的结果。

究其原因,File的length()方法返回的类型为long,long型能表示的正数最大值为:9223372036854775807,折算成最大能支持的文件大小为:8954730132868714 EB字节,这个量级将在人类IT发展史上受用很多很多年,而FileInputStream的avaliable()方法返回值是int,在之前也介绍了最大的表示范围,所能支持的最大文件大小为:1.99GB,而这个量级我们现在很容易就达到了。

2014年3月31日补充:

针对流式方法读取大文件大小也不是不可行,只是不能再使用传统的java.io.*下的包了,这里要用到java.nio.*下的新工具——FileChannel。下面我们来看下示例代码:

public static void main(String[] args) {
	FileChannel fc= null;
	try {
		File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
		if (f.exists() && f.isFile()){
			FileInputStream fis= new FileInputStream(f);
			fc= fis.getChannel();
			logger.info(fc.size());
		}else{
			logger.info("file doesn't exist or is not a file");
		}
	} catch (FileNotFoundException e) {
		logger.error(e);
	} catch (IOException e) {
		logger.error(e);
	} finally {
		if (null!=fc)){
			try{
				fc.close();
			}catch(IOException e){
				logger.error(e);
			}
		} 
	}
}

使用FileChannel后得到的结果与第一种情况吻合,准确地描述了文件的准确大小。

这里也同样提醒各位技术同仁,涉及到大文件读取的时候,对int类型的数据一定要留个心,以免出现隐藏的bug,定位起来很困难。

2022年1月11日补充:首先感谢大家的支持,当初在写这篇文章的时候也不知道它能带来这么多的阅读量。随着对这门语言的深入使用以及项目积累,也开始理解了为什么流剩余大小avaliable定义为int类型。我们都知道,tomcat中默认允许的post body大小是2MB,nginx对于该指标默认最大限制是1MB。虽然该参数都可以根据实际场景进行修改,但都不建议设置得过大。为什么呢?对于流来说,我们最好把它当成一个不稳定的传输管道。断网、丢包还有一些其他原因导致的网络抖动,都会让传输变得不那么可靠。超时重传的情况时有发生。那么如果为了方便,把一个超大的文件一股脑通过一个请求上传,很显然中间出一点差错就要整个重新上传(因为不知道具体是哪里出错了)。大文件中转站、网盘这些应用,上传2GB以上大小的文件再正常不过了,如果你仔细观察和分析就不难发现,它们都是分片上传的,而每一个分片都不会很大,从而确保传输稳定。从这个层面来讲,int类型绰绰有余。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131670.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 宽度学习详解(Broad Learning System)

    宽度学习详解(Broad Learning System)宽度学习(BroadLearningSystem)我也是最近才知道除了深度学习,还有一个神经网络叫宽度学习(下文统称BLS)。宽度学习是澳门大学科技学院院长陈俊龙和其学生于2018年1月发表的文章提出的,文章名为《BroadLearningSystem:AnEffectiveandEfficientIncrementalLearningSystemWithoutthe…

    2022年5月22日
    37
  • 详细设计说明书编写规范「建议收藏」

    详细设计说明书编写规范「建议收藏」第1章引言  1.1目的  使项目详细设计说明书的编写规范化,从而规范软件管理。尽可能详细地描述程序的各成份的设计考虑,以利于编制程序。  [此处加入编写目的]  1.2背景  说明该软件系统名称,开发者,详细设计原则和方案  [此处加入项目背景资料]  1.3参考资料  列出有关的参考资料名称,作者,发表日期,出版单位  [此处加入参考资料]  

    2022年5月25日
    51
  • yum卸载重装[通俗易懂]

    yum卸载重装[通俗易懂]莫名原因(之前操作不小心删除了某相关文件)导致虚拟机的yum使用不了,在重新安装之前需要卸载原来的相关数据1.删除/usr/share目录下的yum-cli、yum-pluginrm-rfyum-cli/yum-plugins/2.清理与yum相关的文件rpm-qa|grepyumrpm-eyum-3.4.3-161.el7.centos.noarch…

    2022年6月10日
    72
  • unity协程简介[通俗易懂]

    unity协程简介[通俗易懂]在Unity中,一般的方法都是顺序执行的,一般的方法也都是在一帧中执行完毕的,当我们所写的方法需要耗费一定时间时,便会出现帧率下降,画面卡顿的现象。当我们调用一个方法想要让一个物体缓慢消失时,除了在Update中执行相关操作外,Unity还提供了更加便利的方法,这便是协程。在通常情况下,如果我们想要让一个物体逐渐消失,我们希望方法可以一次调用便可在程序后续执行中实现我们想要的效果。我们希望代码…

    2022年6月20日
    39
  • 区块链钱包_区块链钱包的作用

    区块链钱包_区块链钱包的作用什么是区块链钱包 在介绍区块链钱包之前,我们先详细介绍下比特币的地址生成过程。大的流程是:私钥–》公钥–》地址。先啰嗦一点计算机知识:位,字节,字,KB,MB 位:“位(bit)”是电子计算机中最小的数据单位。每一位的状态只能是0或1。 字节:8个二进制位构成1个“字节(Byte)”,它是存储空间的基本计量单位。1个字节用16进制来表示是两个字符,比如1011…

    2022年10月21日
    2
  • LaTeX公式自动换行

    LaTeX公式自动换行LaTeX公式自动换行文章目录LaTeX公式自动换行前言一、autobreak宏包二、breqn宏包总结前言在使用amsmath等宏包输入公式的时候,最折腾的就是比较特殊样式的公式和长公式,尤其是长公式在投稿期刊排版的时候经常遇到,有的期刊是双栏的版式,这样公式太大就要面临公式要进行折行的调整,很多时候我们使用align,multiline等环境,现在有个更加灵活的更加自动的宏包来了,可以让长公式自动换行了。一、autobreak宏包\usepackage{amsmath}\usepacka

    2022年6月3日
    205

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号