SpringBoot上传文件类型检测「建议收藏」

SpringBoot上传文件类型检测「建议收藏」判断文件类型的三种方式1.通过文件后缀名这个方法只要修改后缀名就可以了2.通过Content-Type判断由于Content-Type取决于文件类型,文件类型取决于文件扩展名,所以改变了文件扩展名也就改变了Content-Type3.通过文件头判断文件即使文件扩展名改变了文件头也不会改变

大家好,又见面了,我是你们的朋友全栈君。

本章目标

实现SpringBoot上传文件类型检测的工具类

前言

当我们在项目中需要实现上传文件的时候, 为了安全起见以及限制文件上传的类型, 我们需要判断上传文件的类型是否符合我们的需求, 防止将病毒木马和非必要的文件上传到服务器上,占用服务器硬盘空间。

判断文件类型的三种方式

1. 通过文件后缀名判断文件类型
这个方法只要修改了后缀名就可以绕过我们的拦截,上传到服务器。

2. 通过Content-Type判断文件类型
由于Content-Type取决于文件类型, 文件类型取决于文件扩展名, 所以改变了文件扩展名就改变了Content-Type,依然可以绕过我们的拦截,上传到服务器。

3. 通过文件头判断文件类型
即使文件扩展名改变了文件头也不会改变。

注意:
1.有些重要的文件,没有固定的文件头
TXT 没固定文件头定义
TMP 没固定文件头定义
INI 没固定文件头定义
BIN 没固定文件头定义
DBF 没固定文件头定义
C 没没固定文件头定义
CPP 没固定文件头定义
H 没固定文件头定义
BAT 没固定文件头定义
2.不同的文件有相同的文件头
4D5A90 EXE
4D5A90 dll
4D5A90 OCX
4D5A90 OLB
4D5A90 IMM
4D5A90 IME

判断文件类型的思路:
先判断Content-Type, Content-Type符合条件了再判断文件头信息是否符合要求。

通过文件头判断文件类型代码实现

package com.xyz.easyexcel.util;

import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;
import java.util.Map;

/** * @Description : 判断文件上传的类型 * @Author : xyz * @Date: 2020-10-24 14:42 */
public class FileTypeUtils { 
   

    // 默认判断文件头前三个字节内容
    public static int default_check_length = 3;
    final static HashMap<String, String> fileTypeMap = new HashMap<>();

    // 初始化文件头类型,不够的自行补充
    static { 
   
        fileTypeMap.put("ffd8ffe000104a464946", "jpg");
        fileTypeMap.put("89504e470d0a1a0a0000", "png");
        fileTypeMap.put("47494638396126026f01", "gif");
        fileTypeMap.put("49492a00227105008037", "tif");
        fileTypeMap.put("424d228c010000000000", "bmp");
        fileTypeMap.put("424d8240090000000000", "bmp");
        fileTypeMap.put("424d8e1b030000000000", "bmp");
        fileTypeMap.put("41433130313500000000", "dwg");
        fileTypeMap.put("3c21444f435459504520", "html");
        fileTypeMap.put("3c21646f637479706520", "htm");
        fileTypeMap.put("48544d4c207b0d0a0942", "css");
        fileTypeMap.put("696b2e71623d696b2e71", "js");
        fileTypeMap.put("7b5c727466315c616e73", "rtf");
        fileTypeMap.put("38425053000100000000", "psd");
        fileTypeMap.put("46726f6d3a203d3f6762", "eml");
        fileTypeMap.put("d0cf11e0a1b11ae10000", "doc");
        fileTypeMap.put("5374616E64617264204A", "mdb");
        fileTypeMap.put("252150532D41646F6265", "ps");
        fileTypeMap.put("255044462d312e350d0a", "pdf");
        fileTypeMap.put("2e524d46000000120001", "rmvb");
        fileTypeMap.put("464c5601050000000900", "flv");
        fileTypeMap.put("00000020667479706d70", "mp4");
        fileTypeMap.put("49443303000000002176", "mp3");
        fileTypeMap.put("000001ba210001000180", "mpg");
        fileTypeMap.put("3026b2758e66cf11a6d9", "wmv");
        fileTypeMap.put("52494646e27807005741", "wav");
        fileTypeMap.put("52494646d07d60074156", "avi");
        fileTypeMap.put("4d546864000000060001", "mid");
        fileTypeMap.put("504b0304140000000800", "zip");
        fileTypeMap.put("526172211a0700cf9073", "rar");
        fileTypeMap.put("235468697320636f6e66", "ini");
        fileTypeMap.put("504b03040a0000000000", "jar");
        fileTypeMap.put("4d5a9000030000000400", "exe");
        fileTypeMap.put("3c25402070616765206c", "jsp");
        fileTypeMap.put("4d616e69666573742d56", "mf");
        fileTypeMap.put("3c3f786d6c2076657273", "xml");
        fileTypeMap.put("494e5345525420494e54", "sql");
        fileTypeMap.put("7061636b616765207765", "java");
        fileTypeMap.put("406563686f206f66660d", "bat");
        fileTypeMap.put("1f8b0800000000000000", "gz");
        fileTypeMap.put("6c6f67346a2e726f6f74", "properties");
        fileTypeMap.put("cafebabe0000002e0041", "class");
        fileTypeMap.put("49545346030000006000", "chm");
        fileTypeMap.put("04000000010000001300", "mxp");
        fileTypeMap.put("504b0304140006000800", "docx");
        fileTypeMap.put("6431303a637265617465", "torrent");
        fileTypeMap.put("6D6F6F76", "mov");
        fileTypeMap.put("FF575043", "wpd");
        fileTypeMap.put("CFAD12FEC5FD746F", "dbx");
        fileTypeMap.put("2142444E", "pst");
        fileTypeMap.put("AC9EBD8F", "qdf");
        fileTypeMap.put("E3828596", "pwl");
        fileTypeMap.put("2E7261FD", "ram");
    }
    
    /** * @param fileName * @return String * @description 通过文件后缀名获取文件类型 * @author xyz */
    public static String getFileTypeBySuffix(String fileName) { 
   
        return fileName.substring(fileName.lastIndexOf(".") + 1, fileName.length());
    }

    /** * @param inputStream * @return String * @description 通过文件头魔数获取文件类型 * @author xyz */
    public static String getFileTypeByMagicNumber(InputStream inputStream) { 
   
        byte[] bytes = new byte[default_check_length];
        try { 
   
            // 获取文件头前三位魔数的二进制
            inputStream.read(bytes, 0, bytes.length);
            // 文件头前三位魔数二进制转为16进制
            String code = bytesToHexString(bytes);
            for (Map.Entry<String, String> item : fileTypeMap.entrySet()) { 
   
                if (code.equals(item.getKey())) { 
   
                    return item.getValue();
                }
            }
        } catch (IOException e) { 
   
            e.printStackTrace();
        }
        return "";
    }

    /** * @param bytes * @return String * @description 字节数组转为16进制 * @author xyz */
    public static String bytesToHexString(byte[] bytes) { 
   
        StringBuilder stringBuilder = new StringBuilder();
        for (int i = 0; i < bytes.length; i++) { 
   
            int v = bytes[i] & 0xFF;
            String hv = Integer.toHexString(v);
            if (hv.length() < 2) { 
   
                stringBuilder.append(0);
            }
            stringBuilder.append(hv);
        }
        return stringBuilder.toString();
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131890.html原文链接:https://javaforall.net

(1)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 虚拟机桥接模式怎么都连不上网(桥接模式下不能连校园网)[通俗易懂]

    虚拟机桥接模式怎么都连不上网(桥接模式下不能连校园网)[通俗易懂]虚拟机桥接失败的坑——桥接模式下不能连校园网问题描述这天下午,我在将树莓派采集到的图片拷贝到虚拟机Ubuntu上的时候,发现用NAT模式根本ping不通虚拟机。所以就想配个桥接模式嘛…然后就陷入了一个坑——折腾了四个多小时的坑。。。搞了半天,发现怎么桥接都连接不上网,ping都ping不通,网上也找了好多帖子,浏览量7、8W的帖子都翻烂了还是没用。嘤嘤嘤…网上有说安装包没卸载干净的、也有说要把桥接改成自动的,VMware卸了装,装了卸,然并卵。。。问题原因原因嘛,说出来都丢人,就是——桥接模式下

    2022年5月18日
    51
  • 织梦dedecmsV5.7联动类型无法显示的处理方法

    织梦dedecmsV5.7联动类型无法显示的处理方法

    2021年10月7日
    34
  • 10道Hadoop面试真题及解题思路「建议收藏」

    10道Hadoop面试真题及解题思路「建议收藏」(一)海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这100

    2022年6月22日
    22
  • 石头剪刀布c++实现

    石头剪刀布c++实现问题描述:编写一个程序,玩“石头”“剪刀”“布”的游戏,在这个游戏中,两位玩家通时说出“石头”“剪刀”“布”如果一位玩家所选的对象击败了另一个玩家所选的对象,那么前者就是赢家,规则是:布吃石头,石头吃剪刀剪刀吃布,为选择的对象和最终的结果使用枚举,使用标准头文件中定义的ran()函数,为计算生成随机的选择。输入:chooseeitherrock,shear,cloth(R/

    2022年7月24日
    38
  • 知识图谱入门 【七】- 知识推理

    知识图谱入门 【七】- 知识推理知识推理任务分类所谓推理就是通过各种方法获取新的知识或者结论,这些知识和结论满足语义。其具体任务可分为可满足性(satisfiability)、分类(classification)、实例化(materialization)。可满足性可体现在本体上或概念上,在本体上即本体可满足性是检查一个本体是否可满足,即检查该本体是否有模型。如果本体不满足,说明存在不一致。概念可满足性即检查某一概念的可满足性,即检查是否具有模型,使得针对该概念的解释不是空集。上图是两个不可满足的例子,第一个本体那个是…

    2022年6月4日
    58
  • 计算机编程原理_如何编程

    计算机编程原理_如何编程一、Socket简介Socket是进程通讯的一种方式,即调用这个网络库的一些API函数实现分布在不同主机的相关进程之间的数据交换。几个定义:(1)IP地址:即依照TCP/IP协议分配给本地主机的网络地址,两个进程要通讯,任一进程首先要知道通讯对方的位置,即对方的IP。(2)端口号:用来辨别本地通讯进程,一个本地的进程在通讯时均会占用一个端口号,不同的进程端口号不同,因此在通

    2022年10月17日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号