Python代码实现Excel转JSON

Python代码实现Excel转JSON题记项目需求需要用到Excel转JSON,第一时间想到的就是尘封了将近一年的python,一直在JavaJava,python早忘光了,想立刻开始动手却又不敢,最后确认,用python来完成操作Excel有得天独厚的优势,只能硬着头皮上了。短短的代码,做了将近四个小时,中间复习了一下字典和列表,同时也因为其中遇到了一些奇奇怪怪的问题,凌晨一点多躺下,一身轻松。主要技术python3.8.6+字典/列表的运用+对Excel操作的库pandas其中python对Excel操作的库其实有很多,像我

大家好,又见面了,我是你们的朋友全栈君。

题记

项目需求需要用到Excel转JSON,第一时间想到的就是尘封了将近一年的python,一直在JavaJava,python早忘光了,想立刻开始动手却又不敢,最后确认,用python来完成操作Excel有得天独厚的优势,只能硬着头皮上了。短短的代码,做了将近四个小时,中间复习了一下字典和列表,同时也因为其中遇到了一些奇奇怪怪的问题,凌晨一点多躺下,一身轻松。

主要技术

python 3.8.6 + 字典/列表的运用 +对Excel操作的库pandas

其中python对Excel操作的库其实有很多,像我以前也用过xlrdxlwtopenpyxl等等等,但也各有优缺点吧,有的mac和win不兼容,而像pandas只支持加载表的单个sheet,但在这个工作任务中够用了,大家如果需要对Excel进行操作,可以根据项目/任务需求选择,这边不再赘述。但对Excel转JSON而言,无论用什么库,其核心都是对列表和字典的运用

Excel部分数据展示

在这里插入图片描述

希望效果

由门类到专业类到专业的JSON数据

最终的代码实现

import pandas as pd
import json

data = pd.read_excel(r'/Users/wanglingyi/Desktop/Excel转json/2020本科专业目录.xlsx',sheet_name='汇总')

json_list = []
for name in data['门类'].unique():                           #选门类 
    name_dict={ 
   }                    #建立该门类的字典,存储该门类的名字和专业类及其信息 
    name_dict['name'] = name                                 #存储门类名字 
    name_options = []                                        #准备存储信息 
    name_data = data[data['门类']==name]                     #数据降级 
    #print(name_data) #逐层检查数据是否正确

    for kind in name_data['专业类'].unique():                 #选专业类 
        kind_dict={ 
   }                                         #建立专业类字典,放专业类名字和信息 
        kind_dict['name'] = kind                             #存储专业类名字 
        options = []                                       	 #准备存储信息
        kind_data = name_data[name_data['专业类']==kind]      #数据降级
        #print(kind_data) #逐层检查数据是否正确
        
				#定专业,专业代码唯一,所以不再限定
        for code in kind_data['专业代码']:                            
            #根据上面推出要找代码一样的数据
            code_data = kind_data[kind_data['专业代码']== code ]       
            info = { 
   }                                      #取数据
            info['code'] = code                                      
            for name in code_data['专业名称']:
                info['name'] = name
            for grant in code_data['学位授予门类']:
                info['grant'] = grant
            for years in code_data['修业年限']:
                info['years'] = years
            #print(info) #逐层检查数据是否正确
            options.append(info)
            #print(options) #逐层检查数据是否正确

        kind_dict['options'] = options                   #填充数据
        name_options.append(kind_dict)

    name_dict['options'] = name_options
    json_list.append(name_dict) 
    #print(json_list) #展示结果(先预览看一下)

#确定结果格式正确后以文件形式输出
json_dict = { 
   }
json_dict['data'] = json_list
data_dict = json.dumps(json_dict, ensure_ascii=False)
with open('data.json','w') as f_w:
        f_w.write(data_dict)
        

部分结果展示(已经通过JSON在线预览器美化)

{ 
   
  "data": [
    { 
   
      "name": "哲学",
      "options": [
        { 
   
          "name": "哲学类",
          "options": [
            { 
   
              "code": "010101",
              "name": "哲学",
              "grant": "哲学",
              "years": "四年"
            },
            { 
   
              "code": "010102",
              "name": "逻辑学",
              "grant": "哲学",
              "years": "四年"
            },
            { 
   
              "code": "010103K",
              "name": "宗教学",
              "grant": "哲学",
              "years": "四年"
            },
            { 
   
              "code": "010104T",
              "name": "伦理学",
              "grant": "哲学",
              "years": "四年"
            }
          ]
        }
      ]
    }
   ]
} .........

原文件展示
原文件展示

注意事项

1.理清json数据结构关系

2.注意文件路径前的 r(可以去掉试试会发生什么)

3.可以逐层打印每个数据,看看是否符合格式,从而避免从头到尾都是错的。这就是为什么我在代码中出现了很多**#print()**。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137516.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ITIL V3与ITIL V2的价值差异[通俗易懂]

    ITIL V3与ITIL V2的价值差异[通俗易懂]之前有篇日志写了ITILv3的介绍。这里说一下v3和v2才差异 ITILV3自从2007年推出后,已经将近两年了,这两年时间足够令相关的研究者和爱好者能知晓这个名词。对于新的名词、概念或者技术推出后,往往会有三个时期存在较多的争论,最热闹的时候一般是刚推出或临近推出的时期,而后慢慢冷淡一段时间后,不少有机会深入这些新事物的人慢慢地又会有第二个阶段的争论,最后一个阶段常常是这个新事物真正

    2022年10月6日
    5
  • 独立样本与配对样本t检验

    独立样本与配对样本t检验spss操作全力推荐医咖会这个医学网站,上面讲解非常齐全,下附链接:https://www.mediecogroup.com组间均值是否存在差异,使用t检验独立样本t检验1、需满足条件①、数据满足独立性、②、样本均数服从正态分布、③、两个总体方差齐,可选用两个样本均数比较的t检验2、进行判断①、逻辑上判断是否满足独立,②、数据量比较大时,一般可认为数据满足正态分布③、方差齐次…

    2022年6月19日
    31
  • 循环移动数组元素

    循环移动数组元素//循环移动数组元素//一种大部分数据只移动一次的算法//方法://  将数据循环移动,可以直接计算出每个数据的最终位置,直接移动即可//分析://  这种算法基本可看做每个数据只需要移动一次//  但是每个数据移动的位置需要计算,算法

    2022年7月25日
    31
  • 卡尔曼滤波算法详细推导「建议收藏」

    卡尔曼滤波算法详细推导「建议收藏」一、预备知识1、协方差矩阵是一个维列向量,是的期望,协方差矩阵为可以看出协方差矩阵都是对称矩阵且是半正定的协方差矩阵的迹是的均方误差2、用到的两个矩阵微分公式公式一:公式二:若是对称矩阵,则下式成立…

    2022年6月14日
    19
  • pygame安装(超级详细)

    pygame安装(超级详细)安装时是需要设置python环境变量的,下载python的时候底下有个小框框(没有默认选中)AddPython3.7toPATH需要选择的,如果没有选择的话,需要自己设置,我一般比较懒,卸载了python重新下载的,让下载器自动设置。然后是python版本问题有人疑问这是64位还是32位,看那个[64bit]是64位,至于后面的on32是在windows上使用的意思,在Linux上…

    2022年5月24日
    202
  • 自己动手写js分享插件 [支持https] (QQ空间,微信,新浪微博。。。)

    自己动手写js分享插件 [支持https] (QQ空间,微信,新浪微博。。。)

    2021年10月28日
    38

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号