maxcompute 2.0复杂数据类型之struct[通俗易懂]

maxcompute 2.0复杂数据类型之struct[通俗易懂]maxcompute 2.0复杂数据类型之struct

大家好,又见面了,我是你们的朋友全栈君。

1. 含义

类似于Java中的类的概念。包含很多类的属性。

2. 场景

什么样的数据,适合使用struct类型来存储呢?这里列举了几个我在开发中实际用到的场景。

2.1 多个具有相同前缀的字段

其实struct完全可以拆成多个字段。但是对于比较宽的表而言,会有如下特征:
(1)字段数很多,几百个甚至更多;
(2)相近含义的字段,会放到相邻的位置或者使用相同的前缀,以便查找;
对于这种字段,可以考虑放到一个struct里,减少表的字段数,更加方便查找。但是数据字典的维护,依然是比较麻烦的问题。

2.2 对象列表

对象有多种固定的属性,简单的key-value格式无法满足,可以使用array嵌套struct的方式定义。减少了维护数据字典的工作量。

3. 玩转struct

3.1 构造struct

3.1.1 struct

SELECT  STRUCT(4,'赵六','男') AS c;
c
{“col1″:4,”col2″:”赵六”,”col3″:”男”}

在没有指定struct内具体字段名的时候,默认为col1、col2、col3、……。所以取值的时候也是这样取,如下:

SELECT  STRUCT(4,'赵六','男').col3 AS c;
c

3.1.2 named_struct

SELECT  NAMED_STRUCT('id',3,'name','王五','gender','男') AS c;
c
{“id”:3,”name”:”王五”,”gender”:”男”}

指定了struct内具体字段名,则named_struct的参数数量必须为偶数,分别是key1、value1、key2、value2、key3、value3、……。所以取值的时候也是这样取,如下:

SELECT  NAMED_STRUCT('id',3,'name','王五','gender','男').gender AS c;
c

3.2 横纵双向展开struct数组

例如现在有这样一张表:

c
[{id:1, name:张三, gender:男}, {id:3, name:王五, gender:男}, {id:2, name:李四, gender:男}]

现在想横向、纵向都展开,成多行多列格式,那么就这样做:

SELECT INLINE(c) FROM `test_table`;
id name gender
1 张三
3 王五
2 李四

但是这种做法自由度太低,所以很少会使用到。

4. 常见用法

  1. struct这种类型,更多的是应用在数据存储上。不像array、map还会出现在复杂SQL的中间过程,用于做行列转换等操作。
  2. struct作为表结构中的字段,可以单独使用,或者是跟array联用,来存储数量不固定的对象数据。在创建表的时候,需要指定好struct内部的字段名、字段类型。
  3. struct大概是三个复杂类型之中,出场率最低的一个。绝大部分人都只接触过array和map,而几乎没使用过struct。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106972.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月21日 下午6:00
下一篇 2022年4月21日 下午6:20


相关推荐

  • 激活成功教程ftp密码代码

    激活成功教程ftp密码代码激活成功教程ftp密码代码这是一个激活成功教程ftpserver密码的程序,但是只是娱乐使用而已,不要太当真设计思路如下//写一个ftp密码激活成功教程器//1创建秘钥#include<stdio.h>#include<string.h>#include<stdlib.h>intmain(){ char*ipaddress=”19…

    2025年6月12日
    6
  • OpenClaw vs Cursor:谁才是开发者的最佳 AI 助手?

    OpenClaw vs Cursor:谁才是开发者的最佳 AI 助手?

    2026年3月12日
    4
  • imb服务器怎么拆硬盘,IBM P750更换本地硬盘

    imb服务器怎么拆硬盘,IBM P750更换本地硬盘1、确认故障主机报警和硬盘ERPES01@/>errpt-dH|moreIDENTIFIERTIMESTAMPTCRESOURCE_NAMEDESCRIPTION80D3764C0301180416UHLVDDPVNOLONGERRELOCATINGNEWBADBLOCKSE86653C30301180416PH…

    2022年6月29日
    65
  • Alex 的 Hadoop 菜鸟教程: 第17课 更快速的MapReduce – Spark「建议收藏」

    Alex 的 Hadoop 菜鸟教程: 第17课 更快速的MapReduce – Spark「建议收藏」Spark是Apache的顶级项目。项目背景是Hadoop的MapReduce太挫太慢了,于是有人就做了Spark,目前Spark声称在内存中比Hadoop快100倍,在磁盘上比Hadoop快10倍。

    2022年5月11日
    49
  • 遗传算法代码

    遗传算法代码全局搜索最优算法 1 遗传算法这里以 github 上的遗传算法开源库为例子 首先我们安装 GA 官方说依赖库好像只支持 Python3 但是我好像 python2 也安装成功了 pip3installp 在这里我们讨论一个简单的全局优化过程 讨论 x 2 2 y 4 2 x 2 2 y 4 2 x 2 2 y 4 2 在 x 1 5 y 6 9 x subset 1 5 y subset 6 9 x 1 5 y 6 9 的最大值 源码如下 importnump

    2026年3月18日
    2
  • hashlib

    hashlib使用Python中的hashlib来进行hash加密是非学简单的,下面是一段简单代码:[python] viewplaincopyimport hashlib  md5 = hashlib.md5() #创建一个MD5加密对象  md5.update(“JGood is a handsome boy”)  #更新要加密的数据  prin

    2022年4月27日
    58

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号