拉链表的实现过程[通俗易懂]

拉链表的实现过程[通俗易懂]拉链表的优势我就不说了,具体请参考百度百科:拉链表-百度百科推荐一个比较详细的参考文章:拉链表示例主要总结一下实现过程:分析:拉链表就是用来存储变化的数据的,每一份数据都有对应的有效期,我们需要进行的操作就是将变动的数据进行新增,同时将变动对应的前一条数据的有效期进行变更。说明:一般都是今天处理昨天的数据,本文所说的当天为所处理的数据的产生的当天。在这之前需要熟悉一下需要用到的表:表1:订单表(记录原始的数据)表2:增量数据表(记录每日变更的数据)表3:历史拉链表(我们要得到的就是这张表

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

拉链表的优势我就不说了,具体请参考百度百科:
拉链表-百度百科
推荐一个比较详细的参考文章:
拉链表示例

主要总结一下实现过程:

分析:拉链表就是用来存储变化的数据的,每一份数据都有对应的有效期,我们需要进行的操作就是将变动的数据进行新增,同时将变动对应的前一条数据的有效期进行变更。
说明:一般都是今天处理昨天的数据,本文所说的当天为所处理的数据的产生的当天。
在这之前需要熟悉一下需要用到的表:
表1:订单表(记录原始的数据)
表2:增量数据表(记录每日变更的数据)
表3:历史拉链表(我们要得到的就是这张表)
表4:临时历史拉链表(临时表,处理好之后将数据覆盖到历史拉链表中)

总结过程:

初始化:
-1、从订单表中完整获取第一批数据,因为没有历史数据,可以直接初始化到增量数据表中
-2、将增量数据表中的数据直接放入历史拉链表中,有效期为 当前 -> 永久。
增量:
1、将当天变动的数据集A放到增量数据表中(使用createdate & modifydate 进行筛选)
2、将历史拉链表跟数据集A进行左连接,关联上的数据说明已经出现变动,将这部分数据的截止时间进行更新,最为数据集H,这部分相当于历史数据了
3、将增量数据表中的数据添加有效期,有效期为 当前 -> 永久,作为数据集T,这部分相当于当天变动的数据。
4、将数据集H 和 数据集T 进行合并,放入临时历史拉链表
5、最后将临时历史拉链表覆盖历史拉链表
以上就是一个增量的过程,需要注意的是如果一份数据当天多次,我能想到有两种解决方案:
方案1:在取增量数据的时候取最新的一次,这种方案比较广泛吧。
方案2:需要在第三步整理数据集T的时候进行处理,也就是筛选出并不是最新数据的集合,将这部分数据的有效期进行填充,不过我觉得这种方法对于输出快照不太友好。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/184028.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • k2p openwrt路由部署阿里云aliyun-ddns[通俗易懂]

    k2p openwrt路由部署阿里云aliyun-ddns[通俗易懂]之前一直有想法入手一个NAS,用于存储项目文件、照片及电影。本来想买个群晖218的,可喜的是赶上了星际蜗牛矿难(被骗的人好可怜,感同身受……),闪电下了一个D款的小蜗牛。星际蜗牛矿机安装群晖NAS的过程我就不说了,很简单,有需要的可以参照下面的文章。https://post.smzdm.com/p/adwl92zk/?send_by=8903307869家里的路由器是K2P同学帮刷的open…

    2022年5月23日
    87
  • centos7重启apache、nginx、mysql、php-fpm命令

    centos7重启apache、nginx、mysql、php-fpm命令

    2021年10月19日
    42
  • Spring的事务属性意义——transactionAttributes

    Spring的事务属性意义——transactionAttributes

    2021年5月9日
    192
  • Ext.Panel的主要功能

    Ext.Panel的主要功能

    2021年11月30日
    51
  • 阿里云mqtt服务器_阿里云ecs新手教程

    阿里云mqtt服务器_阿里云ecs新手教程概述本篇主要讲述使用MQTTX软件与阿里云进行连接,上篇文章open62541基于mqtt订阅发布中有有关MQTTX软件的下载以及使用。建立连接这里我们使用MQTTX与阿里云建立连接,阿里云地址:https://iot.console.aliyun.com/lk/summary/new这里我们进行注册以及实名认证后进行登录,登录后界面如下所示:一定要实名认证后才可以使用,使用支付宝实名认证很快也很简单登录后我们就可以开始操作了。添加产品点击公共用例后就会跳转到添加产品界面,如下图所

    2025年8月9日
    4
  • 网站防止攻击

    网站防止攻击1、什么是XSSXSS又叫CSS(CrossSiteScript),跨站脚本攻击。它指的是恶意攻击者往Web页面里插入恶意html代码,当用户浏览该页之时,嵌入其中Web里面的html代码会被执行,从而达到恶意用户的特殊目的。XSS属于被动式的攻击,因为其被动且不好利用,所以许多人常呼略其危害性。跨站脚本攻击最大的魅力是通过HTML注入劫持用户的浏览器,任意构造用户当前浏览的HTM

    2022年7月20日
    20

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号