数据建模之ODS层命名规范及质量规范

数据建模之ODS层命名规范及质量规范命名规范表命名规范表命名规则:{层次}{源系统表名}{保留位/delta与否}。 增量数据:ods_{库名}_{表名}_{id}。 全量数据:ods_{库名}_{表名}。 ODSETL过程的临时表:tmp_{临时表所在过程的输出表}_{从0开始的序号}。 按小时同步的增量表:ods_{库名}_{表名}_{ih}。 按小时同步的全量表:ods_{库名}_{表名}_{hh}。 ps:如果库名可能重复,可使用编码来代替库名字段命名规范 字段默认使用源系统的字段名。 字段名与.

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

命名规范

  • 表命名规范表命名规则: {层次}{源系统表名}{保留位/delta与否}。
    • 增量数据:ods_{库名}_{表名}_{id}。
    • 全量数据:ods_{库名}_{表名}。
    • ODS ETL过程的临时表:tmp_{临时表所在过程的输出表}_{从0开始的序号}。
    • 按小时同步的增量表:ods_{库名}_{表名}_{ih}。
    • 按小时同步的全量表:ods_{库名}_{表名}_{hh}。

ps:如果库名可能重复,可使用编码来代替库名

  • 字段命名规范
    • 字段默认使用源系统的字段名。
    • 字段名与关键字冲突时,在源字段名后加上col,即源字段名col。
  • 同步任务命名规范
    • 任务名:和表名保持一致。

数据存储及生命周期管理规范

数据存储及生命周期管理规范
数据表类型 存储方式 最长存储保留策略
ODS流水型全量表 按天分区
  • 不可再生情况下,永久保存。
  • 日志(数据量非常大,例如一天数据量大于100 GB)数据保留24个月。
  • 自主设置是否保留历史月初数据。
  • 自主设置是否保留特殊日期数据。
ODS镜像型全量表 按天分区
  • 重要的业务表及需要保留历史的表视情况保存。
  • ODS全量表的默认生命周期为2天,支持通过ds=max_pt(tablename)方式访问数据。
ODS增量表 按天分区
  • 有对应全量表,最多保留最近14天分区数据。
  • 无对应全量表,需要永久保留数据。
ODS ETL过程临时表 按天分区 最多保留最近7天分区。
DBSync非去重数据 按天分区 由应用通过中间层保留历史数据,默认ODS层不保留历史数据。

数据质量规范

  • 每个ODS全量表必须配置唯一性字段标识。
  • 每个ODS全量表必须有注释。
  • 每个ODS全量表必须监控分区空数据。
  • 仅有监控要求的ODS表才需要创建数据质量监控规则。
  • 建议对重要表的重要枚举类型字段进行枚举值变化及枚举值分布监控。
  • 建议对ODS表的数据量及数据记录数设置周同环比监控,如果周同环比无变化,表示源系统已迁移或下线。

欢迎评论

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/189160.html原文链接:https://javaforall.net

(0)
上一篇 2026年4月14日 下午2:55
下一篇 2026年4月14日 下午3:01


相关推荐

  • nvm的简介、安装、使用(简单明了)

    nvm的简介、安装、使用(简单明了)一 nvm 是什么 nvm 是一个 node 的版本管理工具 可以简单操作 node 版本的切换 安装 查看 等等 与 npm 不同的是 npm 是依赖包的管理工具 二 nvm 的安装 1

    2026年3月19日
    1
  • Flink教程(02)- Flink入门

    Flink教程(02)- Flink入门文章目录 01 引言 02Flink 概述 2 1 什么是 Flink01 引言在上一节 Flink 教程 01 Flink 知识图谱 我们知道了 Flink 的知识大纲 明白了需要学习的主要内容 本专栏以后都是围绕以下内容来讲 Flink 介绍 Flink 环境准备 安装部署 Flink 编程模型 DataStreamAP 状态管理与容错 DataSetAPITa amp SQLFlink 组件栈 Flink 部署与应用 Flink 监控与性能优化本文主要开始讲解 Flink

    2026年3月18日
    2
  • 零起点学习Drupal教程[第一章—引言]

    零起点学习Drupal教程[第一章—引言]文章摘自http://www.rzchina.net/forum/6第一章引言1.1什么是drupal?Drupal究竟是什么呢?下面是Drupal官方网站给出的定义:“Drupal软件允许个人或用户社区轻松地发布、管理和组织Web站点上的各种内容。”Drupal是一个免费的、开源的、具有模块化框架使用PHP开发的网站内容管理系统。Drupal允许网站管理员创建和组织网站内容、定制

    2022年6月13日
    28
  • goland 2021激活码【2021最新】

    (goland 2021激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html…

    2022年3月30日
    42
  • Java URL转义「建议收藏」

    encodeUrl=java.net.URLEncoder.encode(url,”utf-8″)url=“src/test.java”encodeUrl=“src%2Ftest.java”

    2022年4月14日
    341
  • 霍夫曼树及霍夫曼编码的C语言实现

    霍夫曼树及霍夫曼编码的C语言实现从周五开始学习霍夫曼树 一直到今天终于完成 期间遇到了各种各样的棘手的问题 通过一遍遍在纸上分析每一步的具体状态得以解决 现在对学习霍夫曼树的过程加以记录首先介绍霍夫曼树霍夫曼树 HuffmanTree 又称最优二叉树 是一类带权路径长度最短的树 假设有 n 个权值 w1 w2 wn 如果构造一棵有 n 个叶子节点的二叉树 而这 n 个叶子节点的权值是 w1 w2 wn 则所构造出的带权路径长度

    2025年10月15日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号