关于时序数据库[通俗易懂]

关于时序数据库[通俗易懂]https://blog.csdn.net/ransom0512/article/details/78114167看了一些时序数据库,没有太深入,有一些大概认识,记录下来。 1.  核心数据存储分为行存储或者列存储,由于列存储的高压缩比,现在使用列存储的比较多一些。当前有很多时序数据库采用了在底层KV存储(Cadssandra,HBase,LevelDB,RocksDB)基础…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

https://blog.csdn.net/ransom0512/article/details/78114167

看了一些时序数据库,没有太深入,有一些大概认识,记录下来。 

1.  核心

数据存储分为行存储或者列存储,由于列存储的高压缩比,现在使用列存储的比较多一些。

当前有很多时序数据库采用了在底层KV存储(Cadssandra, HBase, LevelDB, RocksDB)基础上做时序封装,这样能够更快出原型,而且底层还很容易替换。

 

时间序列数据可以分成两部分,序列和数据点。序列就是标识符,比如华东区机器001的CPU使用率。数据点是时间戳和数值构成的数组。序列一般由metric+时间+多个tag组合而成,可以认为是主键。

2.  优点

时间不变

时间有序

允许事件到来乱序

时间唯一

便于分区,比如按天,按月分区

可以按照时间自动删除过期数据

由于其场景比较简单,所以报表就能够做的比较直观,丰富。

3.  缺点

场景受限,只针对特定场景。

SQL能力受到场景限制,不能太过于复杂。

 

4.  场景

监控日志存储,比如CPU利用率,磁盘使用,网络使用,告警信息,TraceLog等日志信息.

尤其适合物联网场景。

5.  和一般KV数据库的区别

更多是在KV数据库上做的包装。

列数据库更合适一些,压缩比高,且Key有序。

6.  SQL解决方案

可以在数据存储格式上,特意为COUNT,SUM,AVG,MAX,MIN等常用聚合操作提前计算,保存在文件头,能够大大提升计算速度。

便于为统计数据做视图,反正查询条件都是按照时间查询的,物化视图方案是很容易的。

能够适用于单表简单查询,不适合做Join查询。

7.  当前时序数据库介绍

时序数据库又很多产品,这里只列举有限几个。

1.1.  OpenTSDB

OpenTSDB是基于HBase的分布式时序数据库。

数据存储一致性,毫秒级写入,数据持久化

底层基于HBase,每秒百万写入,支持线性扩容。

OpenTSDB主要有一个或者多个时间序列守护程序TSD(TimeSeries Daemon)组成。每个TSD都是独立的,之间没有任何状态共享。所每个TSD可以使用不同的HBase集群或者同一个HBase集群来存储和检索数据。

关于时序数据库[通俗易懂]

一个时序数据包含:

Metric Name:度量名称,数据的分类,比如CPU利用率,网络流量

Unix Timestamp:精确到秒或者毫秒的时间戳

Value:一个64位整数或者单精度浮点数,比如CPU90%,可以是90,也可以是0.90

Tag:标签,用一组JSON数据来描述数据的属性,比如属于哪个节点,哪个机架,哪个应用等等。

内部会创建四张表:tsdb,tsdb-meta,tsdb-tree,tsdb-uid

Tsdb表用来存储数据

Rowkey组成为:metric + timestamp + tagk1 + tagv1… + tagkN + tagvN

Rowkey中的时间戳按照小时进行聚合,保存每个小时的数据,小时中每秒或者毫秒数据,都放在同一行。

Metric和tag这些值,都通过tsdb-uid这个表来进行映射以减少需要的字段,默认3个字节,如果要扩大,需要修改源代码,但是之前的数据会失效,所以修改之前要先导出。

这里按照小时进行存储,能够有效降低数据量。而且也有利于压缩。

Tsdb-uid:存放metric,tagk,tagv之间的映射 关系。

Tsdb-meta:元数据表,用来存储时间序列和元数据的表,可选表。

Tsdb-tree:树形表,用树状关系来表示metric的结构,可选表。

1.2.  InfluxDB

单机版免费开源,集群版本收费。

支持类SQL语法

支持条件过滤以及正则表达式删除数据

可以设置在集群内的副本数

1.3.  Beringei

Beringei是Facebook开源的一款内存时序数据库,是Facebook发表的Gorilla论文的开源实现。

Beringei使用一种三级的内存数据结构,如下图所示,其中第一级为分片索引,第二级为时间序列索引,第三级为时序数据,通过该数据结构可以支持快速的数据读写;Beringei实现了一种高效的流式的压缩算法,从而使内存占用最小化;Beringei支持写入内存的同时写入硬盘,并在重启后恢复数据。然而Beringei也有一些限制,譬如只支持浮点型数值、时间精度只到秒、只能按时间戳顺序的写入数据。

关于时序数据库[通俗易懂]

 

8.  引用

https://zhuanlan.zhihu.com/p/29367404?utm_source=com.ideashower.readitlater.pro&utm_medium=social

http://opentsdb.net/overview.html

liubin.org/blog/2016/03/05/tsdb-opentsdb/

http://www.infoq.com/cn/articles/storage-in-sequential-databases?utm_source=infoq&utm_campaign=user_page&utm_medium=link

https://yq.aliyun.com/articles/69354

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/185763.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • mysql数据库备份方法有几种_MySQL几种方法的数据库备份

    mysql数据库备份方法有几种_MySQL几种方法的数据库备份MySQL有几个方法来备份最近博客一直想写点。可是不知道写什么,感觉自己近期的知识没有什么添加,今天想到了一篇能够写的博客。曾经试过依据data目录备份MySQL。可是从来没有成功过。前几天帮助朋友还原MySQL,最终成功的将备份的data目录还原成功了。MySQL数据库算是经常使用的数据库中最好使用的数据库了,对于备份的操作也不例外。所以今天分享一下MySQL数据库的备份的几种方式。方式一:使用…

    2022年5月14日
    46
  • openwrt安装aliddns使用阿里云ddns[通俗易懂]

    openwrt安装aliddns使用阿里云ddns[通俗易懂]openwrt安装aliddns使用阿里云ddns一些小伙伴安装了openwrt之后发现没法使用阿里云的ddns解析这里告诉你怎么添加aliddns插件需要会一些linux基础命令和ssh分四步安装依赖下载插件上传插件安装插件安装ddns-scripts、luci-app-ddns、openssl-util、wget依赖包使用luciweb界面里面的软件包管理,或者ssh使用opkg安装都一样有的openwrt自带的源地址可能下载很慢或根本无法下载,得换源下载alid

    2022年6月10日
    983
  • 柯西变异和自适应权重优化的蝴蝶算法[通俗易懂]

    柯西变异和自适应权重优化的蝴蝶算法[通俗易懂]文章目录一、理论基础1、蝴蝶优化算法2、改进的蝴蝶优化算法(1)柯西变异(2)自适应权重(3)动态切换概率策略(4)算法描述二、函数测试与结果分析三、参考文献四、Matlab仿真程序一、理论基础1、蝴蝶优化算法请参考这里。2、改进的蝴蝶优化算法为了改进蝴蝶算法容易陷入局部最优和收敛精度低的问题,本文从三个方面对蝴蝶算法进行改进。首先通过引入柯西分布函数的方法对全局搜索的蝴蝶位置信息进行变异,提高蝴蝶的全局搜索能力;其次通过引入自适应权重因子来提高蝴蝶的局部搜索能力;最后采用动态切换概率ppp平衡算

    2025年7月21日
    4
  • SCSA之信息安全概述「建议收藏」

    SCSA之信息安全概述「建议收藏」一、信息安全概述1、信息安全防止任何对数据进行未授权访问的措施,或者防止造成信息有意无意泄漏、破坏丢失等问题的发生,让数据处于远离危险、免于威胁的状态或特性。(1)网络安全计算机网络环境下的信息安全。二、信息安全的脆弱性及常见的攻击1、网络环境的开放性“INTERNET的美妙之处在于你和每个人都能互相连接,INTERNET的可怕之处在于每个人都能和你互相连接”2、…

    2022年6月20日
    28
  • Python海龟画图集合

    Python海龟画图集合Python海龟画图集合1.小猪佩奇2.彩色螺旋线3.太极4.美国队长盾牌1.小猪佩奇#coding:utf-8importturtleastt.screensize(400,300)t.pensize(4)#设置画笔的大小t.colormode(255)#设置GBK颜色范围为0-255t.color((255,155,192),"pink…

    2022年6月28日
    30
  • 各种光纤接口类型介绍图_光纤sc接口是什么形状

    各种光纤接口类型介绍图_光纤sc接口是什么形状各种光纤接口类型介绍ST、SC、FC光纤接头是早期不同企业开发形成的标准,使用效果一样,各有优缺点。ST、SC连接器接头常用于一般网络。ST头插入后旋转半周有一卡口固定,缺点是容易折断;SC连接头直接插拔,使用很方便,缺点是容易掉出来;FC连接头一般电信网络采用,有一螺帽拧到适配器上,优点是牢靠、防灰尘,缺点是安装时间稍长。MTRJ型光纤跳线由两个高精度塑

    2025年7月30日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号