mpp架构 mysql,MPP架构知识整理

mpp架构 mysql,MPP架构知识整理什么是 MPPMassively 即大规模并行处理一般用来指多个 SQL 数据库节点搭建的数据仓库系统 执行查询的时候 查询可以分散到多个 SQL 数据库节点上执行 然后汇总返回给用户 MPP 的核心减少资源的共享 尽力达到 SharedNothin MPP 并不会进行远程计算 每个节点都有自己独立的 CPU 内存和磁盘资源并行 MPP 并没有像并行度这样的概念 而是每个

什么是MPP

Massively Parallel Processing, 即大规模并行处理

一般用来指多个SQL数据库节点搭建的数据仓库系统。执行查询的时候,查询可以分散到多个SQL数据库节点上执行,然后汇总返回给用户

MPP的核心

减少资源的共享,尽力达到Shared Nothing。 MPP并不会进行远程计算,每个节点都有自己独立的CPU,内存和磁盘资源

并行,MPP并没有像并行度这样的概念,而是每个节点都在进行相同的工作。所以对MPP架构进行水平扩容无法提升并行度

上面说的就是纯粹的MPP架构,但现在MPP架构和Sql on Hadoop的区别也变得模糊,比如,为了提高并行度引入类似并行度的概念,为了降低单个节点宕机的影响,引入副本的概念等。

MPP的优缺点

MPP解决了单个SQL数据库不能存放海量数据的问题,但是也存在一些问题,例如:

当节点数达到100左右时,MPP有些仍会遇到SQScalability的问题,速度变慢,或者不稳定。

当增加或者删除节点的时候,需要的维护工作仍然比较大,集群会遇到数据迁移和重新平衡的问题

Sql on Hadoop架构特征

SQL over Processing Framework

“Hadoop通用计算框架+SQL解析引擎”, 存储层,执行引擎层,SQL解析层三者分离,可以方便替换执行引擎,对使用者而言,同一份数据可以采用不同并行执行引擎来分析。优点是灵活性高,支持细粒度容错,集群扩展性好,缺点是效率无法保证

OLAP over Hadoop

预计算,即数据都以时间序列的方式进入系统并经过数据预聚合和建立索引,因为是预计算,所以应对多维查询时速度非常快,且稳定,支持高并发,支持集群扩展。缺点是灵活性较差

MPP和Sql on Hadoop的区别

MPP数据库适合存储高密度价值数据,并且是长期存储和多次使用,所以MPP并行数据库会花大量的精力在Load阶段,把数据处理成适合分析格式。带来的优点就是从查询速度快,通常在秒级甚至毫秒级以内就可以返回查询结果。缺点是不支持细粒度的容错。

SQL on Hadoop是利用Hadoop平台存储数据,在其之上实现SQL查询引擎。最大的特点和Scalability非常好,可以支持超过1000个节点的集群。但是由于Hadoop的特点,很多查询还是需要做大量的数据扫描操作,因此查询速度往往比MPP要慢,而且支持的同时并发查询数一般也比较低。

样例产品

MPP

GreenPlum,Presto等

elasticsearch

SQL on Hadoop

Hive,Spark等

参考

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/207867.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午12:54
下一篇 2026年3月19日 下午12:55


相关推荐

  • 快速入门UML时序图「建议收藏」

    快速入门UML时序图「建议收藏」使用UML时序图重构代码使用UML时序图时序图是什么时序图的元素组合块(CombinedFragment)举例使用UML时序图最近,在重构项目中的老代码的时候,业务复杂,文档缺失。抽丝剥茧,沉迷在剪不断理还乱的纷繁的关系中,像是苏东坡诗中的那只高贵的乌鸦先生找不到落脚之处。披沙拣金,终于理出一点头绪,生怕忘了,赶紧记下来,又苦于没有好的方式去表达这些错杂的关系,蓦然发现,UML时序图是表达业…

    2022年6月29日
    37
  • pytorch实现ShuffleNet「建议收藏」

    pytorch实现ShuffleNet「建议收藏」ShuffleNet是由2017年07月发布的轻量级网络,设计用于移动端设备,在MobileNet之后的网络架构。主要的创新点在于使用了分组卷积(groupconvolution)和通道打乱(channelshuffle)。分组卷积和通道打乱分组卷积分组卷积最早由AlexNet中使用。由于当时的硬件资源有限,训练AlexNet时卷积操作不能全部放在同一个GPU处理,因此作者把特征图分给多…

    2025年10月10日
    6
  • C语言pow函数(编程pow函数)

    ❶用C语言编程实现pow函数的功能。#includevoidmain(){inta;//底数intb;//指数inti,j;printf(“输入底数:”);scanf(“%d”,&a);printf(“输入指数:”);scanf(“%d”,&b);j=1;for(i=0;ij*=a;printf(“结果为%d\n”,j);}❷C语言中怎样用POW函数和POW1…

    2022年4月16日
    253
  • blender 简单 uv 贴图

    blender 简单 uv 贴图blender 简单 uv 贴图

    2026年3月19日
    2
  • java三元运算符有哪些_java有返回值和无返回值

    java三元运算符有哪些_java有返回值和无返回值关于Java中的三元运算符的详解,请参照这篇文章,写得很好:java三元运算符详解这里我只补充总结一下:对于Java三元运算符: (条件表达式)?表达式1:表达式2;三元运算符要求必须有返回值,即表达式1和表达式2要求必须能return,所以不能在表达式1或表达式2中书写输出语句等。基于此,三元运算符不能独立成句,它就如同一个变量,可以出现在方法参数中、用在赋值语句=的右侧等地方,总之不能独立成句。**以下给出几个示例以供参考:inta=(1<2)?

    2022年10月8日
    4
  • 腾讯元宝双模型同步升级

    腾讯元宝双模型同步升级

    2026年3月12日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号