MPP架构详解_大数据中心架构详解

MPP架构详解_大数据中心架构详解数据库构架设计中主要有SharedEverthting、SharedNothing、和SharedDisk:SharedEverthting:一般是针对单个主机,完全透明共享CPU/MEMORY/IO,并行处理能力是最差的,典型的代表SQLServerSharedDisk:各个处理单元使用自己的私有CPU和Memory,共享磁盘系统。典型的代表OracleRac,它是数据共…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

数据库构架设计中主要有Shared Everthting、Shared Nothing、和Shared Disk:

Shared Everthting:一般是针对单个主机,完全透明共享CPU/MEMORY/IO,并行处理能力是最差的,典型的代表SQLServer

Shared Disk:各个处理单元使用自己的私有 CPU和Memory,共享磁盘系统。典型的代表Oracle Rac, 它是数据共享,可通过增加节点来提高并行处理的能力,扩展能力较好。其类似于SMP(对称多处理)模式,但是当存储器接口达到饱和的时候,增加节点并不能获得更高的性能 。

Shared Nothing:各个处理单元都有自己私有的CPU/内存/硬盘等,不存在共享资源,类似于MPP(大规模并行处理)模式,各处理单元之间通过协议通信,并行处理和扩展能力更好。典型代表DB2 DPF和hadoop ,各节点相互独立,各自处理自己的数据,处理后的结果可能向上层汇总或在节点间流转。

我们常说的 Sharding 其实就是Share Nothing架构,它是把某个表从物理存储上被水平分割,并分配给多台服务器(或多个实例),每台服务器可以独立工作,具备共同的schema,比如MySQL Proxy和Google的各种架构,只需增加服务器数就可以增加处理能力和容量。

MPP概念

MPP即大规模并行处理(Massively Parallel Processor )。 在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据 库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。

大规模并行处理(MPP)架构

MPP架构详解_大数据中心架构详解

例子

Greenplum是一种基于PostgreSQL的分布式数据库。其采用shared nothing架构(MPP),主机,操作系统,内存,存储都是自我控制的,不存在共享。也就是每个节点都是一个单独的数据库。节点之间的信息交互是通过节点互联网络实现。通过将数据分布到多个节点上来实现规模数据的存储,通过并行查询处理来提高查询性能。
这个就像是把小数据库组织起来,联合成一个大型数据库。将数据分片,存储在每个节点上。每个节点仅查询自己的数据。所得到的结果再经过主节点处理得到最终结果。通过增加节点数目达到系统线性扩展。

elasticsearch也是一种MPP架构的数据库,Presto、Impala等都是MPP engine,各节点不共享资源,每个executor可以独自完成数据的读取和计算,缺点在于怕stragglers,遇到后整个engine的性能下降到该straggler的能力,所谓木桶的短板,这也是为什么MPP架构不适合异构的机器,要求各节点配置一样。

Spark SQL应该还是算做Batching Processing, 中间计算结果需要落地到磁盘,所以查询效率没有MPP架构的引擎(如Impala)高。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/234643.html原文链接:https://javaforall.net

(0)
上一篇 2025年5月30日 下午7:43
下一篇 2025年5月30日 下午8:15


相关推荐

  • Java | FileOutputStream中文乱码问题的解决

    Java | FileOutputStream中文乱码问题的解决使用 FileOutputSt 序列化可以直接向文件写入文本内容但这里的字符串如果包含中文 就会出现乱码 这是因为 FileOutputSt 是字节流 将文本按字节写入文件 而一个汉字是两个字节 无法一次写入 就会出现乱码 解决方法使用 OutputStream 将字节流转换为字符流写入 同时指定 utf 8 编码 代码如下 OutputStream newOutputStr newFileOutpu

    2026年3月16日
    2
  • AjaxPro2完整入门教程[通俗易懂]

    AjaxPro2完整入门教程[通俗易懂]网上关于AjaxPro的完整教程太少,所以这里我利用下自己的空余时间写一篇较为完整的AjaxPro教程,希望大家能够提出更多宝贵的建议

    2022年7月4日
    29
  • 基于Socket和OpenCV的实时视频传输(On Linux)「建议收藏」

    上一篇介绍了在Windows上实现基于Socket和openCV的实时视频传输,这一篇将继续讲解在Linux上的实现。环境:Server:Ubuntu14.04LTS+OpenCV2.4.10 Client:: Ubuntu14.04LTS+OpenCV2.4.10 我采用的仍是TCP协议的通信,Linux上的实现和Wind

    2022年4月15日
    201
  • zabbix mysql trapper_zabbix的trapper(补获器)使用

    zabbix mysql trapper_zabbix的trapper(补获器)使用Zabbix 采集器 捕获器 这种获取数据的方式是 agent 端通过 zabbix sender 命令发送数据 一般情况下 我们在创建监控项的时候 我们选择的类型是 zabbix 客户端 是每隔多长时间 主动或被动的 发送数据给 server 当脚本执行时间过长的时候 在选用 zabbix 客户端 这种类型的监控项 会影响 server 的性能 所以当脚本执行时间过长时 我们选择 zabbix 采集器 的方式

    2026年3月19日
    2
  • Linux 更改文件名

    Linux 更改文件名Linux 更改文件名

    2026年3月20日
    3
  • jupyter notebook的链接密码 token查询 以及 pycharm 如何使用 jupyter notebook「建议收藏」

    jupyter notebook的链接密码 token查询 以及 pycharm 如何使用 jupyter notebook「建议收藏」目录1、token的查询:2、如何在pycharm中使用jupyternotebook学Python时突然想用jupyternotebook来运行一下代码,好做一下笔记,结果发现要jupyternotebook的token密码,这可苦了我,我怎么可能会记得呢。。。于是上百度搜索一番,有不错的收获,现整理一下:1、token的查询:结合网上查找的和我自己的体会,发现了3种…

    2025年6月18日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号