MPP架构是什么?看这一篇就行了。。

MPP架构是什么?看这一篇就行了。。文章目录 MPP 是什么 SMP SymmetricMul Processor 对称多处理器结构 NUMA Non UniformMemor 非一致存储访问结构 MPP Massive ParallelProc 海量并行处理架构 MPPDB 学习笔记 大数据架构详解 从数据获取到深度学习 MPP 是什么系统架构层面的服务器分类 如下三类 SMP Sym

学习笔记:大数据架构详解:从数据获取到深度学习

MPP是什么

  • 系统架构层面的服务器分类,如下三类:

SMP- Symmetric Multi-Processor 对称多处理器结构

  • 特点
    Uniform Memory Access
    共享存储:cpu,内存,io

  • 不足
    扩展能力有限
    内存总线限制访问内存的效率

NUMA -Non-Uniform Memory Access 非一致存储访问结构

  • 特点
    拥有多个CPU模块,每个模块由多个CPU组成,有独立的本地内存,io槽口
    节点之间通过互联模块进行连接和信息交互:同一台物理服务器内部实现,cpu异地访问时必须等待
    较好解决SMP系统的扩展问题


  • 不足
    互联模块访问效率和本地内存访问不在一个效率层级,系统性能无法和cpu数线性增加

MPP -Massive-Parallel Processing 海量并行处理架构

另一种系统扩展的方式

  • 特点
    • SMP组合的方式:每台SMP服务器(节点)通过节点互联网络连接。
      节点互联网络:MPP内部使用,对用户透明,在不同SMP服务器外部通过IO实现,每个节点只访问本地内存和存储,节点信息交互和节点本身是并行处理的。
    • 每个节点只访问本地资源(内存,存储),Share Nothing结构。
    • 对等节点:所有数据节点角色一样。可以提升并行计算能力
    • 汇总节点:数据汇总节点的稳定性,可用性影响整体的性能
  • 不足
    • 复杂的机制来调度和平衡各个节点的负载和并行处理过程。
    • 短板效应。
      如果一个节点总是执行的慢于集群中其他的节点,整个集群的性能就会受限于这个故障节点的执行速度(所谓木桶的短板效应),无论集群有多少节点,都不会有所提高。
      当MPP系统中某个节点的RAID由于磁盘问题导致的性能很慢,或者硬件或者系统问题带来的CPU性能问题等等,都会产生这样的问题。所有的MPP系统都面临这样的问题。

    • MPP集群规模不能过大。
    • 并发度不能过高,数据查询汇总节点的并发查询数限制在10+数量级,用户数有限制。

MPP DB

– Share Disk

– Share Nothing

水平扩展灵活,元数据同步、故障恢复问题

典型MPP DB

了解MPP的架构特点,再来看看有代表性的一些产品,是不是有一种大同小异、豁然开朗的感觉。

Greenplum

  • 架构
    在这里插入图片描述
  • 大规模存储
    Hash分片,表分区:数据到各个Segment Host
  • 并行处理
  • 支持索引
    B-Tree
    Bitmap
    Hash


Teradata

暂无了解,原理细节及使用介绍参考这位仁兄的文章

Impala

在这里插入图片描述

Presto

Distributed SQL Query Engine for Big Data
在这里插入图片描述
官方文档

  • presto目标定位
    Presto is a tool designed to efficiently query vast amounts of data using distributed queries. If you work with terabytes or petabytes of data, you are likely using tools that interact with Hadoop and HDFS. Presto was designed as an alternative to tools that query HDFS using pipelines of MapReduce jobs such as Hive or Pig, but Presto is not limited to accessing HDFS. Presto can be and has been extended to operate over different kinds of data sources including traditional relational databases and other data sources such as Cassandra.

    Presto was designed to handle data warehousing and analytics: data analysis, aggregating large amounts of data and producing reports. These workloads are often classified as Online Analytical Processing (OLAP).

  • presto组件
  • presto使用
  • presto 与 Impala区别

ElasticSearch

在这里插入图片描述
es版本变更很快,与java spring体系集成方面,产生了一些第三方组件库,
比较高效的一种方案参考 bboss

Vertica

MPP架构的应用场景

搜索架构

查询服务

client节点,数据汇总节点(协调节点),并行计算节点。

协调节点也是集群中任意同构的计算节点,其性能、稳定性、可用性决定了集群的整体表现。

MPP与Batch的优缺点比较

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/211948.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午9:12
下一篇 2026年3月18日 下午9:12


相关推荐

  • mybatis-plus扩展extend批量操作(自带批量操作是循环单条插入,效率太低)

    mybatis-plus扩展extend批量操作(自带批量操作是循环单条插入,效率太低)添加依赖 mybatis plus 组件 dependency groupId com baomidou groupId artifactId mybatis plus boot starter artifactId version 3 4 2 version dependency

    2026年3月19日
    2
  • AddressSanitizer 页面

    AddressSanitizer 页面介绍 AddressSanit 是一个快速的内存错误检测工具 它由一个编译时插桩模块和一个运行库组成 该工具可以检测以下类型的错误 OOB 包括堆 栈和全局变量 UAFUse After Return runtimeflagA OPTIONS detect stack use after return 1 Use After Scope clangflag fs

    2026年3月20日
    2
  • pycharm查找替换快捷键_python查找指定字符串并替换

    pycharm查找替换快捷键_python查找指定字符串并替换快捷键ctrl+shift+r弹出如下界面上边我的dealed就是要被替换的内容,handled就是替换后的内容点击replaceinfindwindows…点击allfiles就是全部替换了

    2022年8月28日
    7
  • Vim下多行同时编辑与删除技巧

    Vim下多行同时编辑与删除技巧问题 在 Vim 内同时对多行增加或删除相同的内容 如 item1item2it 变成 增加 my item1my item2my item3 再变成 删除 tem1tem2tem3 方法 编辑 1 将光标移到要插入相同内容的第一行第一个字符上 如上面代码中 item1 中的 i 上按下 ctrl v 进入 visualblock 模式 2 按两次 j 或者 2j 将光标移动到要插入的最后一样 如上面代码中 item3 中的 i 上按下 I 大写 i 进入编辑

    2025年10月24日
    9
  • 2021-09-27 网安实验-取证分析-数字取证之foremost

    2021-09-27 网安实验-取证分析-数字取证之foremostForemost的使用关于foremostForemost是基于文件开始格式,文件结束标志和内部数据结构进行恢复文件的程序Foremost参数说明$foremost[-v|-V|-h|-T|-Q|-q|-a|-w-d][-t][-s][-k][-b][-c][-o][-i<file]-V-显示版权信息并退出-t-指定文件类型.(-tjpeg,pdf…)-d-打开间接块检测(针对UNIX文件系统)-i-指定输入文件(默认为标准输

    2025年8月1日
    5
  • claude code 安装教程

    claude code 安装教程

    2026年3月16日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号