Lamda架构研究「建议收藏」

Lamda架构研究「建议收藏」Lamda架构学习一、Lamda架构介绍Lambda架构整合离线计算和实时计算,融合不可变性(Immutability),读写分离和复杂性隔离等一系列架构原则,可集成Hadoop,Kafka,Storm,Spark,HBase等各类大数据组件。Lambda架构的目的是为应用程序提供一个低延迟的复合异步数据传输环境,例如新闻类应用,经常需要进行大规模信息处理,包括输入,归类,索引,存储等

大家好,又见面了,我是你们的朋友全栈君。

Lamda架构学习
一、Lamda架构介绍
Lambda架构整合离线计算和实时计算,融合不可变性(Immutability),读写分离和复杂性隔离等一系列架构原则,可集成Hadoop,Kafka,Storm,Spark,HBase等各类大数据组件。
Lambda架构的目的是为应用程序提供一个低延迟的复合异步数据传输环境,例如新闻类应用,经常需要进行大规模信息处理,包括输入,归类,索引,存储等操作。
二、
Lambda架构思想
Lamda架构研究「建议收藏」
所有进入系统的数据被分配到了批处理层和实时处理层来处理。
批处理层管理着主数据集(一个不可修改,只能新增的原始数据)和预计算批处理视图。服务层索引批处理视图,因此可以对它们进行低延时的临时查询。
实时处理层只处理近期的数据。任何输入的查询结果都合并了批处理视图和实时视图的查询结果
三、
Lambda架构开源组件选型
数据流通用:Kafka、Flume、Hdfs
1、批处理层选型:
批处理存储层:HDFS,Hadoop,或者阿里的ODPS
批处理计算层:MapReduce,Spark
批处理服务层:HBase,或Cassandra
2、实时处理层选型:
实时处理:Storm或Spark Streaming
实时处理服务层:Redis
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144056.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • anaconda卸载后问题

    anaconda卸载后问题anaconda卸载后问题因platformio问题,我将电脑中的anaconda卸载后,出现重新安装anaconda后,无法使用(无conda命令,无jupyter,spyder等图标的问题);经搜索,通过安装miniconda后,用conda命令安装anaconda解决了问题。但除了了使用anacondaprompt时,出现系统找不到指定路径的提示,比较碍眼,(同cmd亦是)。经查,将注册表中的anaconda字符改为miniconda也能解决问题;如下图…

    2022年6月17日
    143
  • scp传输文件的命令

    scp传输文件的命令scp传输文件的命令

    2022年8月22日
    6
  • pycharm双击打不开_pycharm社区版双击没反应

    pycharm双击打不开_pycharm社区版双击没反应方法一:出现这个问题应该是想永久使用pycharm然后修改了pycharm的Help”->“EditCustomVMOptions文件,导致打不开pycharm,无论怎么下载重新下载还是打不开,原因就是我们所修改的文件,在最后一行添加路径的时候出现了错误。打开C盘用户名下的文件夹,按图中步骤找到pycharm,打开.vmoptions文件,删除最下面这一行自己添加的语句,。然后重启pycharm就可以了。方法二:我们可以在Windows10系统的开始菜单上,单击

    2022年8月27日
    6
  • ssh 命令连接

    ssh 命令连接Linuxssh命令详解SSH(远程连接工具)连接原理:ssh服务是一个守护进程(demon),系统后台监听客户端的连接,ssh服务端的进程名为sshd,负责实时监听客户端的请求(IP22端口),包括公共秘钥等交换等信息。ssh服务端由2部分组成:openssh(提供ssh服务)openssl(提供加密的程序)ssh的客户端可以用XSHELL,Securecrt,Moba…

    2022年6月24日
    30
  • 十款很不错的磁盘碎片整理工具「建议收藏」

    十款很不错的磁盘碎片整理工具「建议收藏」
    说到磁盘整理工具,应该说说磁盘碎片的定义,为什么磁盘碎片会对系统性能造成影响。首先我不是专业的电脑人员,对很专业的理论知识不懂,在这里只可以用很通俗很日常的语言来表达。其实磁盘碎片应该称为文件碎片,是因为文件被分散保存到整个磁盘的不同地方,而不是连续地保存在磁盘连续的簇中形成的。为什么这些碎片多了,会对系统性能造成影响呢?打个比方,你的房间你很久没有整理和清洁了,原本有条不紊的东西变得乱七八糟,你找起东西来自然不方便,耗时间。系统读取硬盘数据也一样,硬盘数据琐碎散落,系统读取起来就

    2022年6月25日
    204
  • .net web部署(IIS Express && Nancy Self-Hosting)

    .net web部署(IIS Express && Nancy Self-Hosting)

    2021年9月7日
    59

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号