Lambda架构概述

Lambda架构概述大数据Lambda架构概述

大家好,又见面了,我是你们的朋友全栈君。

大数据Lambda架构

Lambda体系架构简介

Lambda体系架构是一种开部署模型,主要用流处理来补充批处理,以解决实时大数据问题。理想情况下,我们扫描整个数据来达到用户的某个查询需求,而实际上访问如此海量的数据必然使得响应过慢。一般公司对可用性的要求比一致性要高,简言之即服务的可用性更为重要。选择高用性而不是一致性必然会导致较弱的一致性级别。写后读可能不会返回预期的响应。如果不进行读取修复,数据可能会一直损坏。而系统性的更新会埋下数据无法恢复的隐患。

为了解决这些问题,Lambda体系结构使用不可变的数据流,并在流计算的组合中利用预计算的批处理视图。不可变地存储数据消除了数据损坏的可能性,然而,不变的数据会导致更复杂的计算。
。Lambda架构为计算查询提供三层架构:批处理层、速度层和服务层。新传入的数据流进批处理层和速度层,服务层通过整合批处理层和速度层来响应用户的查询。

Lambda架构概述

Batch Layer 批处理层

批处理层接收不可变的记录流并把它们持久化到存储系统里(如HDFS),存储层用来保存主数据。任何因为数据状态的改变(更新)都会在持久层里重新计算。同时它也为服务层的视图生成任务。与加速层相比批处理层耗时较多。它能修复加速层的计算缺陷,因为它拥有全量的数据。批处理层定期重新计算视图,并将结果输出到只读存储器。

Speed Layer 加速层

加速层主要负责动态计算实时视图。它能接受一个或多个数据源并从流数据里生成实时视图。一旦计算出视图,加速层将输出到可接受随机写的数据存储系统内。、
通常,在加速层应用流处理器Flink、Storm而Redis和Apache Cassandra适合实时视图的存储。

Serving Layer 服务层

服务层负责整合实时和批处理视图即它通过获取最新的加速层和批处理层数据并做整合最终输出汇聚后的视图。服务层的关键是保证给定查询的响应时间最短,
因此,服务层可以并行化视图的查询。当两个结果都完成时,它可以生成一个聚合视图。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152801.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月25日 下午6:46
下一篇 2022年6月25日 下午6:46


相关推荐

  • 一些能用的 BT Tracker 服务器地址【不定时更新】[通俗易懂]

    一些能用的 BT Tracker 服务器地址【不定时更新】[通俗易懂]不定时更新可用的BTTracker服务器列表(BTTrackerList);相关工具BEncodeEditor:https://sites.google.com/site/ultimasites/bencode-editorTrackerEditor:https://github.com/GerryFerdinandus/bittorrent-tracker-editor/releases可以将服务器列表写入TrackerEditor程序同目录下的add_trackers.txt

    2022年6月18日
    154
  • mybatis缓存问题「建议收藏」

    mybatis缓存问题「建议收藏」目前系统正常使用,突然来个用户注册,可是账号太长,导致数据库没法保存,所以觉得把数据库表的字段改大点,问题解决。但是问题又来了,修改字段长度后系统没有重启,导致查出来的数据为字段没有修改长度之前的那个长度,比如说:字段长度修改前,字段长度为varchar(16),用户账号是;8832226780@qq.com,注册失败,字段修改后,字段长度改为varchar(32),用户账号是;88322

    2022年5月11日
    44
  • js数组遍历结果错误

    js数组遍历结果错误找出所有项的和最大的 arr 数组的连续子数组 写出函数 getMaxSubSum arr 用其找出并返回最大和

    2026年3月26日
    2
  • Centos7上安装Docker完整版[通俗易懂]

    Centos7上安装Docker完整版[通俗易懂]首先确认你是CentOs7版本: 命令:cat /etc/redhat-release ——————————————————————————————————————————————————————安装步骤:1、 yum安装gcc相关 命令: yum-yinstallgcc(保证能上外网)、yum -y install gcc-c++…

    2022年6月13日
    49
  • SQL注入攻击常见方式及测试方法

    SQL注入攻击常见方式及测试方法本文主要针对 SQL 注入的含义 以及如何进行 SQL 注入和如何预防 SQL 注入让小伙伴有个了解 适用的人群主要是测试人员 了解如何进行 SQL 注入 可以帮助我们测试登录 发布等模块的 SQL 攻击漏洞 至于如何预防 SQL 注入 按理说应该是开发该了解的事情 但是作为一个棒棒的测试 搞清楚原理是不是能让我们更加透彻地理解 bug 的产生原因呢 好啦 话不多说 进入正题 如何理解 SQL 注入 攻击 SQL 注入是

    2026年3月20日
    1
  • linux系统下以存储从大到小并以K,M,G为单位的方式查看当前目录下的文件信息…[通俗易懂]

    linux系统下以存储从大到小并以K,M,G为单位的方式查看当前目录下的文件信息…

    2022年2月10日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号