Storm翻版:开源实时数据处理系统Samza

Storm翻版:开源实时数据处理系统Samza

转载自:http://www.kankanews.com/ICkengine/archives/49449.shtml

Twitter的流处理系统Storm最近出现了一个“翻版”——Samza。Samza是近日由LinkedIn开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系统。

Storm和Samza极其相似,就像LinkedIn的Chris Riccomini在博客中阐述的那样:“[Samza]可以帮助你构建应用,处理消息队列——更新数据库、计数以及其他的聚合、转换消息等等。”而这些其实都是很经典的Storm应用,只不过迁移到Samza之上了,Samza文档也对比了这两个系统。

上个月,Samza在各种论坛和社区上被广泛传播,其中有评论指出了Samza可能带来的好处:

“跟很多人一样,我们使用Storm来处理基于Kafka的流数据,然后,再将这些数据发送到Hadoop上进行离线分析。如果能把这三个环境整合到一起,就是一个很大的胜利。“

表面上看,这似乎是一个很不错的想法。Apache软件基金会的项目主页,介绍了搭配使用Kafka和YARN的特点和优势。

高容错:  如果服务器或者处理器出现故障,Samza将与YARN一起重新启动流处理器。

高可靠性:Samza使用Kafka来保证所有消息都会按照写入分区的顺序进行处理,绝对不会丢失任何消息。

可扩展性:Samza在各个等级进行分割和分布;Kafka提供一个有序、可分割、可重部署、高容错的系统;YARN提供了一个分布式环境供Samza容器来运行。

Samza的未来

至于Samza能不能像Storm一样吸引大量的用户和社区参与创新,还有待观察。但是LinkedIn肯定会像Twitter开发Storm一样来保证Samza的发展,而且后者在可用性上更具优势,毕竟运行在YARN或者Mesos框架上的Samza多了一些灵活性。

如果Samza未来有一个很好的前景,那么YARN也对得起Hadoop社区在过去18月的“炒作”,它不仅可以运行Storm,还可以运行Samza,甚至还可以运行其他很多的东西。这点很重要,毕竟很多软件厂商都把大数据的“期货”(甚至整个未来)压在了Hadoop上,他们希望这个平台能成为最后的赢家。

以往对MapReduce技术的依赖限制了Hadoop的适用性,但是YARN已经开放了对大规模的流处理、交互式SQL查询、机器学习和图像处理负载的支持。随着技术的日新月异,Hadoop成为支撑所有大数据应用库的想法变得更加现实。

推荐阅读:

Twitter Storm安装配置(集群)笔记 http://www.linuxidc.com/Linux/2013-05/84307.htm

安装Twitter Storm集群 http://www.linuxidc.com/Linux/2012-07/66336.htm

Twitter Storm安装配置(单机版)笔记 http://www.linuxidc.com/Linux/2013-05/84306.htm

Storm 实战及实例讲解一 http://www.linuxidc.com/Linux/2012-08/69146.htm

转载于:https://my.oschina.net/u/2326085/blog/391232

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/109505.html原文链接:https://javaforall.net

(0)
上一篇 2021年9月4日 下午9:00
下一篇 2021年9月4日 下午10:00


相关推荐

  • 台式机dp接口_电脑里这些不常用的接口你都知道啥功能吗?

    【1、五彩斑斓的音频接口】主板厂商设定的机箱后置接口(主板的背部I/O接口)总是五彩斑斓,其中像USB2.0/3.0接口、RJ-45有线网络接口、各式各样的显示输出接口(VGA、DVI、HDMI、DP等)、音频接口都是最常用的。但这个音频接口有辣么多种颜色,都是干嘛的呢?绝大部分主板一般只会设置右边三个孔,少部分主板会给完整的5~6个,每个孔颜色不一样,代表的功能也不一样。绿色孔对于主流音箱而言…

    2022年4月9日
    139
  • 【生信】全基因组关联分析(GWAS)原理

    【生信】全基因组关联分析(GWAS)原理生信 全基因组关联分析 GWAS 1 前提知识介绍 1 1 最小二乘法 1 2GWAS 的数学原理 1 3Hardy Weinberg 定律 amp 卡方检验 1 4 连锁不平衡 1 5 曼哈顿图 1 6 箱式图 Box plot1 7plot2 GWAS 的定义 2 1 几个需要知道的概念 2 2 全基因组关联分析 3 GWAS 数据预处理 3 1 质控的原因 3 2 基因型数据的质控 3 4 表型数据质控 3 5 正负链翻转 3 6 基因型填补 3 7 群体分层校

    2026年3月17日
    1
  • FFI Library (lua 调用 c)

    FFI Library (lua 调用 c)http luajit org ext ffi htmlTheFFIli nbsp callingexter nbsp functions nbsp and nbsp usingC nbsp datastructur TheFFIlibrar

    2026年3月18日
    2
  • Dell服务器安装EXSI系统

    Dell服务器安装EXSI系统原文链接 Dell 服务器安装 EXSI 系统 1 连接显示器 2 插上键盘 U 盘 显示器 3 看显示屏上的提示 按 F12 关机 4 关机前输入密码 然后按回车键 5 关机后看到服务器电源键不亮了就可以换硬盘了 按一下硬盘左边的按键会弹出把手 6 往外拉出硬盘 逐个换上新硬盘 7 换号硬盘后开机 8 按 Ctrl R 键进入 RAID 设置页面 9 清除之前的 RA

    2026年3月19日
    2
  • mysql字符串截取拼接_mybatis截取字符串

    mysql字符串截取拼接_mybatis截取字符串用法:1.substring(str,pos)例子:str是被操作的字符串,pos表示是从哪个位置开始。如果pos为正,则下标从左到右从1开始记。如果pos为负,则下标从右到左从-1开始记。2.substring(strfrompos)例子:与1的用法相同,但是逗号变为from。3.substring(str,pos,len)例子:str是被操作的字符串,pos表示是从哪个位置开始。如果pos为正,则下标从左到右从1开始记。如果pos为负,则下

    2022年10月2日
    3
  • idea2021.3.4激活码-激活码分享

    (idea2021.3.4激活码)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~S32P…

    2022年3月26日
    726

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号