[Hadoop in China 2011] 邵铮:揭秘FaceBook Puma演变及发展

[Hadoop in China 2011] 邵铮:揭秘FaceBook Puma演变及发展

 

http://storage.it168.com/a2011/1202/1283/000001283144.shtml

 

邵铮:揭秘FaceBook Puma演变及发展
▲FaceBook公司软件工程师、研发经理邵铮

   FaceBook公司自成立以来发展就非常迅猛,时至今日,每天都有数以万计的人活跃在FaceBook之上,这一庞大的用户群体吸引了大量的企业的注意力,他们希望通过FaceBook这一平台对自己的产品或服务进行营销,以精准找到自己的潜在用户。要精准找到自己的客户,必然要对FaceBook网站用户的实时信息进行分析,FaceBook公司提供的实时数据分析工具就凸显出重要作用。

 

邵铮:揭秘FaceBook Puma演变及发展

 

   据邵铮工程师介绍,FaceBook公司的实时数据分析平台是建立在Hadoop 和Hive的基础之上的,Hadoop Hive集群共有超过3000个节点,共同完成对数据的实时处理分析。如上图所示,数据流通过程涉及的环节较多,每个环节的延迟都会对数据的分析处理能力产生影响,为了最大地降低延迟,尽最大可能为各个用户提供实时查询结果,就要尽可能低地较少每个环节的延迟。

 

  邵铮工程师在本次技术课程中分享了两个关键之处,一是Data Freeway,另一个则是Hadoop下的由Facebook公司开发改良的Puma环节。

邵铮:揭秘FaceBook Puma演变及发展

 

  邵铮工程师给我们分享了现在Facebook公司所使用的Scribe,如上图所示。并重点给我们讲解了Puma的演进与未来的发展方向

邵铮:揭秘FaceBook Puma演变及发展

 

  上图是邵铮工程师认为的Puma理想工作流程,但实际环境中因为各种因素的制约,实际上不太可能达到这一理想流程。

 

邵铮:揭秘FaceBook Puma演变及发展

 

  上图为Puma的第二个版本,Puma2的命名是为了方便记忆和说明。但据邵铮工程师介绍,Puma同样存在一些局限。他说,HBase的写入速度较快,但读取速度就相对较慢。

邵铮:揭秘FaceBook Puma演变及发展

   上图为Puma3的拓扑图,相对于Puma2,其延迟将大幅降低。据悉,Facebook公司目前对实时数据的处理分析能力在10秒多一点,但在未来将 缩短到5秒甚至更短的时间。因为Facebook公司所具有的特殊性,其在未来将大幅缩短写性能,初步预期,相比于现在,将缩短25%的总体时间。现在每个机柜的内存为60GB,但在未来,其将大量部署SSD以替代内存,其内存大小将是现在的十倍,即600GB。

  邵铮工程师表示,在未来,将对数据调度提供更好的支持,在这点上,需要对Puma进行简单的调度,因为连续的工作负载;并且将进行大规模普及,将Hive迁移到日常的报告查询。并且邵铮工程师透露了一个令人极度兴奋的消息,这些即将开源,将免费的开放给其他工程师。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/101203.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 5g网络切片是什么意思_网络切片是5G网络的标志性

    5g网络切片是什么意思_网络切片是5G网络的标志性众所周知,5G网络除了高速度、低时延外,还将承载万物互联,而要满足各种不同垂直行业的差异化需求,就要依靠5G网络切片来实现。因此有专业人士认为网络切片是5G的核心,是运营商服务垂直行业的基础和关键。那么,到底什么是网络切片,为什么5G需要网络切片?网络切片,到底“切”的是什么?01切片技术是5G网络的核心2020年以来,5G建设浪潮奔涌而来,行业应用加速落地,5G与产业加速渗透融合,与经济高质量发展、社会数字化转型的联系愈发紧密。“4G改变生活,5G改变社会”,虽然当前5G的建设成果及其展现出的威

    2022年9月28日
    2
  • java 标识符,分隔符,关键字[通俗易懂]

    java 标识符,分隔符,关键字[通俗易懂](一)标识符的介绍   Java语言中,对于变量,常量,函数,语句块也有名字,我们统统称之为Java标识符.标识符是用来给类、对象、方法、变量、接口和自定义数据类型命名的。  Java标识符由数字,字母和下划线(_),美元符号($)或人民币符号(¥)组成。在Java中是区分大小写的,而且还要求首位不能是数字。最重要的是,Java关键字不能当作Java标识符。下面的标识符是合法…

    2022年7月7日
    21
  • 一个字节多少位,一个字多少位怎么算_一个数字占几个位

    一个字节多少位,一个字多少位怎么算_一个数字占几个位一个字节=一个byte=8位一个字=两个byte=16位,java中:byte=8位short=2byte=16位int=4byte=32位long=8byte=64位float=4byte=32位double=8byte=64位char=4byte=32位string=可占用Integer.MAX_VA…

    2022年10月1日
    2
  • Visifire组件应用

    Visifire组件应用本文转载自:http://www.cnblogs.com/forgetu/archive/2010/06/07/Visifire-AxisLabels.html这篇中简单介绍一下Axis(坐标轴)的主要的几个属性的设置。Visifire废话少说,主要的几个属性及属性的设置和意思请看下面的示例代码和注释:viewsource…

    2022年7月21日
    11
  • 最大池化[通俗易懂]

    最大池化[通俗易懂]TensorFlow最大池化由Aphex34(自己的作品) CCBY-SA4.0,通过WikimediaCommons共享这是一个最大池化的例子maxpooling&

    2022年8月5日
    8
  • 【报告分享】2021抖音数据报告-巨量算数(附下载)

    【报告分享】2021抖音数据报告-巨量算数(附下载)摘要:报告统计了2021年抖音获赞最多的十大职业,分别是:教师、医生、农民、消防员、交警、教练、外卖员、环卫工人、记者、家政服务员。其中,教师获赞72.9亿次。记录和分享生活,已经成为人们的习惯。报告还披露了人们记录生活的无数种切面。2021年记录了1783万次离别,但也记录了2854万次团圆;有1134万条视频关于放弃,但关于坚持的视频则超过5055万条。来源:巨量算数​如需查看完整报告和报告下载或了解更多,公众号:行业报告智库今日报告分..

    2022年5月8日
    276

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号