互联网海量视频数据的存储[通俗易懂]

原文链接:http://www.docin.com/p-86312184.html?docfrom=rrela一、背景    互联网内容提供方式转变:用户创造内容。视频应用、网络游戏、搜索引擎等互联网衍生业务迅速发展,使得海量数据存储、管理和处理成为当今互联网公司面临的严峻问题。这些信息保存在存储设备上,便是高膨胀的海量数据,表1是不同互联网应用的规模。  互联网应用海量数据的共性:  1…

大家好,又见面了,我是你们的朋友全栈君。

原文链接:http://www.docin.com/p-86312184.html?docfrom=rrela

一、背景

    互联网内容提供方式转变:用户创造内容。视频应用、网络游戏、搜索引擎等互联网衍生业务迅速发展,使得海量数据存储、管理和处理成为当今互联网公司面临的严峻问题。这些信息保存在存储设备上,便是高膨胀的海量数据,表1是不同互联网应用的规模。

互联网海量视频数据的存储[通俗易懂]

    互联网应用海量数据的共性:

    1)用户群体大,增长速度快;

    2)数据总量大,增长速度快;

    3)数据类型多样,大小不一;

    4)数据操作模式较为固定,一致性要求较弱,对读写延时有一定要求;

    互联网应用的海量数据特性,对数据存储和处理提出了新的挑战,如下:

    1)TB级甚至PB级的存储系统,以适应海量数据的需求;

    2)良好的扩展性。在不中断服务的情况下,通过简单添置机器或者磁盘存储来扩展系统,满足不断增长的数据和用户群体需求;

    3)低时延、高吞吐的存储系统性能;

    4)丰富的存储类型,以满足互联网应用中结构化、半结构化甚至非结构数据的存储需求;

    5)灵活简单的并行编程模型进行海量数据处理,隐藏分布式环境下数据分布、容错等复杂性;

二、数据存储

   1、 传统技术:传统关系型数据库

    局限性:应用场景局限,着眼于面向结构化的数据,致力于事务处理,要求保持严格的一致性;关系模型束缚对海量数据的快速访问能力;缺乏对非结构化数据的处理能力;扩展性差。

    2、新兴数据存储系统:集中式数据管理系统、非集中式数据管理系统

互联网海量视频数据的存储[通俗易懂]

三、数据处理

    快速从海量数据中抽取出关键信息用以提高互联网应用的质量、用户体验等,已经成为互联网企业之间竞争的关键技术问题。同时,大规模数据处理的研究,也是DISC应用研究的关键问题。

    并行计算

    解决大规模数据处理的方法就是并行计算。将大量数据分散到多个节点上,将计算并行化,利用多机的计算资源,从而加快数据处理的速度。目前,这种并行计算主要分为3大类:一类是广泛应用于高性能计算的MPI技术,一类是以Google、Yahoo为代表的互联网企业兴起的Map/Reduce计算,一类是微软提出的Dryad并行计算模型。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/129682.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • windows系统C#(.Net)MySql数据库同步工具

    windows系统C#(.Net)MySql数据库同步工具DbSyncDbSync是一款使用.Net4.5(可以转Core)作为基础框架开发的,目前运行在windows平台的数据库同步工具。此类工具开源社区有很多,这里不是为了重复造轮子,仅仅是因为公司业务需要,不建议直接在生产环境上使用。项目介绍DbSync运行在windows平台的数据库同步工具支持一主多从同步支持同步方式设设置(结构,索引,增量,全量)支持指定表同步和忽略表同步支持同步计划,定时同步展示信息获取本人QQ:724926089,代码比较简单,有需要支持的地

    2022年6月17日
    64
  • 河南六大学生程序设计竞赛–外国人饲喂站[通俗易懂]

    河南六大学生程序设计竞赛–外国人饲喂站

    2022年1月16日
    55
  • 关于博客背景_好看的博客背景图

    关于博客背景_好看的博客背景图目前从事nuclear工程设计工作,基本与编程无关行业。但因为读研期间主要从事编程开发相关研究,所以有所涉猎,主要为C++、ZIGbee、RFID、STM32相关工作,但是基础知识较为欠缺。想通过博客的方式督促自身的学习。博客内容主要集中在机器学习和软件编程相关,虽然之前有过嵌入式、单片机的软硬件设计经验,但是相对学习成本高昂,不适合现在业余自学,所以目前专注于计算机软件编程知识。与君共勉,2

    2022年10月10日
    2
  • SpringBootTest 和PowerMocker

    SpringBootTest 和PowerMockerimportstaticorg.junit.Assert.assertNotEquals;importstaticorg.junit.Assert.assertNotNull;importstaticorg.junit.Assert.assertTrue;importjava.util.HashMap;importjava.util.Map;importorg…

    2022年6月5日
    33
  • 常用八大测试用例设计方法有哪些_测试用例编写方法

    常用八大测试用例设计方法有哪些_测试用例编写方法1、等价类划分(EquivalancePartitioning)测试的思想:将程序的输入域划分为若干个区域(等价类),并在每个等价类中选择一个具有代表性的元素生成测试用例。该方法是常用的黑盒(BlackboxTesting)测试用例(Testcase)设计方法。等价类划分可有两种不同的情况:有效等价类和无效等价类。有效等价类是指对于程序的规格说明来说是合理的、有意义的输入数据构成的集合,它能检验程序是否可以实现规格说明中所规定的功能需求。无效等价类是指对程序的规格说明是不合理的或无意义的输入数据所

    2022年10月12日
    0
  • linux时间同步

    linux时间同步

    2021年8月18日
    70

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号