大数据
-
常见大数据框架
常见大数据框架文件存储 HadoopHDFS Tachyon KFS 离线计算 HadoopMapRed Spark 流式 实时计算 Storm SparkStreami S4 HeronK V NOSQL 数据库 HBase Redis MongoDB 资源管理 YARN Mesos 日志收集 Flume Scribe Logstash Kibana 消息系统 Kafka StormMQ ZeroMQ R
-
Lanius大数据治理平台
Lanius大数据治理平台Lanius 大数据治理平台 是由渝州大数据实验室研发推出的一款国产可控的 ETL 处理及数据调度的产品 拥有生产级 易使用 智能化的特点 以推动国内数据治理发展为目标 向个人及政企单位免费开源
-
【简介】大数据技术综述
【简介】大数据技术综述大数据技术综述首先 在学习大数据之前 需要了解什么是大数据 它是如何诞生的 它有哪些应用场景 只有了解了这些 才能窥视大数据的技术全貌 一个技术的诞生 是顺应时代的 是用于解决某些问题的 它的发展也一定是有内在逻辑的 接下来 一起去看看 诞生背景传统数据处理架构在大数据诞生之前 对数据的处理技术就已经被很广泛的应用了 数据一般被分为结构化数据 半结构化数据 非结构化数据 对于结构化数据的处理 传统的数据处理方式是由数据库 数据仓库负责存储 使用 SQL 结构化查询语言 进行处理 而非结构化 半结构
-
大数据之MPP架构
大数据之MPP架构目录一 对称多处理器架构二 非一致性存储访问架构三 海量并行处理架构 3 1NUMA 与 MPP 的区别 3 2MPPDB 从并行 平行计算系统内存架构来看 目前商用服务器大体可以分为三类 即对称多处理器架构 SMP SymmetricMul Processor 非一致性存储访问架构 NUMA Non UniformMemor 以及海量并行处理架构 MPP MassiveParal 一 对称多处理器架构对称多处理器 SymmetricMul
-
41页工业物联网大数据平台建设方案
41页工业物联网大数据平台建设方案通过工业互联网将来自于传感器发出的信息汇总 然后基于大数据平台 根据相应的指标 规则予以过滤 分析 可以提炼出对企业有价值的信息 大数据可以对指定信息进行归纳总结 形成某种规律性的认识 最终提炼为对企业和个人有用的新信息 帮助他们进行更好的决策 IaaS 提供基本的计算 网络和存储资源 PaaS 中间层 提供对行业业务应用的支持 SaaS 向用户交付最终业务应用和数据分析 PaaS 环境层 为业务应用提供支撑的软件组件 包括各种中间件和数据库等 以 Hadoop 为代表的大数据处理 PaaS 业务层 包含了应用的
-
大数据面试题以及答案整理(一)
大数据面试题以及答案整理(一)在进行大数据工作的面试中 将面试问题进行了汇总 然后对答案进行了整理
-
【大数据千人会微信群20140827期交流纪要】傅志华-大数据如何在企业落地
【大数据千人会微信群20140827期交流纪要】傅志华-大数据如何在企业落地大数据千人会微信群分享 期 傅志华 大数据如何在企业落地中国互联网协会大数据工作委员会 筹 推出 大数据千人会 论坛 每周三晚 8 点 30 分开始 在 中国大数据千人会 微信群进行交流与探讨 本期我们特别有幸邀请到美国互联网上市公司数据中心副总经理傅志华为大家带来 大数据的开放式创
-
大数据认定奖补条件2022年安徽省部分地市大数据企业认定奖补条件办法政策
大数据认定奖补条件2022年安徽省部分地市大数据企业认定奖补条件办法政策2022 年安徽省大数据企业认定奖补条件办法政策这里汇编 安徽省大数据企业认定申报时间截止 8 月 20 日 接下来我们来看一下安徽省部分地市大数据企业奖补政策细则内容 申报看作者名字 安徽省大数据企业申报奖励补贴 合肥市大数据企业奖励补贴 一 合肥市 1 鼓励经市级认定的大数据企业围绕智慧城市 区块链 人工智能 加强业务驱动 开展场景应用创新 经市级备案 运用企业自主知识产权的核心技术开发智慧城市场景应用产品 且经专家委员会评审认定研发完成并上线运营的项目 给予 20 万元一次性奖补 执行部门 市数据资源局 事后奖
-
大数据—Hadoop生态圈
大数据—Hadoop生态圈前言整理了一下目前常用的 hadoop 组件 后续将会对这些组件的具体应用场景和使用细节进行展开分析 如果大家发现有更好的建议欢迎大家在下方留言
-
大数据框架综述
大数据框架综述一 什么是大数据大数据 IT 行业术语 是指无法在一定时间范围内用常规软件工具进行捕捉 管理和处理的数据集合 由数据组成的集合 是需要新处理模式才能具有更强的决策力 洞察发现力和流程优化能力的海量 高增长率和多样化的信息资产 它具有以下特征 1 海量的数据规模 随着信息技术的高速发展 数据开始爆发性增长 存储单位从过去的 GB 到 TB 乃至现在的 PB EB 级别 2 快速的数据流转 大数据的产生