大数据

  • 大数据平台设计思路

    大数据平台设计思路一 什么是大数据平台一般情况下 大数据平台指的是使用了 Hadoop Spark Storm Flink Blink 等这些分布式 实时或者离线计算框架 并在上面运行各种计算任务的平台 建设大

    2026年3月18日
    1
  • 大数据架构简介

    大数据架构简介大数据技术其实是分布式技术在数据处理领域的创新性应用 其本质和此前讲到的分布式技术思路一脉相承 即用更多的计算机组成一个集群 提供更多的计算资源 从而满足更大的计算压力要求 大数据技术讨论的是 如何利用更多的计算机满足大规模的数据计算要求 大数据就是将各种数据统一收集起来进行计算 发掘其中的价值 这些数据 既包括数据库的数据 也包括日志数据 还包括专门采集的用户行为数据 既包括企业内部自己产生的数据 也包括从第三方采购的数据 还包括使用网络爬虫获取的各种互联网公开数据 面对如此庞大的

    2026年3月18日
    2
  • Java大数据培训视频全套教程-SVN教程(33)-马克-专题视频课程

    Java大数据培训视频全套教程-SVN教程(33)-马克-专题视频课程Java 大数据培训视频全套培训教程 java 大数据培训学校全套教材 系列课程由 750 集视频构成 基本就是 1 时下流行的 java 培训学校主流内部教材 2 和市面上培训学校的通行的课程体系几乎一样 所以这套课程都能自己学下来 等于上了培训学校一次 完全可以找个 java 工程师的工作了 本门课程为 java 大数据培训学校全套教材 系列课程的第三十三篇 通过学习 svn 等相关概念让大家对 SVN 编程打

    2026年3月18日
    5
  • 什么是大数据?常用的大数据框架

    什么是大数据?常用的大数据框架1 什么是大数据 在互联网技术发展到现今阶段 大量日常 工作等事务产生的数据都已经信息化 人类产生的数据量相比以前有了爆炸式的增长 以前的传统的数据处理技术已经无法胜任 需求催生技术 一套用来处理海量数据的软件工具应运而生 这就是大数据 2 数据的处理技术处理海量数据的核心技术 海量数据存储 分布式海量数据运算 分布式 3 常用的大数据框架这些核心

    2026年3月18日
    2
  • (2)大数据技术综述总结

    (2)大数据技术综述总结1 技术发展综述 1 两大重要事件 大数据技术发展的基础 03 和 04 年 Google 开源了 GFS 以及 MapReduce 这两篇论文 其中 GFS GoogleFileSy 提供了相对于传统存储方案 更加高效 海量的一种数据存储方案分布式文件系统 MapReduce 是对于海量数据的高效的分布式计算框架 大数据落地标志 之后 DougCutting 基于这这两篇文论通过 Java 做了开源实现 GFS 对应于开源的 HDFS MapReduce 名称不变 HDFS MapReduce 构

    2026年3月18日
    2
  • 【大数据Hadoop实战篇】

    【大数据Hadoop实战篇】大数据 Hadoop 实战 10 分钟带你入门 Hadoop 手把手教你搭建分布式集群系统

    2026年3月18日
    3
  • TDengine:开源、高效的物联网大数据平台

    TDengine:开源、高效的物联网大数据平台一 物联网介绍物联网是一个非常宽泛的概念 它意味着各种设备和机器可以通过互联网进行连接并进行信息交换 主要应用在家居 医疗 交通等领域 2021 年 7 月 13 日 中国互联网协会发布了 中国互联网发展报告 2021 物联网市场规模高达 1 7 万亿元 二 主流平台 1 亚马逊云科技 aws aws 物联网服务可以连接和管理数十亿台设备 存储和分析工业 家居消费 商业和汽车业工作负载数据 形成了庞大的云服务生态系统 2 阿里云 阿里云物联网平台是

    2026年3月18日
    2
  • 生物信息学三大数据库NCBI-ENSEMBL-UCSC

    生物信息学三大数据库NCBI-ENSEMBL-UCSCNCBINCBI NationalCent 美国国立生物技术信息中心 于 1988 年 11 月 4 日建立 是 NIH 美国国立卫生研究院 的 NLM 国立医学图书馆 的一个分支 目的是通过提供在线生物学数据和生物信息学分析工具来帮助人类更好的认知生物学问题 目前有将近 40 个在线的文库和分子生物学数据库 包括 PubMed PubMedCentra andGenBank 等 网址 https www ncbi nlm nih gov

    2026年3月18日
    2
  • 在大数据中如何寻找相似的文档(shingle, minhash, LSH)(二)

    在大数据中如何寻找相似的文档(shingle, minhash, LSH)(二)接上篇译文 nbsp nbsp nbsp 1 尽管我们利用 minhashing 技术将大数据量的文档压缩到小数据量的 signatures 并且能够保证文档对之间的相似度大致不变 但是由于文档对的数目可能非常的大 我们仍然不能很有效的找到最相似的文档对 nbsp nbsp nbsp 如果我们的目标是计算每一对文档对之间的相似度 那么我们就没有更好的办法了 或者可以用并行的方法减少运行的时间规模 但是如果我们的目的仅仅是找到的最相似的

    2026年3月18日
    2
  • 大数据:简述对数据采集平台的认识

    大数据:简述对数据采集平台的认识大数据 简述对数据采集平台的认识一 数据采集平台的认识任何完整的大数据平台 一般包括以下的几个过程 amp nbsp amp nbsp amp nbsp amp nbsp amp nbsp amp nbsp 数据采集 amp gt 数据存储 amp gt 数据处理 amp am

    2026年3月18日
    2
关注全栈程序员社区公众号