mapreduce过程

mapreduce过程

程序会根据inputformat将文件分割成splits分片,每个分片会分配一个map task任务,每个map task任务会有一个内存缓冲区,任务处理后的结果会写入到内存缓冲区,并决定数据写入到哪个patitioner,当写入的数据达到内存缓冲区的阈值(默认80%)时,会启动一个线程将内存中的数据溢写到磁中,同时不影响前面的处理结果继续写入到内存缓冲区,.在接下来的溢写过程中,mapreduce框架会对key进行排序,如果map task处理的结果很大会形成多个溢写文件,最后缓冲区的内容会全部溢写到磁盘中,如果有多个文件则合并为一个文件.

当所有的map task任务完成后,每个map task任务会形成一个最终文件,并且该文件的按区划分.reduce任务启动之前,一个map task完成后,会启动线程来拉取map结果数据到相应的reduce task,不断的合并数据,为reduce的数据输入做准备,当所有的map task完成后,数据也就拉取合并完毕,reduce task启动 ,最终将输出结果存入到hdfs.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106367.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 小米手机抓包教程

    小米手机抓包教程小米手机抓包教程

    2022年6月20日
    35
  • 关于博客背景_好看的博客背景图

    关于博客背景_好看的博客背景图目前从事nuclear工程设计工作,基本与编程无关行业。但因为读研期间主要从事编程开发相关研究,所以有所涉猎,主要为C++、ZIGbee、RFID、STM32相关工作,但是基础知识较为欠缺。想通过博客的方式督促自身的学习。博客内容主要集中在机器学习和软件编程相关,虽然之前有过嵌入式、单片机的软硬件设计经验,但是相对学习成本高昂,不适合现在业余自学,所以目前专注于计算机软件编程知识。与君共勉,2

    2022年10月10日
    0
  • 初笔,JAVA.HelloWorld代码详解「建议收藏」

    初笔,JAVA.HelloWorld代码详解「建议收藏」HelloWorld.java//文件名publicclassHelloWorld{  publicstaticvoidmain(String[]args){    System.out.println(“HelloWorld!!!”);}}详解:publicclassHelloWorld:class:翻译过来就叫:类,可以理解为是JAVA中一种文件的名字….

    2022年5月28日
    30
  • JSF标签_img标签详解

    JSF标签_img标签详解1.JSF入门藉由以下的几个主题,可以大致了解JSF的轮廓与特性,我们来看看网页设计人员与应用程序设计人员各负责什么。1.1简介JSFWeb应用程序的开发与传统的单机程序开发在本质上存在着太多的差异,

    2022年8月5日
    3
  • 开发Windows Mobile今日插件 — 内存电量,桌面便笺,桌面记单词

    开发Windows Mobile今日插件 — 内存电量,桌面便笺,桌面记单词

    2021年7月31日
    78
  • 学生信息管理系统(纯前端页面)———无后端数据库

    学生信息管理系统(纯前端页面)———无后端数据库无后端数据库版本的—-学生信息管理系统文末下载地址这学期的前端作业很奇怪,不用数据库实现学生信息管理系统,随便写了下。具体功能如下:实现了查看信息(单击查看按钮,查看具体信息,且为不可修改格式) 实现了修改信息功能(单击修改按钮,可以对学生的信息进行修改) 实现了新增功能(可以新增加一个学生的信息,添加到最后边) 实现了删除功能(在复选框中选择几个就删除几个) 实现了全…

    2022年9月20日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号