hive、hadoop面试题

hive、hadoop面试题有如下hive记录表records,记录车辆的过车信息:createtablerecords(idstring,//记录编号indatestring,//过车记录时间plate_nostring,//车辆号牌device_idint,//经过的设备编号)partitionedby(monthstring,daystring)rowformatdelimitedfieldsterminatedby’\t’storedasORC;1…

大家好,又见面了,我是你们的朋友全栈君。

有如下hive记录表records,记录车辆的过车信息:
create table records(
  id string, //记录编号
  indate string, //过车记录时间
  plate_no string, //车辆号牌
  device_id int, //经过的设备编号
)
partitioned by(month string,day string)
row format delimited fields terminated by ‘\t’ stored as ORC;

1请使用HQL得到最近一个月内晚上(晚22点-早6点)出现记录最多的车辆号牌Top10及次数
select
  plate_no,
  rank() over(sort by total desc) rk,
  total
from
  (
   select
   plate_no,
   count(1) total
   from
    (
     select
     indate,
     plate_no
     from
     records
     where
     From_unixtime(unix_timestamp(indate,”yyyy-MM-dd HH:mm:ss”),”yyyy-MM-dd”)>=date_sub(‘2020-04-26’,30)
     and
     From_unixtime(unix_timestamp(indate,”yyyy-MM-dd HH:mm:ss”),”yyyy-MM-dd”) <=’2020-04-26′
     and
     From_unixtime(unix_timestamp(indate,”yyyy-MM-dd HH:mm:ss”),”HH”) <=22
     and
     From_unixtime(unix_timestamp(indate,”yyyy-MM-dd HH:mm:ss”),”HH”) >=6
    )  t1
   group by plate_no
  ) t2
 where rk = 10

2请用spark RDD将上述表中indate、plate_no、device_id三个字段记录重复的数据只保留一条
object interview02 {

  def main(args: Array[String]): Unit = {

    val session: SparkSession = SparkSession.builder().master(“local[*]”).appName(“interview”).getOrCreate()
    val rdd: RDD[Row] = session.read.csv(“records”).rdd

    val distinct = rdd.map(row => ((“indate”,”plate_no”,”device_id”),(“id”)))
      .groupByKey()
    distinct.distinct().foreach(println)
    session.stop()
    }

}

3有string A和string B,分别由4096个随机的0或1组成,样例为String A = “01010111001….110010”,String B=”10101110….100101″,
现有公式double C=(A和B逐位与的和)/(A中1的个数*B中1的个数),请用自己熟悉的语言实现出满足此公式的方法。
public class Method {

    public static void main(String[] args) {

       

 String A = "0101010101101010";
        String B = "1010101010101011";

        char[] chars1 = A.toCharArray();
        char[] chars2 = B.toCharArray();
        int sum;
        Double sum2 = 0.0;
        int c = 0;
        int d = 0;
        for (int i = 0; i < chars1.length; i++) {
            char a = chars1[i];

//            for (int j= 0;j< chars2.length;j++){
            char b = chars2[i];


            sum = Integer.parseInt(String.valueOf(a)) & Integer.parseInt(String.valueOf(b));
            /* System.out.println(sum); */
            sum2 += sum;
        }
        for (int j = 0; j < chars1.length; j++) {
            char a = chars1[j];

            char b = chars2[j];
            if (Integer.parseInt(String.valueOf(a)) == 1) {

                c += 1;


            }
            if (Integer.parseInt(String.valueOf(b)) == 1) {

                d += 1;


            }



        }
        Double C = sum2/(c*d);
        System.out.println(sum2);
        System.out.println(c);
        System.out.println(d);
        System.out.println(C);

    }
}

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/149946.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 小米MIX 解BL锁教程 申请BootLoader解锁教程

    小米MIX 解BL锁教程 申请BootLoader解锁教程小米MIX线刷兼救砖_解账户锁_纯净刷机包_教程一、准备工作1、注册小米账号:点击注册(已有小米账号请忽视)2、在手机中登陆【小米账号】3、下载并解压【小米解锁工具】或点击这里下载安装二、开始解锁1打开【小米解锁官网】:http://www.miui.com/unlock/,点击【立即解锁】,输入【小米账号】,点击【立即登录】,填写好上诉信息后,点击【立即申请】,输入【…

    2022年6月12日
    58
  • 常用数字音频功放芯片-音频放大器

    常用数字音频功放芯片-音频放大器功放作为各类音响器材设备中的重要组成部分,作用就是把来自音源或前级放大器的弱信号放大,推动音箱放声,一套良好的音响系统功放的作用功不可没。功放的主要性能指标有输出功率,频率响应,失真度,信噪比,输出阻抗,阻尼系数等。由于考虑功率、阻抗、失真、动态以及不同的使用范围和控制调节功能,不同的功放在内部的信号处理、线路设计和生产工艺上也各不相同,由于各厂家的测量方法不一样,所以出现了一些名目不同的叫法。例如额定输出功率,最大输出功率,音乐输出功率,峰值音乐输出功率。数字音频处理功放芯片在影响声卡的功能和性能

    2022年5月22日
    43
  • 【转载】TCP和TCP/IP的区别

    【转载】TCP和TCP/IP的区别

    2021年11月18日
    88
  • [歪谈]物质激励假设无论用了,最好还是试一试精神管理[通俗易懂]

    [歪谈]物质激励假设无论用了,最好还是试一试精神管理

    2022年2月1日
    42
  • maven配置本地仓库位置「建议收藏」

    maven配置本地仓库位置「建议收藏」在下载好的maven文件中我创建了一个文件夹,做为我的maven的本地仓库接下来就是在conf文件夹中打开setting.xml文件找到这个标签,里面配置刚刚我创建的文件夹的地址,这个地址就配置成了我的本地仓库啦以后下载的依赖就都在这个文件夹下了…

    2022年9月23日
    2
  • pycharm 安装包总失败原因及解决办法「建议收藏」

    pycharm 安装包总失败原因及解决办法「建议收藏」对于pycharm安装包失败的原因借解决办法在pycharm中安装包安装失败:Non-zeroexitcode(1)可能是在库中找不到对应版本。解决:cmd中使用命令:pipinstall包名-ihttps://pypi.douban.com/simple另一种总是安装失败,也有可能是pip版本过低。更新pip,在pycharm->setting->ProjectInterpreter进行升级。如果pip总是更新失败,可以重装anaconda。(我是用anaconda解

    2022年5月17日
    1.2K

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号