下列关于Hive特点总结正确的选项是()。
A.Hive支持自由的扩展集群的规模,只需要重启服务即可
B.Hive支持自定义函数,用户可以根据自己的需求去定义函数
C.HiveSQL执行时,需要避免节点出现问题
D.Hive适合处理小批量数据
A.Hive支持自由的扩展集群的规模,只需要重启服务即可
B.Hive支持自定义函数,用户可以根据自己的需求去定义函数
C.HiveSQL执行时,需要避免节点出现问题
D.Hive适合处理小批量数据
第1题
A.一个开源项目
B. 基于vSphere自动化部署和管理Hadoop集群的工具
C. 支持所有主流的Hadoop版本,还有HBdse ,Hive等生态工具
D. 一个封闭项目
第2题
A.普通的UDF接受行数据并生成行结果
B.UDTF接收多行数据并产生一行结果
C.永久函数可以在多个会话中使用,不需要每次重新建立
D.临时函数不会永久保存,只能在当前会话中使用,重启后需要再次建立
第6题
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBage历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
第7题
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBase历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
第8题
A.orderby是要对输出的结果进行全局排序,多个reducer可以实现全局排序
B.sortby不是全局排序,只是在进入到reducer之前完成排序
C.distributeby指的是按照指定的字段划分到不同的输出reduce文件中,常见使用方式是orderbydistributeby
D.clusterby不仅支持正序排序,也支持逆序排序。
第9题
A.单容灾集群不能满足未来正常的容灾业务需求
B.容灾集群有良好的弹性扩展能力
C.容灾集群可部署在存储节点,也可以单独部署集群
D.用户安装容灾集群,集群是提供复制服务的对象