以下关于Hive说法正确的是()。
A.一种数据仓库
B.一种数据处理工具
C.一种可视化工具
D.一种分析算法
A.一种数据仓库
B.一种数据处理工具
C.一种可视化工具
D.一种分析算法
第1题
A.Hive是一个基于Hadoop的数据仓库工具
B.Hive是关系数据库
C.Hive QL是一种查询语言
D.Hive可以提供查询分析存储等功能
第2题
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBage历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
第3题
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBase历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
第4题
A.Hive支持自由的扩展集群的规模,只需要重启服务即可
B.Hive支持自定义函数,用户可以根据自己的需求去定义函数
C.HiveSQL执行时,需要避免节点出现问题
D.Hive适合处理小批量数据
第5题
A.Hive在进行多表关联时,从右往左进行关联操作
B.在HiveSQL中,建议把小表写在右边,这样可以提高执行效率
C.Hive最右边的表是大表,且无法通过命令指定哪张表是大表
D.一般情况下有多少张表进行join连接操作,就会启动多少个MapReduce任务
第7题
A.一个开源项目
B. 基于vSphere自动化部署和管理Hadoop集群的工具
C. 支持所有主流的Hadoop版本,还有HBdse ,Hive等生态工具
D. 一个封闭项目
第8题
A.orderby是要对输出的结果进行全局排序,多个reducer可以实现全局排序
B.sortby不是全局排序,只是在进入到reducer之前完成排序
C.distributeby指的是按照指定的字段划分到不同的输出reduce文件中,常见使用方式是orderbydistributeby
D.clusterby不仅支持正序排序,也支持逆序排序。