大学作业 > 南开大学 >物联网工程 > 南开大学20秋学期《大数据开发技术（二）》在线作业-1

南开大学20秋学期《大数据开发技术（二）》在线作业-1

有效期：购买后365天内有效

最近更新：2022年12月12日

¥5.00 购买本套试卷答案联系客服

南开大学20秋学期《大数据开发技术（二）》在线作业-1试题导航

（点击下列题号即可跳转至对应的试题位置）

试题 1 [主观题] RDD的map操作不会改变RDD的分区数目。()

RDD的map操作不会改变RDD的分区数目。（)
T.对
F.错

试题 2 [单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是（)

A．filter

B．foreach

C．map

D．mkString

试题 3 [单选题] MLlib中可以调用mllib.tree.DecisionTree类中的静态方法（)训练回归树。

A．trainClassifier

B．trainRegressor

C．LogisticRegressionModel

D．LabeledPoint

试题 4 [单选题] SparkGraphX中类Graph的reverse方法可以（)。

A．反转图中所有边的方向

B．按照设定条件取出子图

C．取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D．合并边相同的属性

试题 5 [多选题] Mllib实现了一些常见的机器学习算法和应用程序，包括（)。

A．分类

B．聚类

C．降维

D．回归

试题 6 [单选题] 递归函数意味着函数可以调用它（)。

A．其他函数

B．主函数

C．子函数

D．自身

试题 7 [主观题] 以下哪个函数可以求两个RDD差集（)。

A.union
B.substract
C.intersection
D.cartesian

试题 8 [单选题] （)可以解决图计算问题。

A．SparkCore

B．BlinkDB

C．GraphX

D．Mllib

试题 9 [多选题] Spark中DataFrame的（)方法是查询指定字段的数据信息。

A．select

B．selectExpr

C．col

D．apply

试题 10 [主观题] SparkStreming中（)函数当被调用类型分别为（K，V)和（K，W)键值对的2个DStream时，返回类型为（K，（V，W))键值对的一个新DStream。

A.union
B.reduce
C.join
D.cogroup

试题 11 [单选题] Dstream窗口操作中（)方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream。

A．window

B．countByWindow

C．reduceByWindow

D．reduceByKeyAndWindow

试题 12 [单选题] 图结构中如果任意两个顶点之间都存在边，那么称之为（)。

A．完全图

B．有向完全图

C．无向图

D．简单图

试题 13 [多选题] Spark是一个（)计算框架。

A．快速

B．分布式

C．可扩展

D．容错

试题 14 [单选题] RDD的（)操作通常用来划分单词。

A．filter

B．union

C．flatmap

D．mapPartitions

试题 15 [多选题] MapReudce不适合（)任务。

A．大数据计算

B．迭代

C．交互式

D．离线分析

试题 16 [主观题] PairRDD中mapValues是针对键值对(Key，Value)类型的数据中的key和Value进行Map操作。()

PairRDD中mapValues是针对键值对（Key，Value)类型的数据中的key和Value进行Map操作。（)
T.对
F.错

试题 17 [单选题] 图结构中如果无重复的边或者顶点到自身的边，那么称之为（)。

A．完全图

B．有向完全图

C．无向图

D．简单图

试题 18 [主观题] Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。()

Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。（)
T.对
F.错

试题 19 [主观题] Scala通过（)来定义变量。

A.val
B.val
C.define
D.def

试题 20 [单选题] 下列Scala代码应输出（)：vara=0;varb=0varsum=0;for（a<-1until3;b<-1until3){sum+=a+b;}println（sum);

A．36

B．35

C．11

D．12

试题 21 [多选题] Scala中使用（)方法来查看两个集合的交集元素。

A．Set.concat

B．Set.&

C．Set.&&

D．Set.intersect

试题 22 [单选题] Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是（)。

A．filter

B．flatten

C．grouby

D．flatmap

试题 23 [主观题] Scala是一种纯面向对象的语言，每个值都是对象。()

Scala是一种纯面向对象的语言，每个值都是对象。（)
T.对
F.错

试题 24 [单选题] Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（)方法。

A．Graph(vertices,edges,defaultVertexAttr)

B．Graph.fromEdges(RDD[Edge[ED]],defaultValue)

C．Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue,)

D．GraphLoader.edgeListFile(sc,filename)

试题 25 [单选题] （)是Spark的核心，提供底层框架及核心支持。

A．SparkCore

B．SparkSQL

C．SparkStreaming

D．Mllib

试题 26 [主观题] Scala在子类中重写超类的抽象方法时，需要使用override关键字。()

Scala在子类中重写超类的抽象方法时，需要使用override关键字。（)
T.对
F.错

试题 27 [主观题] Spark Streming中Dstream是一种抽象的离散流。()

Spark Streming中Dstream是一种抽象的离散流。（)
T.对
F.错

试题 28 [单选题] spark-submit配置项中（)表示启动的executor数量。

A．--num-executorsNUM

B．--executor-memoryMEM

C．--total-executor-coresNUM

D．--executor-couresNUM

试题 29 [主观题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。()

RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。（)
T.对
F.错

试题 30 [主观题] MLlib中Normalizer是一个转换器，它可以将多行向量输入转化为统一的形式。()

MLlib中Normalizer是一个转换器，它可以将多行向量输入转化为统一的形式。（)
T.对
F.错

试题 31 [单选题] 以下哪个函数可以求两个RDD交集（)。

A．union

B．substract

C．intersection

D．cartesian

试题 32 [单选题] Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（)方法。

A．Graph(vertices,edges,defaultVertexAttr)

B．Graph.fromEdges(RDD[Edge[ED]],defaultValue)

C．Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue,)

D．GraphLoader.edgeListFile(sc,filename)

试题 33 [多选题] 以下哪个是Scala的数据类型（)。

A．Any

B．NULL

C．Nothing

D．AnyRef

试题 34 [单选题] 请问RDD的（)操作用于将相同键的数据聚合。

A．join

B．zip

C．combineByKey

D．collect

试题 35 [多选题] 以下哪个方法可以从集合中创建RDD（)。

A．parallelize

B．makeRDD

C．textFile

D．loadFile

试题 36 [单选题] SparkStreming中（)函数可以对源DStream的每个元素通过函数func返回一个新的DStream。

A．map

B．flatMap

C．filter

D．union

试题 37 [主观题] RDD是一个可读写的数据结构。()

RDD是一个可读写的数据结构。（)
T.对
F.错

试题 38 [主观题] RDD的sortBy函数包含参数numPartitions，该参数决定排序后的RDD的分区个数，默认排序后的分区个数和排序之前的个数相等，即为this.partitions.size。()

RDD的sortBy函数包含参数numPartitions，该参数决定排序后的RDD的分区个数，默认排序后的分区个数和排序之前的个数相等，即为this.partitions.size。（)
T.对
F.错

试题 39 [单选题] 请问RDD的（)操作是根据键对两个RDD进行内连接。

A．join

B．zip

C．combineByKey

D．collect

试题 40 [单选题] 以下哪个不是Scala的数据类型（)。

A．AnyRef

B．Anything

C．NULL

D．Nothing

试题 41 [主观题] Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。()

Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。（)
T.对
F.错

试题 42 [单选题] 以下算法中属于无监督学习算法的是（)

A．KNN算法

B．逻辑回归

C．随机森林

D．Kmeans

试题 43 [主观题] Scala中创建一个方法时经常用void表示该方法无返回值。()

Scala中创建一个方法时经常用void表示该方法无返回值。（)
T.对
F.错

试题 44 [单选题] （)是Spark的数据挖掘算法库。

A．SparkCore

B．BlinkDB

C．GraphX

D．Mllib

试题 45 [主观题] Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。()

Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。（)
T.对
F.错

试题 46 [主观题] RDD的filter过滤会将返回值为true的过滤掉。()

RDD的filter过滤会将返回值为true的过滤掉。（)
T.对
F.错

试题 47 [多选题] Spark创建DataFrame对象方式有（)。

A．结构化数据文件

B．外部数据库

C．RDD

D．Hive中的表

试题 48 [多选题] 以下是机器学习的常用算法的是（)。

A．回归算法

B．聚类算法

C．降维算法

D．分类算法

试题 49 [多选题] Spark的RDD持久化操作有（)方式。

A．cache

B．presist

C．storage

D．long

试题 50 [主观题] RDD中的collect 函数是一个行动操作，把RDD 所有元素转换成数组并返回到Driver 端，适用于大数据处理后的返回。()

RDD中的collect 函数是一个行动操作，把RDD 所有元素转换成数组并返回到Driver 端，适用于大数据处理后的返回。（)
T.对
F.错

账号：尚未登录

登录没有账号？去注册