重要提示:请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
大学作业 > 南开大学 >物联网工程 > 南开大学20秋学期《大数据开发技术(二)》在线作业-1

南开大学20秋学期《大数据开发技术(二)》在线作业-1

有效期:购买后365天内有效
最近更新:2022年12月12日
收藏
¥5.00 购买本套试卷答案 联系客服
¥5.00 购买本套试卷答案
南开大学20秋学期《大数据开发技术(二)》在线作业-1试题导航
(点击下列题号即可跳转至对应的试题位置)
试题 1
[主观题] RDD的map操作不会改变RDD的分区数目。()
[主观题] RDD的map操作不会改变RDD的分区数目。()
RDD的map操作不会改变RDD的分区数目。()
T.对
F.错
查看答案
答案
试题 2
[单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
[单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是()

A.filter

B.foreach

C.map

D.mkString

查看答案
答案
试题 3
[单选题] MLlib中可以调用mllib.tree.DecisionTree类中的静态方法()训练回归树。
[单选题] MLlib中可以调用mllib.tree.DecisionTree类中的静态方法()训练回归树。

A.trainClassifier

B.trainRegressor

C.LogisticRegressionModel

D.LabeledPoint

查看答案
答案
试题 4
[单选题] SparkGraphX中类Graph的reverse方法可以()。
[单选题] SparkGraphX中类Graph的reverse方法可以()。

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D.合并边相同的属性

查看答案
答案
试题 5
[多选题] Mllib实现了一些常见的机器学习算法和应用程序,包括()。
[多选题] Mllib实现了一些常见的机器学习算法和应用程序,包括()。

A.分类

B.聚类

C.降维

D.回归

查看答案
答案
试题 6
[单选题] 递归函数意味着函数可以调用它()。
[单选题] 递归函数意味着函数可以调用它()。

A.其他函数

B.主函数

C.子函数

D.自身

查看答案
答案
试题 7
[主观题] 以下哪个函数可以求两个RDD差集()。
[主观题] 以下哪个函数可以求两个RDD差集()。

A.union
B.substract
C.intersection
D.cartesian
查看答案
答案
试题 8
[单选题] ()可以解决图计算问题。
[单选题] ()可以解决图计算问题。

A.SparkCore

B.BlinkDB

C.GraphX

D.Mllib

查看答案
答案
试题 9
[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息。
[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息。

A.select

B.selectExpr

C.col

D.apply

查看答案
答案
试题 10
[主观题] SparkStreming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。
[主观题] SparkStreming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。

A.union
B.reduce
C.join
D.cogroup
查看答案
答案
试题 11
[单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream。
[单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream。

A.window

B.countByWindow

C.reduceByWindow

D.reduceByKeyAndWindow

查看答案
答案
试题 12
[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()。
[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()。

A.完全图

B.有向完全图

C.无向图

D.简单图

查看答案
答案
试题 13
[多选题] Spark是一个()计算框架。
[多选题] Spark是一个()计算框架。

A.快速

B.分布式

C.可扩展

D.容错

查看答案
答案
试题 14
[单选题] RDD的()操作通常用来划分单词。
[单选题] RDD的()操作通常用来划分单词。

A.filter

B.union

C.flatmap

D.mapPartitions

查看答案
答案
试题 15
[多选题] MapReudce不适合()任务。
[多选题] MapReudce不适合()任务。

A.大数据计算

B.迭代

C.交互式

D.离线分析

查看答案
答案
试题 16
[主观题] PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。()
[主观题] PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。()
PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。()
T.对
F.错
查看答案
答案
试题 17
[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()。
[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()。

A.完全图

B.有向完全图

C.无向图

D.简单图

查看答案
答案
试题 18
[主观题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。()
[主观题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。()
Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。()
T.对
F.错
查看答案
答案
试题 19
[主观题] Scala通过()来定义变量。
[主观题] Scala通过()来定义变量。

A.val
B.val
C.define
D.def
查看答案
答案
试题 20
[单选题] 下列Scala代码应输出():vara=0;varb=0varsum=0;for(a<-1until3;b<-1until3){sum+=a+b;}println(sum);
[单选题] 下列Scala代码应输出():vara=0;varb=0varsum=0;for(a<-1until3;b<-1until3){sum+=a+b;}println(sum);

A.36

B.35

C.11

D.12

查看答案
答案
试题 21
[多选题] Scala中使用()方法来查看两个集合的交集元素。
[多选题] Scala中使用()方法来查看两个集合的交集元素。

A.Set.concat

B.Set.&

C.Set.&&

D.Set.intersect

查看答案
答案
试题 22
[单选题] Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()。
[单选题] Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()。

A.filter

B.flatten

C.grouby

D.flatmap

查看答案
答案
试题 23
[主观题] Scala是一种纯面向对象的语言,每个值都是对象。()
[主观题] Scala是一种纯面向对象的语言,每个值都是对象。()
Scala是一种纯面向对象的语言,每个值都是对象。()
T.对
F.错
查看答案
答案
试题 24
[单选题] Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法。
[单选题] Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法。

A.Graph(vertices,edges,defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]],defaultValue)

C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue,)

D.GraphLoader.edgeListFile(sc,filename)

查看答案
答案
试题 25
[单选题] ()是Spark的核心,提供底层框架及核心支持。
[单选题] ()是Spark的核心,提供底层框架及核心支持。

A.SparkCore

B.SparkSQL

C.SparkStreaming

D.Mllib

查看答案
答案
试题 26
[主观题] Scala在子类中重写超类的抽象方法时,需要使用override关键字。()
[主观题] Scala在子类中重写超类的抽象方法时,需要使用override关键字。()
Scala在子类中重写超类的抽象方法时,需要使用override关键字。()
T.对
F.错
查看答案
答案
试题 27
[主观题] Spark Streming中Dstream是一种抽象的离散流。()
[主观题] Spark Streming中Dstream是一种抽象的离散流。()
Spark Streming中Dstream是一种抽象的离散流。()
T.对
F.错
查看答案
答案
试题 28
[单选题] spark-submit配置项中()表示启动的executor数量。
[单选题] spark-submit配置项中()表示启动的executor数量。

A.--num-executorsNUM

B.--executor-memoryMEM

C.--total-executor-coresNUM

D.--executor-couresNUM

查看答案
答案
试题 29
[主观题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。()
[主观题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。()
RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。()
T.对
F.错
查看答案
答案
试题 30
[主观题] MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。()
[主观题] MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。()
MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。()
T.对
F.错
查看答案
答案
试题 31
[单选题] 以下哪个函数可以求两个RDD交集()。
[单选题] 以下哪个函数可以求两个RDD交集()。

A.union

B.substract

C.intersection

D.cartesian

查看答案
答案
试题 32
[单选题] Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法。
[单选题] Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法。

A.Graph(vertices,edges,defaultVertexAttr)

B.Graph.fromEdges(RDD[Edge[ED]],defaultValue)

C.Graph.fromEdgeTuples(rawEdges:RDD[(VertexId,VertexId)],defaultValue,)

D.GraphLoader.edgeListFile(sc,filename)

查看答案
答案
试题 33
[多选题] 以下哪个是Scala的数据类型()。
[多选题] 以下哪个是Scala的数据类型()。

A.Any

B.NULL

C.Nothing

D.AnyRef

查看答案
答案
试题 34
[单选题] 请问RDD的()操作用于将相同键的数据聚合。
[单选题] 请问RDD的()操作用于将相同键的数据聚合。

A.join

B.zip

C.combineByKey

D.collect

查看答案
答案
试题 35
[多选题] 以下哪个方法可以从集合中创建RDD()。
[多选题] 以下哪个方法可以从集合中创建RDD()。

A.parallelize

B.makeRDD

C.textFile

D.loadFile

查看答案
答案
试题 36
[单选题] SparkStreming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream。
[单选题] SparkStreming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream。

A.map

B.flatMap

C.filter

D.union

查看答案
答案
试题 37
[主观题] RDD是一个可读写的数据结构。()
[主观题] RDD是一个可读写的数据结构。()
RDD是一个可读写的数据结构。()
T.对
F.错
查看答案
答案
试题 38
[主观题] RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。()
[主观题] RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。()
RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。()
T.对
F.错
查看答案
答案
试题 39
[单选题] 请问RDD的()操作是根据键对两个RDD进行内连接。
[单选题] 请问RDD的()操作是根据键对两个RDD进行内连接。

A.join

B.zip

C.combineByKey

D.collect

查看答案
答案
试题 40
[单选题] 以下哪个不是Scala的数据类型()。
[单选题] 以下哪个不是Scala的数据类型()。

A.AnyRef

B.Anything

C.NULL

D.Nothing

查看答案
答案
试题 41
[主观题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。()
[主观题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。()
Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。()
T.对
F.错
查看答案
答案
试题 42
[单选题] 以下算法中属于无监督学习算法的是()
[单选题] 以下算法中属于无监督学习算法的是()

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

查看答案
答案
试题 43
[主观题] Scala中创建一个方法时经常用void表示该方法无返回值。()
[主观题] Scala中创建一个方法时经常用void表示该方法无返回值。()
Scala中创建一个方法时经常用void表示该方法无返回值。()
T.对
F.错
查看答案
答案
试题 44
[单选题] ()是Spark的数据挖掘算法库。
[单选题] ()是Spark的数据挖掘算法库。

A.SparkCore

B.BlinkDB

C.GraphX

D.Mllib

查看答案
答案
试题 45
[主观题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。()
[主观题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。()
Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。()
T.对
F.错
查看答案
答案
试题 46
[主观题] RDD的filter过滤会将返回值为true的过滤掉。()
[主观题] RDD的filter过滤会将返回值为true的过滤掉。()
RDD的filter过滤会将返回值为true的过滤掉。()
T.对
F.错
查看答案
答案
试题 47
[多选题] Spark创建DataFrame对象方式有()。
[多选题] Spark创建DataFrame对象方式有()。

A.结构化数据文件

B.外部数据库

C.RDD

D.Hive中的表

查看答案
答案
试题 48
[多选题] 以下是机器学习的常用算法的是()。
[多选题] 以下是机器学习的常用算法的是()。

A.回归算法

B.聚类算法

C.降维算法

D.分类算法

查看答案
答案
试题 49
[多选题] Spark的RDD持久化操作有()方式。
[多选题] Spark的RDD持久化操作有()方式。

A.cache

B.presist

C.storage

D.long

查看答案
答案
试题 50
[主观题] RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。()
[主观题] RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。()
RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。()
T.对
F.错
查看答案
答案
如搜索结果不匹配,请联系老师获取答案
付费查看答案 (系统将为您自动注册)
该问题答案仅对付费用户开放,欢迎扫码支付开通权限
微信支付
支付宝支付
请使用微信扫码支付(元) 5.00
付款即表示您已同意并接受《服务协议》《购买须知》
恭喜您,购买成功 系统为您生成的账号密码如下:
重要提示: 请勿将账号共享给其他人使用,违者账号将被封禁。
保存账号 查看试卷
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
下载APP
关注公众号
TOP