大学作业 > 南开大学 >物联网工程 > 南开大学20秋《并行程序设计》在线作业-1（参考答案）

南开大学20秋《并行程序设计》在线作业-1（参考答案）

有效期：购买后365天内有效

最近更新：2022年12月12日

¥5.00 购买本套试卷答案联系客服

南开大学20秋《并行程序设计》在线作业-1（参考答案）试题导航

（点击下列题号即可跳转至对应的试题位置）

试题 1 [单选题] 互斥量是一种（)同步机制。

A．一元状态

B．二元状态

C．多元状态

D．以上皆错

试题 2 [单选题] 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括（）

A．创建和管理线程代码

B．循环划分给线程的代码

C．找出数据依赖的代码

D．线程同步的代码

试题 3 [主观题] 两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。

A、先将两个矩阵读入cache再进行乘法
B、先转置第一个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错

试题 4 [单选题] 在SSEintrinsics程序中双精度浮点数数据类型是（)。

A．_m128

B．_m128f

C．_m128d

D．_m128i

试题 5 [单选题] 两个n*n的矩阵相乘，将所有n^2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分的数据并行。

A．输入数据

B．中间结果

C．输出数据

D．临时数据

试题 6 [单选题] 以下哪条不是推动并行计算发展的因素（)？

A．存储是系统瓶颈

B．单CPU发展已能满足应用需求

C．利用标准硬件构造并行机令升级容易

D．编程环境标准化逐步发展

试题 7 [单选题] 在128位的SIMD寄存器中，我们不能保存（)。

A．16个8位整数

B．8个16位短整型

C．4个32位整型

D．16个字符的字符串

试题 8 [单选题] 求解同一个问题的4个并行算法的等效率函数分析结果如下，其中（)的可扩展性最优。

A．θ(plogp)

B．θ(p^2)

C．θ(p^2logp)

D．θ(p^3)

试题 9 [单选题] 限制CPU内流水线深度的因素包括（)。

A．指令复杂程度

B．分支预测性能

C．CPU核心数

D．CPU cache大小

试题 10 [单选题] 全球500强超算在CPU、网络等硬件上越来越体现出采用（)的趋势。

A．特殊硬件

B．通用硬件

C．非公开硬件

D．廉价硬件

试题 11 [单选题] MPI默认点对点通信模式是（)。

A．阻塞的

B．非阻塞的

C．对等的

D．主从的

试题 12 [单选题] n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法（）

A．肯定不是代价最优

B．肯定是代价最优

C．不确定是否代价最优

D．以上皆错

试题 13 [单选题] 一个SSE寄存器可容纳（)个短整型数。

A．2

B．4

C．8

D．16

试题 14 [单选题] 在使用互斥量之前必须对其进行（)。

A．初始化

B．加锁

C．解锁

D．销毁

试题 15 [单选题] CUDA线程层次中不包括（)。

A．Kernel

B．Grid

C．Block

D．Thread

试题 16 [单选题] SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0∶7]，若imm8[j]=0则表示（)。

A．将第一个源寄存器的第j个元素放在目标寄存器位置0

B．将第二个源寄存器的第j个元素放在目标寄存器位置0

C．将第一个源寄存器的第j个元素放在目标寄存器位置j

D．将第二个源寄存器的第j个元素放在目标寄存器位置j

试题 17 [单选题] 任务依赖图中权重之和最长的路径称为（)。

A．最大任务

B．关键路径

C．平均并发度

D．最短路径

试题 18 [主观题] SSE指令移动单精度浮点数,不能实现____。

A、将64位数据移动到SSE寄存器高位
B、将64位数据移动到SSE寄存器低位
C、将32位数据移动到SSE寄存器指定位置
D、在两个SSE寄存器高/低64位间移动

试题 19 [单选题] 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是（)。

A．_mm_set_ps

B．_mm_set1_ss

C．_mm_setzero_ss

D．_mm_setzero_ps

试题 20 [单选题] 在分布式内存架构编程中,进程间不能（）

A．进行通信

B．进行同步

C．发送和接收消息

D．通过读写变量交换数据

试题 21 [主观题] 当处理器数量不变时,随着问题规模增大,加速比____。

A、所有算法都增大
B、所有算法都减小
C、代价最优算法都增大
D、代价最优算法都减小

试题 22 [单选题] 忙等待方法解决竞争条件的思路是（)。

A．令CPU一直处于忙碌状态无法产生竞争条件

B．令存在数据依赖的内存操作充分并行

C．强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化

D．以上皆错

试题 23 [单选题] float a[64]; for（i=0; i＜64; i+=4) Va=a[i∶i+3]; 此向量化程序内存访问完全对齐，每个循环步恰好是一次对齐的内存访问，则该系统向量化访存是按（)字节对齐。

A．8

B．16

C．32

D．64

试题 24 [单选题] SSE intrinsics _mm_load_ss命令的功能是_____。

A．对齐向量读取单精度浮点数

B．未对齐向量读取单精度浮点数

C．对齐标量读取单精度浮点数

D．未对齐标量读取单精度浮点数

试题 25 [主观题] 有大量分支指令的程序不适合下面哪种体系结构上进行并行化

A、SISD
B、SIMD
C、SPMD
D、MIMD

试题 26 [单选题] 下列指令集中（)不是SIMD指令集。

A．SSE

B．Neon

C．AVX

D．EMT64

试题 27 [单选题] 以下超级计算机中，（)不是SIMD架构。

A．CDCSTAR-100

B．757

C．银河

D．天河1号

试题 28 [单选题] 除了用于解决竞争条件外，互斥量还可用于（)。

A．解决共享资源竞争的问题

B．解决并发度低的问题

C．解决通信开销大的问题

D．解决负载不均的问题

试题 29 [主观题] 关于OpenMP循环并行程序的编写,下列说法中不正确的是____。

A、程序员无需编写线程创建和管理代码
B、程序员无需编写循环划分代码
C、程序员需指出哪个循环应并行
D、程序员需编写线程同步代码

试题 30 [单选题] 在对互斥量进行解锁时，还会执行（)操作。

A．互斥量初始化

B．互斥量销毁

C．唤醒阻塞线程

D．以上皆错

试题 31 [单选题] 在下面问题中，SIMD并行最不适合（)。

A．向量加法

B．向量中元素排序

C．矩阵向量乘法

D．矩阵加法

试题 32 [单选题] 一个SSE寄存器可容纳（)个双精度浮点数。

A．2

B．4

C．8

D．16

试题 33 [单选题] 关于消息传递编程的特点,以下说法正确的是（）

A．与共享内存一样有竞争条件

B．编程简单

C．需程序员考虑局部性

D．无需考虑进程间通信

试题 34 [单选题] 当前并行软件面临的主要挑战不包括（)。

A．能耗

B．伸缩性

C．研发周期

D．可靠性

试题 35 [单选题] OpenMP编译指示是以（)开头的。

A．#include

B．#ifdef

C．#pragam

D．#else

试题 36 [单选题] 对这样的循环for （i=0; i＜100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是（）

A．循环划分

B．循环消除

C．循环展开

D．以上皆错

试题 37 [单选题] 创建线程时,我们通过（）将线程号分别传递给每个线程。

A．全局变量

B．局部变量

C．动态分配变量

D．pthread_create的“线程函数参数”参数

试题 38 [单选题] 对单精度浮点计算，AVX最高实现（)路并行。

A．2

B．4

C．8

D．16

试题 39 [单选题] R*=1.3; G+=1.8; B+=1.2; X*=1.1，此程序片段可进行SIMD并行化吗？（)

A．不可以

B．可以

C．不确定

D．以上皆错

试题 40 [单选题] AVX是（)平台的SIMD架构。

A．x86

B．POWER

C．SPARC

D．ARM

试题 41 [单选题] 将起泡排序程序改写为奇偶转置排序，关于其两层循环是否存在数据依赖，下面说法正确的是（)。

A．外层存在，内层不存在

B．外层不存在，内层存在

C．两层都不存在

D．两层都存在

试题 42 [单选题] float a[64]; for（i=0; i＜60; i+=4) Va=a[i+2∶i+5]; 系统向量化访存是按16字节对齐的，则此向量化程序每个循环步产生（)个内存访问操作。

A．1

B．2

C．3

D．4

试题 43 [单选题] 利用cacheline一次读取多个数据字的机制优化程序访存性能，其机理是（)。

A．降低了访存延迟

B．隐藏了访存延迟

C．利用了cache空间局部性

D．利用了cache时间局部性

试题 44 [单选题] SSE intrinsics_mm_loadu_ps命令的功能是（)。

A．对齐向量读取单精度浮点数

B．未对齐向量读取单精度浮点数

C．对齐向量读取双精度浮点数

D．未对齐向量读取双精度浮点数

试题 45 [主观题] SSE数据移动指令分类不包括____。

A、对齐传输
B、未对齐传输
C、标量传输
D、缓存传输

试题 46 [单选题] SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4（均为由低到高)，则执行C=blend（A，B，0x05)后，C中元素为（)。

A．A1 A2 B3 B4

B．B1 B2 A3 A4

C．A1 B2 A3 B4

D．B1 A2 B3 A4

试题 47 [单选题] 在超市的顾客购买商品记录中统计一些商品组合的购买频率，将购买频率（商品组合)划分给不同进程，这是一种划分（)的数据并行策略。

A．输入数据

B．中间结果

C．输出数据

D．临时数据

试题 48 [单选题] Pthread不支持（)。

A．创建并发执行线程

B．同步

C．非显式通信

D．自动并行化

试题 49 [单选题] 将t个线程的局部结果汇总，可采用递归分解并行进行，即，两两汇总，中间结果继续两两汇总，直到剩下唯一的最终结果，其时间复杂度为（)。

A．θ(1)

B．θ(logt)

C．θ(t)

D．θ(tlogt)

试题 50 [单选题] 以下（）是MPI基本原语。

A．MPI_barrier

B．MPI_Comm_numprocs

C．MPI_Comm_rank

D．MPI_Comm_Send

账号：尚未登录

登录没有账号？去注册