首页 > 计算机科学与技术> 并行程序设计

网友您好，请在下方输入框内输入要搜索的题目：

请输入或粘贴题目内容搜题

搜题

拍照、语音搜题，请扫码下载APP

题目内容（请给出正确答案）

[单选题]

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的（）操作才能得到结果矩阵的一个元素。

A.排列

B.交换

C.广播

D.归约

答案

查看答案

发布时间：2022-12-03

更多“对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的（）操作才能得到结果矩阵的一个元素。”相关的问题

第1题

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是____。

A.正确的

B.错误的

点击查看答案

第2题

编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行（）路循环展开。

A.2

B.4

C.8

D.16

点击查看答案

第3题

采用划分子矩阵方法实现矩阵乘法，在进行SSE并行化时，是对(由外至内数)第____层循环进行循环展开然后向量化。

A.3

B.4

C.5

D.6

点击查看答案

第4题

对一个串行程序进行SIMD并行化，应重点考虑的程序部分是____。

A.声明语句

B.条件分支语句

C.循环语句

D.输入输出语句

点击查看答案

第5题

采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在____。

A.CPU内存

B.GPU显存

C.GPU共享内存

D.GPU寄存器

点击查看答案

第6题

采用划分子矩阵技术优化矩阵乘法CUDA程序，子矩阵数组变量声明应加（)前缀。

A._global_

B._device_

C._shared_

D._private_

点击查看答案

第7题

n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。

A、负载不均

B、通信开销大

C、CPU空闲等待严重

D、sum累加产生竞争条件，导致结果错误

点击查看答案

第8题

两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。

A、先将两个矩阵读入cache再进行乘法

B、先转置第一个矩阵再进行乘法

C、先转置第二个矩阵再进行乘法

D、以上皆错

点击查看答案

第9题

对奇偶转置排序进行OpenMP并行化，第一种策略是直接对内层循环使用ompparallelfor指令，第二种策略是对外层循环使用ompparallel指令，对内层循环使用ompfor指令，后者相对于前者的优点是()。

A.保持了数据依赖

B.消除了大量线程创建、销毁开销

C.有利于负载均衡

D.减少了线程间交互

点击查看答案

第10题

单精度浮点数矩阵乘法进行AVX并行，期望的加速比为（)。

A.等于8

B.小于8

C.4到8之间

D.等于4

点击查看答案

账号：尚未登录

登录没有账号？去注册

购买搜题卡

公需课题库全部 >

福师大2021年8月课程考试《运动生理学》作业考核(期末A卷)四川农业大学20年12月《建筑测量(专科)》作业考核-答案电子科技大学《大学英语2(本科)》20秋在线作业2答卷 20秋东北大学《计算机辅助数控编程》在线平时作业2【满分答案】21春北交《列车牵引与制动》在线作业二参考答案 20秋学期东北大学《金属学与热处理基础》在线平时作业2【满分答案】北京中医药大学20秋《中医诊断学Z》平时作业6答案北京语言大学《社会保障概论》20秋作业2答案吉大《人体解剖学》21春在线作业二-0004参考答案兰州大学20春《计算机网络》平时作业2答案

考试指南全部 >

安全评价师证书报考条件要求高吗全国旅游监管服务平台：导游证出成绩 2023年导游证考试多选题的得分情况重庆导游证报考时间2024 广西23年安全评价师的报考流程 24年导游证成绩有效期：1年 2023年山西导游证考试准考证考试时间 2024年导游证报名审核要多久江西一级安全评价师报考条件2023年 23年导游证成绩查询时间内蒙古2024年3月11日9:00起查分入口已开通

下载APP

关注公众号

TOP