重要提示:请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
首页 > 计算机科学与技术> 并行程序设计
网友您好,请在下方输入框内输入要搜索的题目:
搜题
拍照、语音搜题,请扫码下载APP
扫一扫 下载APP
题目内容 (请给出正确答案)
[单选题]

对矩阵乘法进行多线程并行化,对矩阵采用()。

A.简单均匀块划分即可保证负载均衡

B.循环划分才能实现负载均衡

C.动态划分才能实现负载均衡

D.随机划分才能实现负载均衡

答案
查看答案
更多“对矩阵乘法进行多线程并行化,对矩阵采用()。”相关的问题

第1题

采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。

A.3

B.4

C.5

D.6

点击查看答案

第2题

下面哪个问题相对而言更不适合进行数据并行()?

A.求和

B.排序

C.向量加法

D.矩阵乘法

点击查看答案

第3题

单精度浮点数矩阵乘法进行AVX并行,期望的加速比为()。

A.等于8

B.小于8

C.4到8之间

D.等于4

点击查看答案

第4题

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的

点击查看答案

第5题

两个n*n的矩阵相乘,将所有n^2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分的数据并行。

A.输入数据

B.中间结果

C.输出数据

D.临时数据

点击查看答案

第6题

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的()操作才能得到结果矩阵的一个元素。

A.排列

B.交换

C.广播

D.归约

点击查看答案

第7题

采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。

A.CPU内存

B.GPU显存

C.GPU共享内存

D.GPU寄存器

点击查看答案

第8题

采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加()前缀。

A._global_

B._device_

C._shared_

D._private_

点击查看答案

第9题

两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。

A、先将两个矩阵读入cache再进行乘法

B、先转置第一个矩阵再进行乘法

C、先转置第二个矩阵再进行乘法

D、以上皆错

点击查看答案

第10题

编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行()路循环展开。

A.2

B.4

C.8

D.16

点击查看答案
下载APP
关注公众号
TOP
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
购买搜题卡查看答案 购买前请仔细阅读《购买须知》
请选择支付方式
  • 微信支付
  • 支付宝支付
点击支付即表示同意并接受了《服务协议》《购买须知》
立即支付 系统将自动为您注册账号
已付款,但不能查看答案,请点这里登录即可>>>
请使用微信扫码支付(元)

订单号:

遇到问题请联系在线客服

请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系在线客服
恭喜您,购买搜题卡成功 系统为您生成的账号密码如下:
重要提示:请勿将账号共享给其他人使用,违者账号将被封禁。
发送账号到微信 保存账号查看答案
怕账号密码记不住?建议关注微信公众号绑定微信,开通微信扫码登录功能
请用微信扫码测试
优题宝