南开大学21秋《并行程序设计》在线作业三答案参考37

上传人:汽*** 文档编号:470546429 上传时间:2022-08-20 格式:DOCX 页数:15 大小:14.98KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》在线作业三答案参考37_第1页
第1页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考37_第2页
第2页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考37_第3页
第3页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考37_第4页
第4页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考37_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》在线作业三答案参考37》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》在线作业三答案参考37(15页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计在线作业三答案参考1. 两个n*n的矩阵相乘,将所有n2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分_的数据并行。两个n*n的矩阵相乘,将所有n2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分_的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:B2. 为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.#include B.#pragma omp parallelC.#ifdef _OPENMPD.#define _O

2、PENMP参考答案:C3. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案:C4. 除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A5. 任务依赖图中顶点权重之和表示( )。A.任务数B.任务难度C.串行执行时间D.并行执行时间参考答案:C6. float a64; for(i=0; iA.1B.2C.3D.4参考答案:B7. 我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D8.

3、 CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A9. 每个MMX寄存器宽度为_位。每个MMX寄存器宽度为_位。A.32B.64C.128D.256参考答案:B10. 编写n个数求和的OpenMP程序,最高效的方法是( )。A.多线程直接并发累加到共享变量B.将累加操作设置为临界区C.在累加操作前设置障碍D.采用归约指令参考答案:D11. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了

4、结果矩阵的一个元素,这种说法是_。A.正确的B.错误的参考答案:B12. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cancelC.pthread_testcancelD.pthread_exit参考答案:C13. 一个SSE寄存器可容纳( )个双精度浮点数。A.2B.4C.8D.16参考答案:A14. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C15. 对于效率E,下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.

5、可能随着处理器数量增大趋向于0参考答案:B16. SIMD并行模式是将多个_运算打包并发执行。A.不同B.相同C.混合D.依赖参考答案:B17. n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到( )的运行时间才是代价最优的。A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案:A18. 使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为( )。A.0B.1C.2D.4参考答案:A19. 对于加速比S和处理器数量p,下列说法正确的是_。A.有可能SpB.必然SpC.不可能S=pD.两者无关联参考答案:A20. 并行计算

6、还主要用于国防、工程研究等领域,这种说法是_。A.正确的B.错误的参考答案:B21. 采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。A.CPU内存B.GPU显存C.GPU共享内存D.GPU寄存器参考答案:C22. 传统科学和工程实验相对于计算机并行仿真的劣势不包括_。传统科学和工程实验相对于计算机并行仿真的劣势不包括_。A.成本太高B.结果不准确C.时间太长D.太危险参考答案:B23. SSE intrinsics_mm_store_ps命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度

7、浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案:A24. 在下面问题中,SIMD并行更适合( )。A.搜索B.排序C.矩阵乘法D.构建二叉排序树参考答案:C25. OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C26. 关于MPI是什么,以下说法错误的是_。关于MPI是什么,以下说法错误的是_。A.一种消息传递编程模型标准B.一种共享内存编程模型标准C.编程角度看是C+/Fortran等的库D.基于SPMD模型参考答案:B27. 对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下

8、面说法正确的是( )。A.在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可B.线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果C.太多本地运算,不能体现并行效果,不是好的模式D.主线程汇总结果在性能上必然不如多线程并行汇总结果参考答案:B28. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案:B29. 关于障碍机制,下面说法错误的是_。关于障碍机制,下面说法错误的是_。A.会导致快速线程阻塞,不应使用B.在需要强制线程步调一致时,应使用C.可用互斥量机制实现D.属于一种组通信参考答案:A30. 一个AVX寄存

9、器最多存放( )个整型数。A.2B.4C.8D.16参考答案:C31. 关于并行代价,下面描述正确的是_。关于并行代价,下面描述正确的是_。A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案:D32. 编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:C33. 并行计算的新兴应用领域不包括_。A.制药B.数字媒体C.国防D.游戏参考答案:C34. SSE intrinsics _mm_h

10、add_ps命令的功能是_。SSE intrinsics _mm_hadd_ps命令的功能是_。A.寄存器间单精度浮点数向量加法B.寄存器间双精度浮点数向量加法C.寄存器内单精度浮点数加法D.寄存器内双精度浮点数加法参考答案:C35. 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案:A36. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行效率E的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行效率E的定义是_。A.T-TB.T/TC.T

11、/pTD.pT-T参考答案:C37. MMX有_个专用寄存器。MMX有_个专用寄存器。A.4B.8C.16D.32参考答案:B38. SSE是_平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案:A39. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案:D40. 在使用互斥量之后必须对其进行_。在使用互斥量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:D41. 两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是( )。A.先将两个矩阵读入cache再进行乘法B.先转置第一

12、个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案:C42. for(i=0; ifor(i=0; iA.存在B.不存在C.不确定D.以上皆错参考答案:A43. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )A.A1 A2 A3 A4B.A2 A1 A4 A3C.A3 A4 A1 A2D.A4 A3 A2 A1参考答案:D44. 当前并行软件面临的主要挑战不包括( )

13、。A.能耗B.伸缩性C.研发周期D.可靠性参考答案:C45. OpenMP中指定单线程执行的指令是( )。A.omp atomicB.omp onlyC.omp staticD.omp single参考答案:D46. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C47. n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件,导致结果错误参考答案:D

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号