南开大学21春《并行程序设计》离线作业1辅导答案99

上传人:公**** 文档编号:497368537 上传时间:2023-07-30 格式:DOCX 页数:12 大小:14.08KB
返回 下载 相关 举报
南开大学21春《并行程序设计》离线作业1辅导答案99_第1页
第1页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案99_第2页
第2页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案99_第3页
第3页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案99_第4页
第4页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案99_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》离线作业1辅导答案99》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》离线作业1辅导答案99(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计离线作业1辅导答案1. 下面哪种架构最适合数据并行?( )A.SISDB.SIMDC.MISDD.MIMD参考答案:B2. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C3. 一个AVX寄存器最多存放_个单精度浮点数。一个AVX寄存器最多存放_个单精度浮点数。A.2B.4C.8D.16参考答案:C4. 我国最近一次夺得全球超级计算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D5. 采用划分子矩阵(大小b*b)的方法实现n*n矩阵

2、乘法,一次乘加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生次访存。A.nB.tC.n-tD.n/t参考答案:D6. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案:D7. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。采用划分子矩阵技术优化矩阵乘法CUD

3、A程序,子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案:C8. OpenMP归约指令采用的是一种_算法。A.分治B.贪心C.动态规划D.排序参考答案:A9. 对矩阵乘法进行多线程并行化,对矩阵采用_。对矩阵乘法进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:A10. 关于OpenMP循环并行程序的编写,下列说法中正确的是_。A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度

4、策略代码D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么参考答案:D11. for(i=0; ifor(i=0; iA.存在B.不存在C.不确定D.以上皆错参考答案:A12. 在使用互斥量之后必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:D13. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C14. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B15. 四位助教帮助教授批改

5、300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。A.数据并行B.任务并行C.搜索并行D.预测并行参考答案:B16. SSE的blend指令的8位二进制整数参数被用做8个掩码imm807,若imm8j=0则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置0B.将第二个源寄存器的第j个元素放在目标寄存器位置0C.将第一个源寄存器的第j个元素放在目标寄存器位置jD.将第二个源寄存器的第j个元素放在目标寄存器位置j参考答案:C17. 在共享内

6、存架构编程中,线程间不能通过_进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量参考答案:B18. 伸缩性的含义不包括_。伸缩性的含义不包括_。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案:A19. MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D20. 在下面问题中,SIMD并行最不适合( )。A.向量加法B.向量中元素排序C.矩阵向量乘法D.矩阵加法参考答案:B21. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展

7、的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B22. n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法( )。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案:A23. 将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是( )。A.外层存在,内层不存在B.外层不存在,内层存在C.两层都不存在D.两层都存在参考答案:A24. OpenMP不能实现的是( )。A.负责创建和管理线程B.隐藏栈管理C.提供同步机制D.自动

8、并行化参考答案:D25. 对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案:C26. OpenMP编译指示中说明私有变量是用_子句。OpenMP编译指示中说明私有变量是用_子句。A.privateB.sharedC.scheduleD.nowait参考答案:A27. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案:B28. 在下面问题中,SIMD并行更适合( )。A.搜索B.排

9、序C.矩阵乘法D.构建二叉排序树参考答案:C29. CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案:A30. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B31. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_

10、joinB.pthread_cancelC.pthread_testcancelD.pthread_exit参考答案:C32. 为利用cache空间局部性,需满足_。为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D33. 现代CPU中都具有指令乱序执行功能,其目的不包括_。现代CPU中都具有指令乱序执行功能,其目的不包括_。A.消除指令依赖,更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答案:C34. 为了充分利用CPU内的多条流水线,程序应满足_。

11、为了充分利用CPU内的多条流水线,程序应满足_。A.相邻指令无依赖性B.相邻指令相互依赖C.整段程序中指令无依赖性D.整段程序中指令相互依赖参考答案:A35. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_。A.等于8B.小于8C.4到8之间D.等于4参考答案:B36. SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm803,若imm81=j则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置1B.将第二个源寄存器的第j个元素放在目标寄存器位置1C.将第一个源寄存器的第1个元素放在目标寄存器位置1D.将第二个源寄存器的第1个元素放在目标寄存器位置

12、1参考答案:A37. MMX有_个专用寄存器。MMX有_个专用寄存器。A.4B.8C.16D.32参考答案:B38. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D39. 除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A40. 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序_。A.必然主线程前、从线程后B.必然从线程前、主线程后C.必然相互交织D.各种顺序皆有可能

13、参考答案:D41. pthread_join的作用是( )。A.强制终止指定线程B.检测指定线程是否结束C.等待指定线程结束才返回D.向指定线程发送数据参考答案:C42. n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到( )的运行时间才是代价最优的。A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案:A43. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D44. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A45. 当处理器数量不变时,随着问题规模增大,加速比_。当处理器数量不变时,随着问题规模增大,加速比_。A.所有算法都

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号