南开大学22春《并行程序设计》离线作业一及答案参考60

资源描述

《南开大学22春《并行程序设计》离线作业一及答案参考60》由会员分享，可在线阅读，更多相关《南开大学22春《并行程序设计》离线作业一及答案参考60（15页珍藏版）》请在金锄头文库上搜索。

1、南开大学22春并行程序设计离线作业一及答案参考1. OpenMP中多线程间是一种( )关系。A.主从B.分组C.对等D.竞争参考答案：A2. 采用MPI主从模型解决矩阵每行排序问题，主进程不断向每个从进程发送任务、接收结果，则它从从进程接收结果时，以下哪种方式更好?( )A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG参考答案：D3. 对矩阵每行排序的程序进行多线程并行化，对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡

2、D.随机划分才能实现负载均衡参考答案：C4. 造成超线性加速比的你原因包括_。造成超线性加速比的你原因包括_。A.进程间大量通信B.并行算法导致额外计算C.并行计算工作量显著小于串行计算D.问题求解包含不可并行化部分参考答案：C5. 使用一个信号量实现“主线程等待4个从线程完成任务”，信号量初始值应设置为( )。A.0B.1C.2D.4参考答案：A6. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数，后者通过特定APID.

3、前者通过特定API，后者创建线程时传递参数参考答案：D7. OpenMP编译指示是以( )开头的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”参考答案：C8. 对单精度浮点计算，AVX最高实现( )路并行。A.2B.4C.8D.16参考答案：C9. 在下列应用中，SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D10. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的( )操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案：D11. for

4、(i=0;iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案：D12. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案：D13. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该

5、循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。A.正确的B.错误的参考答案：B14. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案：C15. 对一个串行程序进行SIMD并行化，应重点考虑的程序部分是( )。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案：C16. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。A.更有利

6、于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B17. n个元素排序问题，如果只能通过元素比较交换构造算法，则n个处理器的并行排序算法达到( )的运行时间才是代价最优的。A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案：A18. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp reduce参考答案：C19. 在使用互斥量之后必须对其进行( )。A.初始化B.加锁C.

7、解锁D.销毁参考答案：D20. MPI的通信是( )。A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案：C21. 当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。A.多核和众核技术B.突破物理局限C.改善散热D.采用新材料参考答案：A22. 两个矩阵相乘，将矩阵划分为固定大小的子矩阵，变元素运算为子矩阵运算，是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案：A23. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于

8、每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B24. 我国最早夺得全球超级计算机计算能力冠军的是( )。A.天河1号B.天河1AC.天河2号D.神威.太湖之光参考答案：B25. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案：A26. 执行pthread_rwlock_rdlock时，( )的情况下加锁成功。A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案：C27. SIMD并行化时遇到对齐问题，高效的处理方法是( )。A.直接使用

9、SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界，然后进行SIMD对齐访存参考答案：D28. OpenMP归约指令采用的是一种_算法。A.分治B.贪心C.动态规划D.排序参考答案：A29. 采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在_。采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在_。A.CPU内存B.GPU显存C.GPU共享内存D.GPU寄存器参考答案：C30. 记并行时间为T，串行时间为T&39;，处理器数量为p，并行效率E的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行效率E的定义是_

10、。A.T-TB.T/TC.T/pTD.pT-T参考答案：C31. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B32. 大型医院每天的X光片、CT等医学图像的分析需要_。大型医院每天的X光片、CT等医学图像的分析需要_。A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案：B33. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展

11、已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案：B34. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案：B35. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高)，则执行C=shuffle(A, A, 0x1B)后，C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高)，则执行C=shuffle(A, A, 0x1B)后，C中元素为( )A.A1 A2 A3 A4B.A2

12、 A1 A4 A3C.A3 A4 A1 A2D.A4 A3 A2 A1参考答案：D36. 下面哪种架构最适合数据并行?( )A.SISDB.SIMDC.MISDD.MIMD参考答案：B37. 超级计算机制造越来越关注的一个新的指标是_。超级计算机制造越来越关注的一个新的指标是_。A.计算能力B.存储能力C.占地面积D.功耗参考答案：D38. CPU时钟频率1GHz，每个时钟周期两个计算单元可执行4条指令，内存延迟125ns，进行向量点积运算，无cache情况下，计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案：A39. OpenMP中指定多线

13、程中只有主线程执行代码块的指令是_。A.omp singleB.omp masterC.omp slaveD.omp parallel参考答案：B40. SSE intrinsics_mm_store_ps命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案：A41. 新一代GPU重点提供的新特性不包括( )。A.新型高速显存B.GPU间直接高速互联C.自动并行化D.人工智能计算专门优化参考答案：C42. 记并行时间为T，串行时间为T&39;，处理器数量为p，则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案：D43. MMX有( )个专用寄存器。A.4B.8C.16D.32参考答案：B44. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案：A45. 一个AVX寄存器最多存放_个双精度浮点数。一个AVX寄存器最多存放_

展开阅读全文