南开大学22春《并行程序设计》综合作业一答案参考43

上传人:壹****1 文档编号:490153338 上传时间:2023-05-21 格式:DOCX 页数:14 大小:14.98KB
返回 下载 相关 举报
南开大学22春《并行程序设计》综合作业一答案参考43_第1页
第1页 / 共14页
南开大学22春《并行程序设计》综合作业一答案参考43_第2页
第2页 / 共14页
南开大学22春《并行程序设计》综合作业一答案参考43_第3页
第3页 / 共14页
南开大学22春《并行程序设计》综合作业一答案参考43_第4页
第4页 / 共14页
南开大学22春《并行程序设计》综合作业一答案参考43_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学22春《并行程序设计》综合作业一答案参考43》由会员分享,可在线阅读,更多相关《南开大学22春《并行程序设计》综合作业一答案参考43(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春并行程序设计综合作业一答案参考1. OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C2. 当问题规模不变时,随着处理器数量增大,加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案:D3. 当处理器数量不变时,随着问题规模增大,加速比_。当处理器数量不变时,随着问题规模增大,加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案:C4. SSE intrinsics_mm_load_ss命令的功能是( )。A.对齐向量读取单精度浮点数B.

2、未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数参考答案:C5. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案:C6. 在MPI中从/向虚拟进程收/发消息的实际效果是_。在MPI中从/向虚拟进程收/发消息的实际效果是_。A.与通信域根进程通信B.与0号进程通信C.像什么都没发生一样D.以上皆错参考答案:C7. 当条件判断_时,控制流语句SIMD并行化可能达到较好效果。A.绝大部分结果为真B.绝大部分结果为假C.全部结果都一样D.绝大部分结果

3、都一样参考答案:D8. 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是_。对一个串行程序进行SIMD并行化,应重点考虑的程序部分是_。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案:C9. 伸缩性的含义不包括_。伸缩性的含义不包括_。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案:A10. 采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。A.CPU内存B.GPU显存C.GPU共享内存D.GPU寄存器参考

4、答案:C11. 对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是( )。A.在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可B.线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果C.太多本地运算,不能体现并行效果,不是好的模式D.主线程汇总结果在性能上必然不如多线程并行汇总结果参考答案:B12. OpenMP循环并行指令是( )。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C13. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对

5、于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B14. 新一代GPU重点提供的新特性不包括( )。A.新型高速显存B.GPU间直接高速互联C.自动并行化D.人工智能计算专门优化参考答案:C15. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案:D16. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案:C17. 在共享内存架构编程中,线程间不能通过_进行通信A.全

6、局变量B.局部变量C.静态变量D.全局堆中变量参考答案:B18. SSE指令移动单精度浮点数,不能实现_。SSE指令移动单精度浮点数,不能实现_。A.将64位数据移动到SSE寄存器高位B.将64位数据移动到SSE寄存器低位C.将32位数据移动到SSE寄存器指定位置D.在两个SSE寄存器高/低64位间移动参考答案:C19. n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。A.负载

7、不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件,导致结果错误参考答案:D20. 当前并行软件面临的主要挑战不包括( )。A.能耗B.伸缩性C.研发周期D.可靠性参考答案:C21. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案:A22. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A23. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案:C24. CUDA共享内存是由_共享。A

8、.Grid中所有线程B.一个Block中所有线程C.一个Warp中所有线程D.GPU中所有线程参考答案:B25. 一个Neon寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:A26. 在对互斥量进行解锁时,还会执行( )操作。A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案:C27. MPI的通信是( )。A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案:C28. _执行pthread_sem_wait操作,线程进入阻塞状态。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案:B29. 对矩阵乘法串行程

9、序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案:D30. 关于OpenMP循环并行程序的编写,下列说法中正确的是_。A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度策略代码D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么参考答案:D31. SSE是_平台的SIMD架构。A.x86B.

10、POWERC.SPARCD.ARM参考答案:A32. 华尔街是世界上超级计算机最密集的区域之一,原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案:D33. SSE intrinsics_mm_store_ps命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案:A34. 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序_。A.必然主线程前、从线程后B.必然从线

11、程前、主线程后C.必然相互交织D.各种顺序皆有可能参考答案:D35. OpenMP是_的一个常见替代。OpenMP是_的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C36. MPI基本原语不包括_。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init参考答案:A37. 对这样的循环for(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案:C38. 在使用条件变量之后必须对其进行_。在使用条件变量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:D39. 我国最近一次夺得全球超级计

12、算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D40. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D41. OpenMP是_架构下的一种编程工具。OpenMP是_架构下的一种编程工具。A.SIMDB.MISDC.共享内存D.分布式内存参考答案:C42. 互斥量mutex机制,在任何时刻_进入它保护的区域。A.允许任意数量任意类型的线程B.允许一个读线

13、程任意个写线程C.允许一个写线程任意个读线程D.只允许一个线程参考答案:D43. 编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:B44. 一个AVX寄存器最多存放( )个整型数。A.2B.4C.8D.16参考答案:C45. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A46. 以下( )是MPI基本原语。A.MPI_barrierB.MPI_Comm_numprocsC.MPI_Comm_rankD.MPI_Comm_Send参考答案:C47. pthread_join的作用是( )。A.强制终止指定线程

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号