南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54

上传人:鲁** 文档编号:490033926 上传时间:2023-09-13 格式:DOCX 页数:12 大小:13.58KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54_第1页
第1页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54_第2页
第2页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54_第3页
第3页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54_第4页
第4页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷54(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计复习考核试题库答案参考1. float a64; for(i=0; iA.1B.2C.3D.4参考答案:B2. Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?( )A.SISDB.SIMDC.MISDD.MIMD参考答案:C3. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案:D4. 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )。A.读取x存在数据依赖,不能并发进行B.累加顺序被改变,结果是错误的C.加法操作是简单运算,无需同

2、步D.加法操作不是原子操作,需要同步保证数据依赖参考答案:D5. 对单精度浮点计算,SSE最高实现_路并行。对单精度浮点计算,SSE最高实现_路并行。A.2B.4C.8D.16参考答案:B6. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行效率E的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行效率E的定义是_。A.T-TB.T/TC.T/pTD.pT-T参考答案:C7. 现代CPU中都具有指令乱序执行功能,其目的不包括_。现代CPU中都具有指令乱序执行功能,其目的不包括_。A.消除指令依赖,更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答

3、案:C8. 一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案:B9. OpenMP中指定单线程执行的指令是( )。A.omp atomicB.omp onlyC.omp staticD.omp single参考答案:D10. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:B11. 下列哪门课程不是并行程序设计的先导课?下列哪门课程不是并行程序设计的先导课?A.计算机概论B

4、.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D12. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp reduce参考答案:C13. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案:B14. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A15. SSE intrinsics_mm_store_

5、sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C16. for (i=2; iA.存在B.不存在C.不确定D.以上皆错参考答案:A17. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_。A.等于8B.小于8C.4到8之间D.等于4参考答案:B18. 当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。A.多核和众核技术B.突破物理局限C.改善散热D.采用新材料参考答案:A19. 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是(

6、)。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案:C20. 对矩阵乘法进行多线程并行化,对矩阵采用_。对矩阵乘法进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:A21. 循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案:B22. 创建线程时,我们通过( )将线程号分别传递给每个线程。A.全局变量B.局部变量

7、C.动态分配变量D.pthread_create的“线程函数参数”参数参考答案:D23. 对矩阵每行排序的程序进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:C24. 一个SSE寄存器可容纳_个短整型数。一个SSE寄存器可容纳_个短整型数。A.2B.4C.8D.16参考答案:C25. float a64; for(i=0; iA.8B.16C.32D.64参考答案:B26. MPI_Send和MPI_recv是通过( )区分消息。A.端口号B.消息名C.消息标签D.消息哈希参考答案:

8、C27. SSE intrinsics _mm_store_ss命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案:C28. 在MPI中从/向虚拟进程收/发消息的实际效果是_。在MPI中从/向虚拟进程收/发消息的实际效果是_。A.与通信域根进程通信B.与0号进程通信C.像什么都没发生一样D.以上皆错参考答案:C29. OpenMP中指定多线程中只有主线程执行代码块的指令是_。A.omp singleB.omp masterC.omp slaveD.omp parallel参考答案:B30. OpenMP中多线程间

9、是一种( )关系。A.主从B.分组C.对等D.竞争参考答案:A31. 任务依赖图的平均并发度的定义是( )。A.顶点权重之和B.顶点数C.各层平均顶点数D.顶点权重之和/关键路径长度参考答案:D32. OpenMP归约指令采用的是一种_算法。A.分治B.贪心C.动态规划D.排序参考答案:A33. 执行pthread_rwlock_rdlock时,( )的情况下加锁成功。A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案:C34. CUDA共享内存是由_共享。A.Grid中所有线程B.一个Block中所有线程C.一个Warp中所有线程D

10、.GPU中所有线程参考答案:B35. 对这样的循环for(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案:C36. 用pthread_barrier_init初始化障碍,应提供的参数不包括_。A.障碍对象B.障碍初值C.障碍属性D.参与的线程数参考答案:B37. 采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好?( )A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG参考答案:D38.

11、 OpenMP主要是通过( )来更高层抽象的多线程编程。A.设计实现新的语言B.为现有语言提供大量库函数C.为现有语言扩展编译指示D.新编译器实现自动并行化参考答案:C39. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案:D40. 伸缩性的含义不包括( )。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案:A41. 两个n*n的矩阵相乘,将所有n2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一

12、种划分的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:B42. SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A,B,0x05)后,C中元素为( )。A.A1 A2 B3 B4B.B1 B2 A3 A4C.A1 B2 A3 B4D.B1 A2 B3 A4参考答案:D43. 以下超级计算机中,_是SIMD架构。以下超级计算机中,_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案:A44. MMX有( )个专用寄存器。A.4B.8C.16D.32参考答案:B45. 一个AVX

13、寄存器最多存放_个双精度浮点数。一个AVX寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:B46. 在下面问题中,SIMD并行最不适合( )。A.向量加法B.向量中元素排序C.矩阵向量乘法D.矩阵加法参考答案:B47. 为利用cache空间局部性,需满足_。为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D48. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案:B49. 造成超线性加速比的你原因包括_。造成超线性加速比的你原因包括_。A.进程间大量通信B.并行算法导致额外计算

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号