南开大学21秋《并行程序设计》平时作业二参考答案22

资源描述

《南开大学21秋《并行程序设计》平时作业二参考答案22》由会员分享，可在线阅读，更多相关《南开大学21秋《并行程序设计》平时作业二参考答案22（14页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计平时作业二参考答案1. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案：A2. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数，后者通过特定APID.前者通过特定API，后者创建线程时传递参数参考答案：D3. 一个程序用pthread_create创建了4个线程，此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案：B4. 对这样的循环f

2、or(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案：C5. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案：A6. 对矩阵每行排序的程序进行多线程并行化，对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案：C7. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案：A8. 在128位的

3、SIMD寄存器中，我们不能保存( )。A.16个8位整数B.8个16位短整型C.4个32位整型D.16个字符的字符串参考答案：D9. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。A.正确的B.错误的参考答案：B10. 关于消息传递编程的特点，以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案：C11. 关于并行代价，下面描述正确的是_。关于

4、并行代价，下面描述正确的是_。A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案：D12. SSE intrinsics_mm_load_ss命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数参考答案：C13. 每个SSE寄存器宽度为_位。每个SSE寄存器宽度为_位。A.32B.64C.128D.256参考答案：C14. 四位助教帮助教授批改300份试卷，试卷共16道题，每位助教负责批改所有试卷的4道题，这是一种_任务划分方法。四位助教帮助教授批改300份试卷，试卷共16道

5、题，每位助教负责批改所有试卷的4道题，这是一种_任务划分方法。A.数据并行B.任务并行C.搜索并行D.预测并行参考答案：B15. 对于效率E，下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案：B16. 在分布式内存架构编程中，进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案：D17. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案：C18. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变

6、量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D19. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案：D20. OpenMP是_的一个常见替代。OpenMP是_的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案：C21

7、. 对一个串行程序进行SIMD并行化，应重点考虑的程序部分是( )。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案：C22. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案：B23. MPI基本原语不包括_。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init参考答案：A24. n个数求和的问题，使用n个处理器的并行算法达到了logn的运行时间，则算法_。n个数求和的问题，使用n个处理器的并行算法达到了logn的运行时间，则算法_。A.肯定不是代价

8、最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案：A25. 传统科学和工程实验相对于计算机并行仿真的劣势不包括_。传统科学和工程实验相对于计算机并行仿真的劣势不包括_。A.成本太高B.结果不准确C.时间太长D.太危险参考答案：B26. OpenMP中多线程间是一种( )关系。A.主从B.分组C.对等D.竞争参考答案：A27. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案：D28. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128

9、fC._m128dD._m128i参考答案：C29. 编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B30. MPI默认点对点通信模式是( )。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：A31. 以下超级计算机中，( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案：D32. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量

10、传输D.缓存传输参考答案：D33. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案：C34. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案：C35. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案：B36. 当处理器数量不变时，随着问题规模增大，加速比_。当处理器数量不变时，随着问题规模增大，加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案：C37. 对于并行程序设计

11、，下面说法错误的是_。对于并行程序设计，下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案：D38. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案：A39. OpenMP编译指示是以( )开头的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”参考答案：C40. 在使用互斥量之后必须对其进行_。在使用互斥量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：D41. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有

12、一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp reduce参考答案：C42. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案：D43. 编写矩阵乘法的Neon程序，若矩阵元素为双精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：A44. for (i=0;iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案：D45. 并行计算还主要用于国防、工程研究等领域，这种说法是_。A.正确的B.错误的参

13、考答案：B46. 当前并行软件面临的主要挑战不包括( )。A.能耗B.伸缩性C.研发周期D.可靠性参考答案：C47. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案：C48. SSE intrinsics _mm_hadd_ps命令的功能是_。SSE intrinsics _mm_hadd_ps命令的功能是_。A.寄存器间单精度浮点数向量加法B.寄存器间双精度浮点数向量加法C.寄存器内单精度浮点数加法D.寄存器内双精度浮点数加法参考答案：C49. 采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在_。采用划

展开阅读全文