南开大学21春《并行程序设计》离线作业2参考答案76

资源描述

《南开大学21春《并行程序设计》离线作业2参考答案76》由会员分享，可在线阅读，更多相关《南开大学21春《并行程序设计》离线作业2参考答案76（12页珍藏版）》请在金锄头文库上搜索。

1、南开大学21春并行程序设计离线作业2参考答案1. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案：B2. _执行pthread_sem_post操作，当前线程会唤醒阻塞线程。_执行pthread_sem_post操作，当前线程会唤醒阻塞线程。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案：B3. 对于加速比S和处理器数量p，下列说法正确的是_。A.有可能SpB.必然SpC.不可能S=pD.两者无关联参考答案：A4. OpenMP编译指示中说明私有变量是用_子句。OpenMP编

2、译指示中说明私有变量是用_子句。A.privateB.sharedC.scheduleD.nowait参考答案：A5. 在分布式内存架构编程中，进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案：D6. OpenMP主要是通过( )来更高层抽象的多线程编程。A.设计实现新的语言B.为现有语言提供大量库函数C.为现有语言扩展编译指示D.新编译器实现自动并行化参考答案：C7. 当问题规模不变时，随着处理器数量增大，效率降低的性质对_成立。A.部分并行算法B.代价最优并行算法C.所有并行算法D.以上皆错参考答案：C8. 对矩阵乘法串行程序主体三重循环的最内层

3、循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案：D9. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案：B10. 在下列应用中，SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D11. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一

4、个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案：A12. 1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )A.1B.2C.不确定D.以上皆错参考答案：B13. SSE的shuffle指令的8位二进制整数参数被划分为4个

5、2位二进制整数imm803，若imm81=j则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置1B.将第二个源寄存器的第j个元素放在目标寄存器位置1C.将第一个源寄存器的第1个元素放在目标寄存器位置1D.将第二个源寄存器的第1个元素放在目标寄存器位置1参考答案：A14. n个元素排序问题，如果只能通过元素比较交换构造算法，则n个处理器的并行排序算法达到( )的运行时间才是代价最优的。A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案：A15. OpenMP并行模型是一种_模式。OpenMP并行模型是一种_模式。A.SISDB.SIMDC.MISDD.SPMD

6、参考答案：D16. 记并行时间为T，串行时间为T&39;，处理器数量为p，效率为E，则代价最优的定义是( )。A.pT=TB.E=(1)C.E=pT/TD.E=T/pT参考答案：B17. 两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案：B18. 任务依赖图中顶点权重之和表示_。任务依赖图中顶点权重之和表示_。

7、A.任务数B.任务难度C.串行执行时间D.并行执行时间参考答案：C19. _执行pthread_sem_wait操作，线程进入阻塞状态。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案：B20. 编译器编译OpenMP并行循环时，会自动生成一些代码，其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案：C21. R*=1.3; G+=1.8; B+=1.2; X*=1.1，此程序片段可进行SIMD并行化吗?( )A.不可以B.可以C.不确定D.以上皆错参考答案：A22. 当处理器数量不变时，随

8、着问题规模增大，加速比_。当处理器数量不变时，随着问题规模增大，加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案：C23. float a64; for(i=0; iA.8B.16C.32D.64参考答案：B24. 在使用互斥量之后必须对其进行_。在使用互斥量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：D25. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案：B26. 下列哪门课程不是并行程序设计的先导课?下列哪门课

9、程不是并行程序设计的先导课?A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案：D27. 对矩阵每行排序的程序进行多线程并行化，对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案：C28. 当问题规模不变时，随着处理器数量增大，加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案：D29. 对于效率E，下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案：B30. MPI不包括的通信类别是_。MPI不包括的通

10、信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案：D31. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案：A32. 全球500强超算在操作系统上越来越体现出_一家独大的趋势。A.UnixB.WindowsC.LinuxD.ios参考答案：C33. 使用一个信号量实现“主线程等待4个从线程完成任务”，信号量初始值应设置为( )。A.0B.1C.2D.4参考答案：A34. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_

11、。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数，后者通过特定APID.前者通过特定API，后者创建线程时传递参数参考答案：D35. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案：D36. 对划分输入数据的策略，下面说法错误的是_。对划分输入数据的策略，下面说法错误的是_。A.当输出数据很少时，需划分输入数据B.当输出数据存在依赖时，需划分输入数据C.通常最后需要汇总结果D.由于不是直接划分输出数据，性能会很差参考答案：D37. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA

12、参考答案：C38. MPI原址收发各一条消息的API是_。A.MPI_SendrecvB.MPI_SendC.MPI_RecvD.MPI_Sendrecv_Replace参考答案：D39. 矩阵每行排序的问题更适合使用MPI的_编程模型。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：D40. 静态线程编程模式的缺点是_。静态线程编程模式的缺点是_。A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高参考答案：B41. 在共享内存架构编程中，线程间不能通过_进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量参考答案：B42. 为缓解存储和CPU之间的性能差距，

13、常见的技术手段不包括_。A.利用cache降低访存延迟B.利用多线程隐藏访存延迟C.利用预取隐藏访存延迟D.采用大容量内存提高访问速度参考答案：D43. MPI默认点对点通信模式是( )。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：A44. 互斥量mutex机制，在任何时刻_进入它保护的区域。A.允许任意数量任意类型的线程B.允许一个读线程任意个写线程C.允许一个写线程任意个读线程D.只允许一个线程参考答案：D45. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案：A46. 当前并行软件面临的主要挑战不包括( )。A.能耗B.伸缩性C.研发周期D.可靠性参考答案：C47. SSE intrinsics_mm_store_ps命令的功能是(

展开阅读全文