南开大学21秋《并行程序设计》平时作业二参考答案96

资源描述

《南开大学21秋《并行程序设计》平时作业二参考答案96》由会员分享，可在线阅读，更多相关《南开大学21秋《并行程序设计》平时作业二参考答案96（15页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计平时作业二参考答案1. 将t个线程的局部结果汇总，可采用递归分解并行进行，即，两两汇总，中间结果继续两两汇总，直到剩下唯一的最终结果，其时间复杂度为( )。A.(1)B.(logt)C.(t)D.(tlogt)参考答案：B2. OpenMP循环并行指令是( )。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案：C3. 矩阵每行排序的问题更适合使用MPI的_编程模型。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：D4. 1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X

2、0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?A.1)B.2)C.不确定D.以上皆错参考答案：B5. 编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B6. 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics

3、指令是( )。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案：D7. OpenMP是_架构下的一种编程工具。OpenMP是_架构下的一种编程工具。A.SIMDB.MISDC.共享内存D.分布式内存参考答案：C8. SSE intrinsics _mm_store_ss命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案：C9. MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案：D1

4、0. 在使用条件变量之前必须对其进行_。在使用条件变量之前必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：A11. 每个SSE寄存器宽度为_位。每个SSE寄存器宽度为_位。A.32B.64C.128D.256参考答案：C12. 采用划分子矩阵技术优化矩阵乘法CUDA程序，子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案：C13. 华尔街是世界上超级计算机最密集的区域之一，原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案：D14. 在对互斥

5、量进行解锁时，还会执行( )操作。A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案：C15. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案：C16. 为防止编译器不支持OpenMP，应使用_实现OpenMP代码和普通代码的条件编译。A.#include B.#pragma omp parallelC.#ifdef _OPENMPD.#define _OPENMP参考答案：C17. MPI_Send和MPI_recv是通过( )区分消息。A.端口号B.消息名C.消息标签D.消息哈希参考答案：C18. SSE的bl

6、end指令的8位二进制整数参数被用做8个掩码imm807，若imm8j=0则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置0B.将第二个源寄存器的第j个元素放在目标寄存器位置0C.将第一个源寄存器的第j个元素放在目标寄存器位置jD.将第二个源寄存器的第j个元素放在目标寄存器位置j参考答案：C19. SSE intrinsics _mm_store_pd命令的功能是_。SSE intrinsics _mm_store_pd命令的功能是_。A.对齐向量存单精度浮点数B.未对齐标量存单精度浮点数C.对齐向量存双精度浮点数D.未对齐标量存双精度浮点数参考答案：C20. 记并行时间为T，

7、串行时间为T&39;，处理器数量为p，并行代价的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行代价的定义是_。A.pTB.T+TC.p(T-T)D.pT-T参考答案：A21. 两个矩阵相乘，将矩阵划分为固定大小的子矩阵，变元素运算为子矩阵运算，是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案：A22. 和一对多广播对应的组通信操作是( )。A.多对一收集B.多对多收集C.多对一归约D.多对多归约参考答案：C23. 动态线程编程模式的缺点是_。动态线程编程模式的缺点是_。A.线程管理开销高B.系统资源利用率低C.线程

8、任务分配困难D.线程通信效率低参考答案：A24. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递，性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用，只能采用这种方式由系统代为传递参数D.没有特别用意参考答案：C25. MMX有_个专用寄存器。MMX有_个专用寄存器。A.4B.8C.16D.32参考答案：B26. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4

9、C.8D.16参考答案：B27. 循环需满足特定条件才能进行OpenMP并行化，下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案：B28. 两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案：B29.

10、在下列应用中，SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D30. MPI的通信是( )。A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案：C31. 对奇偶转置排序进行OpenMP并行化，第一种策略是直接对内层循环使用omp parallel for指令，第二种策略是对外层循环使用omp parallel指令，对内层循环使用omp for指令，后者相对于前者的优点是_。A.保持了数据依赖B.消除了大量线程创建、销毁开销C.有利于负载均衡D.减少了线程间交互参考答案：B32. 关于并行代价，下面描述正确的是_。关于并行代价，下面描述正确的是_。

11、A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案：D33. for(i=0; ifor(i=0; iA.存在B.不存在C.不确定D.以上皆错参考答案：A34. GPU相对于其他众核产品的优势不包括( )。A.平台普及B.有CUDA这样易学的开发工具C.性价比高D.由英伟达公司一家把控参考答案：D35. 利用cache line一次读取多个数据字的机制优化程序访存性能，其机理是( )。A.降低了访存延迟B.隐藏了访存延迟C.利用了cache空间局部性D.利用了cache时间局部性参考答案：C36. 采用多核、众核技术提升CPU性能，相对于单核的优势不包括_。

12、A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案：B37. 两个矩阵相乘，当矩阵规模大于cache大小时，平凡算法的问题是_。A.第一个矩阵访存时间局部性差B.第一个矩阵访存空间局部性差C.第二个矩阵访存时间局部性差D.第二个矩阵访存空间局部性差参考答案：D38. 以下超级计算机中，_是SIMD架构。以下超级计算机中，_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案：A39. 在使用条件变量之后必须对其进行_。在使用条件变量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：D40. 在超市的顾客购买商品记录中

13、统计一些商品组合的购买频率，将购买频率(商品组合)划分给不同进程，这是一种划分( )的数据并行策略。A.输入数据B.中间结果C.输出数据D.临时数据参考答案：C41. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案：B42. 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术，则多线程版本_串行版本。A.肯定快于B.肯定慢于C.可能快于D.以上皆错参考答案：B43. 为缓解存储和CPU之间的性能差距，常见的技术手段不包括_。A.利用cache降低访存延迟B.利用多线程隐藏访存延迟C.利用预取隐藏访存延迟D.采用大容量内存提高访问速度参考答案：D44. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM

展开阅读全文

南开大学21秋《并行程序设计》平时作业二参考答案96

最新文档