南开大学21春《并行程序设计》在线作业二满分答案_18

资源描述

《南开大学21春《并行程序设计》在线作业二满分答案_18》由会员分享，可在线阅读，更多相关《南开大学21春《并行程序设计》在线作业二满分答案_18（14页珍藏版）》请在金锄头文库上搜索。

1、南开大学21春并行程序设计在线作业二满分答案1. 互斥量mutex机制，在任何时刻_进入它保护的区域。A.允许任意数量任意类型的线程B.允许一个读线程任意个写线程C.允许一个写线程任意个读线程D.只允许一个线程参考答案：D2. 以下超级计算机中，_是SIMD架构。以下超级计算机中，_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案：A3. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp

2、reduce参考答案：C4. 如果运算对象是独立无关的变量，则在向量运算之前需_。A.将变量拷贝到连续区域B.将变量地址拷贝到连续区域C.将变量逐个传输到向量寄存器D.以上皆错参考答案：A5. 1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?A.1)B.2)C.不确定D.以上皆错参考答案：B6. 用pthread_barrie

3、r_init初始化障碍，应提供的参数不包括_。A.障碍对象B.障碍初值C.障碍属性D.参与的线程数参考答案：B7. 将起泡排序程序改写为奇偶转置排序，关于其两层循环是否存在数据依赖，下面说法正确的是( )。A.外层存在，内层不存在B.外层不存在，内层存在C.两层都不存在D.两层都存在参考答案：A8. SSE intrinsics _mm_store_ss命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案：C9. 现代CPU中都具有指令乱序执行功能，其目的不包括_。现代CPU中都具有指令乱序执行功能，其目的不包括_

4、。A.消除指令依赖，更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答案：C10. 我国首次获得戈登贝尔奖是在_年。我国首次获得戈登贝尔奖是在_年。A.2015B.2016C.2017D.2018参考答案：B11. 伸缩性的含义不包括_。伸缩性的含义不包括_。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案：A12. SSE指令移动单精度浮点数，不能实现_。SSE指令移动单精度浮点数，不能实现_。A.将64位数据移动到SSE寄存器高位B.将64位数据移动到SSE寄存器低位C.将32位数据移动

5、到SSE寄存器指定位置D.在两个SSE寄存器高/低64位间移动参考答案：C13. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案：B14. 我国最近一次夺得全球超级计算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案：D15. 为防止编译器不支持OpenMP，应使用_实现OpenMP代码和普通代码的条件编译。A.#include B.#pragma omp par

6、allelC.#ifdef _OPENMPD.#define _OPENMP参考答案：C16. 对划分输入数据的策略，下面说法错误的是_。对划分输入数据的策略，下面说法错误的是_。A.当输出数据很少时，需划分输入数据B.当输出数据存在依赖时，需划分输入数据C.通常最后需要汇总结果D.由于不是直接划分输出数据，性能会很差参考答案：D17. 采用多核、众核技术提升CPU性能，相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案：B18. SSE intrinsics _mm_store_pd命令的功能是_。SSE intrinsics _

7、mm_store_pd命令的功能是_。A.对齐向量存单精度浮点数B.未对齐标量存单精度浮点数C.对齐向量存双精度浮点数D.未对齐标量存双精度浮点数参考答案：C19. 我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案：D20. 对于并行程序设计，下面说法错误的是_。对于并行程序设计，下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案：D21. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案：C22. 对矩阵乘

8、法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。A.正确的B.错误的参考答案：B23. 两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分_的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考

9、答案：B24. 下面矩阵运算中，哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案：D25. OpenMP归约指令采用的是一种_算法。A.分治B.贪心C.动态规划D.排序参考答案：A26. 两个矩阵相乘，当矩阵规模大于cache大小时，平凡算法的问题是_。A.第一个矩阵访存时间局部性差B.第一个矩阵访存空间局部性差C.第二个矩阵访存时间局部性差D.第二个矩阵访存空间局部性差参考答案：D27. 编写矩阵乘法的Neon程序，若矩阵元素为双精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：A28. for (i=0;

10、iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案：D29. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128fC._m128dD._m128i参考答案：C30. 在下列应用中，SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D31. 在使用条件变量时，还需配套使用一个( )。A.互斥量B.信号量C.障碍D.自旋锁参考答案：A32. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面

11、说法正确的是( )。A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D33. 当处理器数量不变时，随着问题规模增大，加速比_。当处理器数量不变时，随着问题规模增大，加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案：C34. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案：B35. 为了实现向量计算，SIMD架构还需提供_。为了实现向量计算，SIMD架构还需提供_。A.更大的内存容

12、量B.更快的内存传输C.更宽的寄存器D.更快的网络传输参考答案：C36. 若SIMD并行化时遇到对齐问题，下列说法正确的是( )。A.只能使用不对齐访存指令B.不能进行SIMD并行化C.对齐开销可能完全抵消SIMD并行收益D.以上皆错参考答案：C37. 单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_。A.等于8B.小于8C.4到8之间D.等于4参考答案：B38. 对双精度浮点计算，AVX最高实现( )路并行。A.2B.4C.8D.16参考答案：B39. 全球500强超算在操作系统上越来越体现出_一家独大的趋势。A.UnixB.WindowsC.LinuxD.ios参考答案：C40. 对一

13、个串行程序进行SIMD并行化，应重点考虑的程序部分是_。对一个串行程序进行SIMD并行化，应重点考虑的程序部分是_。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案：C41. MPI原址收发各一条消息的API是_。A.MPI_SendrecvB.MPI_SendC.MPI_RecvD.MPI_Sendrecv_Replace参考答案：D42. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D43. 矩阵每行排序的问题更适合使用MPI

展开阅读全文