南开大学21秋《并行程序设计》在线作业二答案参考72

资源描述

《南开大学21秋《并行程序设计》在线作业二答案参考72》由会员分享，可在线阅读，更多相关《南开大学21秋《并行程序设计》在线作业二答案参考72（15页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计在线作业二答案参考1. 对于向线程函数传递参数，下列说法错误的是_。A.线程函数并非用户程序调用，因此无法直接传递B.线程函数必须接受void *参数，因此只能传递大小不超过指针的数据对象C.线程通常通过此途径获取线程号D.不同线程间的参数传递相互无关，即使它们具有相同的线程函数参考答案：B2. 互斥量是一种( )同步机制。A.一元状态B.二元状态C.多元状态D.以上皆错参考答案：C3. OpenMP默认采用_循环划分策略。A.静态B.固定C.动态D.自适应参考答案：A4. 华尔街是世界上超级计算机最密集的区域之一，原因是( )。A.金融巨头支付得起B.与超算制造商有

2、良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案：D5. OpenMP编译指示是以( )开头的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”参考答案：C6. 一个AVX寄存器最多存放_个单精度浮点数。一个AVX寄存器最多存放_个单精度浮点数。A.2B.4C.8D.16参考答案：C7. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案：C8. OpenMP不能实现的是( )。A.负责创建和管理线程B.隐藏栈管理C.提供同步机制D.自动并行化参考答案：D9. 执行pthread_rwlock

3、_rdlock时，( )的情况下加锁成功。A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案：C10. 采用划分子矩阵技术优化矩阵乘法CUDA程序，子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案：C11. 加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间_。A.任意一个串行算法B.作为并行算法基础的那个串行算法C.已知最优的串行算法D.所有串行算法的平均时间参考答案：C12. 当问题规模不变时，随着处理器数量增大，效率降低的性质对_成立。A.部分并行算

4、法B.代价最优并行算法C.所有并行算法D.以上皆错参考答案：C13. MPI_Send和MPI_recv是通过( )区分消息。A.端口号B.消息名C.消息标签D.消息哈希参考答案：C14. 任务依赖图的平均并发度的定义是( )。A.顶点权重之和B.顶点数C.各层平均顶点数D.顶点权重之和/关键路径长度参考答案：D15. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案：B16. 将t个线程的局部结果汇总，可采用递归分解并行进行，即，两两汇总，中间结果继续两两汇总，直到剩下唯一的最终结果，其时间复杂度为( )。

5、A.(1)B.(logt)C.(t)D.(tlogt)参考答案：B17. SSE的blend指令的8位二进制整数参数被用做8个掩码imm807，若imm8j=0则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置0B.将第二个源寄存器的第j个元素放在目标寄存器位置0C.将第一个源寄存器的第j个元素放在目标寄存器位置jD.将第二个源寄存器的第j个元素放在目标寄存器位置j参考答案：C18. SSE intrinsics _mm_store_ss命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案：C19.

6、伸缩性的含义不包括_。伸缩性的含义不包括_。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案：A20. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案：C21. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案：B22. 大型医院每天的X光片、CT等医学图像的分析需要_。大型医

7、院每天的X光片、CT等医学图像的分析需要_。A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案：B23. 使用一个信号量实现“主线程等待4个从线程完成任务”，信号量初始值应设置为( )。A.0B.1C.2D.4参考答案：A24. 为了实现向量计算，SIMD架构还需提供_。为了实现向量计算，SIMD架构还需提供_。A.更大的内存容量B.更快的内存传输C.更宽的寄存器D.更快的网络传输参考答案：C25. 在下面问题中，SIMD并行更适合( )。A.搜索B.排序C.矩阵乘法D.构建二叉排序树参考答案：C26. 编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循

8、环进行_路循环展开。编写矩阵乘法的SSE程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B27. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案：D28. 对于科学仿真并行计算的一般方法，哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法，哪个步骤的描述是

9、错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案：C29. OpenMP中多线程间是一种( )关系。A.主从B.分组C.对等D.竞争参考答案：A30. SSE运算指令中未提供_指令。A.算术运算B.矩阵运算C.逻辑运算D.比较运算参考答案：B31. 关于消息传递编程的特点，以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案：C32. 和一对多广播对应的组通信操作是( )。A.多对一收集B.多对多收集C.多对一归约D.多对多归约参考答案：C33. 用pthread_barri

10、er_init初始化障碍，应提供的参数不包括_。A.障碍对象B.障碍初值C.障碍属性D.参与的线程数参考答案：B34. 记并行时间为T，串行时间为T&39;，处理器数量为p，效率为E，则代价最优的定义是( )。A.pT=TB.E=(1)C.E=pT/TD.E=T/pT参考答案：B35. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B36. 关于OpenMP程序中的并行结构，以下说法正确的是( )。A.其结束时需程序员人为添加同步B.其结

11、束时OpenMP已默认添加隐式障碍C.其结束时完全不需要同步D.其结束时必须进行同步参考答案：B37. 单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案：B38. n个数求和的串行程序，通过一个循环将每个数累加到全局变量sum中，其多线程版本简单将循环范围改变为每个线程负载的范围，存在的问题是_。n个数求和的串行程序，通过一个循环将每个数累加到全局变量sum中，其多线程版本简单将循环范围改变为每个线程负载的范围，存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.su

12、m累加产生竞争条件，导致结果错误参考答案：D39. 以下超级计算机中，_是SIMD架构。以下超级计算机中，_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案：A40. SSE intrinsics_mm_store_sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案：C41. 当条件判断_时，控制流语句SIMD并行化可能达到较好效果。A.绝大部分结果为真B.绝大部分结果为假C.全部结果都一样D.绝大部分结果都一样参考答案：D42. SSE intrinsics_mm_loa

13、du_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案：B43. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参考答案：C44. 将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是_。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案：A45. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案：D46. 记并行时间为T，串行时间为T&39;，处理器数量为p，并行效率E的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行效率E的定义是_。A.T-TB.T/TC.T/pTD.pT-T

展开阅读全文

南开大学21秋《并行程序设计》在线作业二答案参考72

最新文档