南开大学21春《并行程序设计》在线作业二满分答案21

上传人:公**** 文档编号:511251807 上传时间:2023-10-20 格式:DOCX 页数:14 大小:15.08KB
返回 下载 相关 举报
南开大学21春《并行程序设计》在线作业二满分答案21_第1页
第1页 / 共14页
南开大学21春《并行程序设计》在线作业二满分答案21_第2页
第2页 / 共14页
南开大学21春《并行程序设计》在线作业二满分答案21_第3页
第3页 / 共14页
南开大学21春《并行程序设计》在线作业二满分答案21_第4页
第4页 / 共14页
南开大学21春《并行程序设计》在线作业二满分答案21_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》在线作业二满分答案21》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》在线作业二满分答案21(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计在线作业二满分答案1. OpenMP是_架构下的一种编程工具。OpenMP是_架构下的一种编程工具。A.SIMDB.MISDC.共享内存D.分布式内存参考答案:C2. 以下( )是MPI基本原语。A.MPI_barrierB.MPI_Comm_numprocsC.MPI_Comm_rankD.MPI_Comm_Send参考答案:C3. CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案:A4. 在矩

2、阵乘法之前将第二个矩阵转置,其作用不包括_。A.增大访存空间局部性B.减少运算次数C.优化SIMD访存D.以上皆错参考答案:B5. 对于并行程序设计,下面说法错误的是_。对于并行程序设计,下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案:D6. MPI不包括的通信类别是_。MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D7. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A8. 对于效率E,下面描述错误的是(

3、)。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案:B9. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_。A.等于8B.小于8C.4到8之间D.等于4参考答案:B10. 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案:A11. 忙等待方法解决竞争条件的思路是( )。A.令CPU一直处于忙碌状态无法产生竞争条件B.令存在数据依赖的内存操作充分并行C.强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化D.以上

4、皆错参考答案:C12. MPI原址收发各一条消息的API是_。A.MPI_SendrecvB.MPI_SendC.MPI_RecvD.MPI_Sendrecv_Replace参考答案:D13. 以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B14. 在128位的SIMD寄存器中,我们不能保存( )。A.16个8位整数B.8个16位短整型C.4个32位整型D.16个字符的字符串参考答案:D15. 新一代GPU重点提供的新特性不包括( )。A.新型高速显存B.GPU间直接高速互联C

5、.自动并行化D.人工智能计算专门优化参考答案:C16. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案:C17. 一个AVX寄存器最多存放_个双精度浮点数。一个AVX寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:B18. 采用多核、众核技术提升CPU性能,相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案:B19. 关于OpenMP程序中的并行结构,以下说法正确的是( )。A.其结束时需程序员人为添加同步B.其结束时OpenMP已

6、默认添加隐式障碍C.其结束时完全不需要同步D.其结束时必须进行同步参考答案:B20. 当问题规模不变时,随着处理器数量增大,加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案:D21. 对于向线程函数传递参数,下列说法错误的是_。A.线程函数并非用户程序调用,因此无法直接传递B.线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象C.线程通常通过此途径获取线程号D.不同线程间的参数传递相互无关,即使它们具有相同的线程函数参考答案:B22. 采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是

7、访存更多在_。A.CPU内存B.GPU显存C.GPU共享内存D.GPU寄存器参考答案:C23. 对两个互斥量a、b,线程1执行lock(a);lock(b);,线程2执行lock(b);lock(a),则两个线程间会发生_。对两个互斥量a、b,线程1执行lock(a);lock(b);,线程2执行lock(b);lock(a),则两个线程间会发生_。A.竞争条件B.数据依赖C.资源泄漏D.死锁参考答案:D24. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cancelC.pthread_testcancelD.

8、pthread_exit参考答案:C25. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案:C26. 并行计算还主要用于国防、工程研究等领域,这种说法是_。A.正确的B.错误的参考答案:B27. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案:C28. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D29. 一个SSE寄存器可容纳( )个短整型数。A.2B.4C.8D.16参考答案:

9、C30. Pthread不支持( )。A.创建并发执行线程B.同步C.非显式通信D.自动并行化参考答案:D31. 对矩阵每行排序的程序进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:C32. 求解同一个问题的4个并行算法的等效率函数分析结果如下,其中( )的可扩展性最优。A.(plogp)B.(p2)C.(p2logp)D.(p3)参考答案:A33. 一个Neon寄存器最多存放_个双精度浮点数。一个Neon寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:A34.

10、为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D35. 华尔街是世界上超级计算机最密集的区域之一,原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案:D36. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案:A37. 每个SSE寄存器宽度为_位。每个SSE寄存器宽度为_位。A.32B.64C.128D.256参考答案:C38. OpenMP中指定单线程执行的指令是(

11、 )。A.omp atomicB.omp onlyC.omp staticD.omp single参考答案:D39. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的( )操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案:D40. 在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分( )的数据并行策略。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:C41. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.32B.64C.128D.25

12、6参考答案:D42. 互斥量mutex机制,在任何时刻_进入它保护的区域。A.允许任意数量任意类型的线程B.允许一个读线程任意个写线程C.允许一个写线程任意个读线程D.只允许一个线程参考答案:D43. 记并行时间为T,串行时间为T&39;,处理器数量为p,效率为E,则代价最优的定义是( )。A.pT=TB.E=(1)C.E=pT/TD.E=T/pT参考答案:B44. 我国最近一次夺得全球超级计算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D45. 和一对多广播对应的组通信操作是( )。A.多对一收集B.多

13、对多收集C.多对一归约D.多对多归约参考答案:C46. CUDA的优点不包括_。CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A47. 大型医院每天的X光片、CT等医学图像的分析需要_。大型医院每天的X光片、CT等医学图像的分析需要_。A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案:B48. 为利用cache空间局部性,需满足_。为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D49. SIMD并行模式是将多个_运算打包并发执行。A.不同B.相同C

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号