南开大学21春《并行程序设计》离线作业一辅导答案1

上传人:m**** 文档编号:474279505 上传时间:2022-07-16 格式:DOCX 页数:12 大小:13.47KB
返回 下载 相关 举报
南开大学21春《并行程序设计》离线作业一辅导答案1_第1页
第1页 / 共12页
南开大学21春《并行程序设计》离线作业一辅导答案1_第2页
第2页 / 共12页
南开大学21春《并行程序设计》离线作业一辅导答案1_第3页
第3页 / 共12页
南开大学21春《并行程序设计》离线作业一辅导答案1_第4页
第4页 / 共12页
南开大学21春《并行程序设计》离线作业一辅导答案1_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》离线作业一辅导答案1》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》离线作业一辅导答案1(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计离线作业一辅导答案1. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C2. 在使用互斥量之后必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:D3. OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C4. CUDA共享内存是由_共享。A.Grid中所有线程B.一个Block中所有线程C.一个Warp中所有线程D.GPU中所有线程参考答案

2、:B5. float a64; for(i=0; iA.1B.2C.3D.4参考答案:B6. CUDA寄存器是由( )。A.Grid中所有线程共享B.一个Block中所有线程共享C.一个Warp中所有线程共享D.每个线程独享参考答案:D7. 一个SSE寄存器可容纳_个短整型数。一个SSE寄存器可容纳_个短整型数。A.2B.4C.8D.16参考答案:C8. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案:B9. 主线程要求从线程退出应采用_。主线程要求从线程退出应采用_。A.pthread_createB.pthread

3、_exitC.pthread_quitD.pthread_cancel参考答案:D10. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B11. 主线程通过_函数获取特定线程的返回结果。主线程通过_函数获取特定线程的返回结果。A.pthread_createB.pthread_joinC.pthread_cancelD.pthread_get参考答案:B12. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.

4、矩阵向量相乘D.高斯消去参考答案:D13. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A14. 对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案:C15. 以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B16. CUDA的优点不包括_。CUDA的优点不包括_。A.可移植性B.入门简单

5、C.标准的SPMD模式D.不再需要图形API参考答案:A17. 在下面问题中,SIMD并行更适合( )。A.搜索B.排序C.矩阵乘法D.构建二叉排序树参考答案:C18. 对这样的循环for(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案:C19. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递,性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数D.没有特别用意参考答案:C20. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_

6、。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案:B21. MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D22. 我国最早夺得全球超级计算机计算能力冠军的是( )。A.天河1号B.天河1AC.天河2号D.神威.太湖之光参考答案:B23. 我国首次获得戈登贝尔奖是在_年。我国首次获得戈登贝尔奖是在_年。A.2015B.2016C.2017D.2018参考答案:B24. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cance

7、lC.pthread_testcancelD.pthread_exit参考答案:C25. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C26. OpenMP循环并行指令是( )。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C27. 以下超级计算机中,( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案:D28. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答

8、案:B29. 对单精度浮点计算,AVX最高实现( )路并行。A.2B.4C.8D.16参考答案:C30. 静态线程编程模式的缺点是( )。A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高参考答案:B31. SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm803,若imm81=j则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置1B.将第二个源寄存器的第j个元素放在目标寄存器位置1C.将第一个源寄存器的第1个元素放在目标寄存器位置1D.将第二个源寄存器的第1个元素放在目标寄存器位置1参考答案:A32. 在SSE intrinsi

9、cs程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案:C33. 为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.#include B.#pragma omp parallelC.#ifdef _OPENMPD.#define _OPENMP参考答案:C34. CUDA线程层次中不包括( )。A.KernelB.GridC.BlockD.Thread参考答案:A35. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案:A36. 对天气预报问题,将大气层划分为5

10、*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )对天气预报问题,将大气层划分为5*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )A.1B.10C.100D.300参考答案:C37. SSE指令移动单精度浮点数,不能实现_。SSE指令移动单精度浮点数,不能实现_。A.将64位数据移动到SSE寄存器高位B.将64位数据移动到SSE寄存器低位C.将32位数据移动到SSE寄存器指定位置D.

11、在两个SSE寄存器高/低64位间移动参考答案:C38. n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件,导致结果错误参考答案:D39. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案:

12、C40. 一个SSE寄存器可容纳( )个双精度浮点数。A.2B.4C.8D.16参考答案:A41. 我国最近一次夺得全球超级计算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D42. 关于消息传递编程的特点,以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案:C43. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C44. 以下超级计算机中,_是SIMD架构。以下超级计算机中,_是SIMD架构

13、。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案:A45. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B46. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A47. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D48. 现代CPU中都具有指令乱序执行功能,其目的不包括_。现代C

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号