南开大学21春《并行程序设计》在线作业一满分答案91

上传人:工**** 文档编号:511989348 上传时间:2023-01-02 格式:DOCX 页数:15 大小:14.81KB
返回 下载 相关 举报
南开大学21春《并行程序设计》在线作业一满分答案91_第1页
第1页 / 共15页
南开大学21春《并行程序设计》在线作业一满分答案91_第2页
第2页 / 共15页
南开大学21春《并行程序设计》在线作业一满分答案91_第3页
第3页 / 共15页
南开大学21春《并行程序设计》在线作业一满分答案91_第4页
第4页 / 共15页
南开大学21春《并行程序设计》在线作业一满分答案91_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》在线作业一满分答案91》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》在线作业一满分答案91(15页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计在线作业一满分答案1. 矩阵每行排序的问题更适合使用MPI的_编程模型。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案:D2. MPI_Send和MPI_recv是通过( )区分消息。A.端口号B.消息名C.消息标签D.消息哈希参考答案:C3. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案:C4. CUDA共享内存是由_共享。A.Grid中所有线程B.一个Block中所有线程C.一个Warp中所有线程D.GPU中所有线程参考答案:B5. 1)

2、R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )A.1B.2C.不确定D.以上皆错参考答案:B6. 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是_。对一个串行程序进行SIMD并行化,应重点考虑的程序部分是_。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案:C7. 在使用条件变量之前必须对其进

3、行_。在使用条件变量之前必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:A8. 采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好?( )A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG参考答案:D9. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A10. 造成超线性加速比的你原因包括_。造成超线性加速比的你原因包括_。A.进程间大量通

4、信B.并行算法导致额外计算C.并行计算工作量显著小于串行计算D.问题求解包含不可并行化部分参考答案:C11. 一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案:B12. 第一款桌面多核CPU是( )发布的。A.IntelB.AMDC.IBMD.SUN参考答案:A13. 除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A14. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参

5、考答案:C15. 对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用omp parallel for指令,第二种策略是对外层循环使用omp parallel指令,对内层循环使用omp for指令,后者相对于前者的优点是_。A.保持了数据依赖B.消除了大量线程创建、销毁开销C.有利于负载均衡D.减少了线程间交互参考答案:B16. R*=1.3; G+=1.8; B+=1.2; X*=1.1,此程序片段可进行SIMD并行化吗?( )A.不可以B.可以C.不确定D.以上皆错参考答案:A17. 新一代GPU重点提供的新特性不包括( )。A.新型高速显存B.GPU间直接高速互联C.自动

6、并行化D.人工智能计算专门优化参考答案:C18. SSE的blend指令的8位二进制整数参数被用做8个掩码imm807,若imm8j=0则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置0B.将第二个源寄存器的第j个元素放在目标寄存器位置0C.将第一个源寄存器的第j个元素放在目标寄存器位置jD.将第二个源寄存器的第j个元素放在目标寄存器位置j参考答案:C19. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案:D20. OpenMP中指定单线程执行的指令是( )。A.omp atomicB.omp onlyC.omp stati

7、cD.omp single参考答案:D21. 一个SSE寄存器可容纳( )个双精度浮点数。A.2B.4C.8D.16参考答案:A22. 主线程通过_函数获取特定线程的返回结果。A.pthread_createB.pthread_joinC.pthread_cancelD.pthread_get参考答案:B23. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D24. 下列哪门课程不是并行程序设计的先导课?下列哪门课程不是并行程序设计的先导课?A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D2

8、5. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案:B26. 下面哪种架构最适合数据并行?( )A.SISDB.SIMDC.MISDD.MIMD参考答案:B27. 每个MMX寄存器宽度为_位。每个MMX寄存器宽度为_位。A.32B.64C.128D.256参考答案:B28. Pthread不支持( )。A.创建并发执行线程B.同步C.非显式通信D.自动并行化参考答案:D29. OpenMP编译指示的作用范围是( )。A.其后一个语句B.其后连续语句C.其后直到函数结束D.整个函数参考答案:A30. _执行pthread_sem_po

9、st操作,当前线程会唤醒阻塞线程。_执行pthread_sem_post操作,当前线程会唤醒阻塞线程。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案:B31. 我国首次获得戈登贝尔奖是在_年。我国首次获得戈登贝尔奖是在_年。A.2015B.2016C.2017D.2018参考答案:B32. OpenMP编译指示中说明私有变量是用_子句。OpenMP编译指示中说明私有变量是用_子句。A.privateB.sharedC.scheduleD.nowait参考答案:A33. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。A._g

10、lobal_B._device_C._shared_D._private_参考答案:C34. 伸缩性的含义不包括( )。A.硬件能升级扩展B.扩大系统规模构造成本增长不快C.程序在新硬件下仍能高效运行D.程序在更大规模系统下仍能高效运行参考答案:A35. 每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案:D36. 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )。A.读取x存在数据依赖,不能并发进行B.累加顺序被改变,结果是错误的C.加法操作是简单运算,无需同步D.加法操作不是原子操作,需

11、要同步保证数据依赖参考答案:D37. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:B38. 主线程要求从线程退出应采用_。主线程要求从线程退出应采用_。A.pthread_createB.pthread_exitC.pthread_quitD.pthread_cancel参考答案:D39. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案:C40. 从线程检查主线程是否要求它退出应采用_。从线程检

12、查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cancelC.pthread_testcancelD.pthread_exit参考答案:C41. float a64; for(i=0; iA.1B.2C.3D.4参考答案:B42. 任务依赖图中顶点权重之和表示_。任务依赖图中顶点权重之和表示_。A.任务数B.任务难度C.串行执行时间D.并行执行时间参考答案:C43. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp

13、 criticalD.omp reduce参考答案:C44. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行代价的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行代价的定义是_。A.pTB.T+TC.p(T-T)D.pT-T参考答案:A45. 对于加速比S和处理器数量p,下列说法正确的是_。A.有可能SpB.必然SpC.不可能S=pD.两者无关联参考答案:A46. SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A,B,0x05)后,C中元素为( )。A.A1 A2 B3 B4B.B1 B2 A3 A4C.A1 B2 A3 B4D.B1 A2 B3 A4参考答案:D47. 静态线程编程模式的缺点是( )。A.线程管

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号