南开大学21秋《并行程序设计》在线作业三满分答案88

上传人:hs****ma 文档编号:458251079 上传时间:2023-10-15 格式:DOCX 页数:15 大小:15.15KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》在线作业三满分答案88_第1页
第1页 / 共15页
南开大学21秋《并行程序设计》在线作业三满分答案88_第2页
第2页 / 共15页
南开大学21秋《并行程序设计》在线作业三满分答案88_第3页
第3页 / 共15页
南开大学21秋《并行程序设计》在线作业三满分答案88_第4页
第4页 / 共15页
南开大学21秋《并行程序设计》在线作业三满分答案88_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》在线作业三满分答案88》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》在线作业三满分答案88(15页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计在线作业三满分答案1. OpenMP不会自动地在_位置设置barrier。OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C2. 在MPI中从/向虚拟进程收/发消息的实际效果是_。在MPI中从/向虚拟进程收/发消息的实际效果是_。A.与通信域根进程通信B.与0号进程通信C.像什么都没发生一样D.以上皆错参考答案:C3. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案:D4. 将起泡排序程序改写为奇偶转置

2、排序,关于其两层循环是否存在数据依赖,下面说法正确的是( )。A.外层存在,内层不存在B.外层不存在,内层存在C.两层都不存在D.两层都存在参考答案:A5. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D6. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128fC._m128dD._m128i参考答案:C7. 采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第_层循环进行循环展开然后向量化。采用划分子矩阵方法实现矩阵乘法,

3、在进行SSE并行化时,是对(由外至内数)第_层循环进行循环展开然后向量化。A.3B.4C.5D.6参考答案:D8. 关于OpenMP循环并行程序的编写,下列说法中正确的是_。A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度策略代码D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么参考答案:D9. 关于并行代价,下面描述正确的是_。关于并行代价,下面描述正确的是_。A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案:D10. 任务依赖图中顶点权重之和表示_。任务依赖图中顶点权重之和表示_。A.任务数B.任务难

4、度C.串行执行时间D.并行执行时间参考答案:C11. SSE intrinsics _mm_load_pd命令的功能是_。SSE intrinsics _mm_load_pd命令的功能是_。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:C12. 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )A.读取x存在

5、数据依赖,不能并发进行B.累加顺序被改变,结果是错误的C.加法操作是简单运算,无需同步D.加法操作不是原子操作,需要同步保证数据依赖参考答案:D13. 循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案:B14. for (i=2; iA.存在B.不存在C.不确定D.以上皆错参考答案:A15. 一个SSE寄存器可容纳_个短整型数。一个SSE寄存器可容纳_个短整型数。A.2B.4C.8D.16参考答案:C16. OpenMP不会自动地在_位

6、置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C17. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的_操作才能得到结果矩阵的一个元素。A.排列B.交换C.广播D.归约参考答案:D18. pthread_rwlock_rdlock是对读写锁进行_操作。A.加锁B.解锁C.加读琐D.加写锁参考答案:C19. SSE指令移动单精度浮点数,不

7、能实现_。SSE指令移动单精度浮点数,不能实现_。A.将64位数据移动到SSE寄存器高位B.将64位数据移动到SSE寄存器低位C.将32位数据移动到SSE寄存器指定位置D.在两个SSE寄存器高/低64位间移动参考答案:C20. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递,性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数D.没有特别用意参考答案:C21. 当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。当前CPU性能提升已从依赖时钟频率提升转为更多依赖_。A.多核和众核

8、技术B.突破物理局限C.改善散热D.采用新材料参考答案:A22. 两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是( )。A.先将两个矩阵读入cache再进行乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案:C23. SSE有_个专用寄存器。A.4B.8C.16D.33参考答案:B24. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案:D25. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A

9、.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C26. 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案:B27. 主线程要求从线程退出应采用_。主线程要求从线程退出应采用_。A.pthread_createB.pthread_exitC.pthread_quitD.pthread_cancel参考答案:D28. 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序_。A.必然主线程前、从线程后B.必然从线程前、主线程后C

10、.必然相互交织D.各种顺序皆有可能参考答案:D29. MPI基本原语不包括_。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init参考答案:A30. 在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分( )的数据并行策略。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:C31. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cancelC.pthread_testcancelD.pthread_e

11、xit参考答案:C32. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案:B33. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A34. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )A.A1 A2 A3 A4B.A2 A1 A4 A3C.

12、A3 A4 A1 A2D.A4 A3 A2 A1参考答案:D35. 大型医院每天的X光片、CT等医学图像的分析需要_。大型医院每天的X光片、CT等医学图像的分析需要_。A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案:B36. 以下超级计算机中,( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案:D37. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案:C38. 对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法,哪个步骤

13、的描述是错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案:C39. 我国最近一次夺得全球超级计算机计算能力冠军的是_。我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D40. 为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D41. 当条件判断_时,控制流语句SIMD并行化可能达到较好效果。A.绝大部分结果为真B.绝大部分结果为假C.全部结果都一样D.绝大部分结果都一样参考答案:D42. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案:A43. 创建线程时,我们通过( )将线程号分别传递给每个线程。A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号