南开大学21秋《并行程序设计》在线作业三答案参考57

上传人:枫** 文档编号:507816016 上传时间:2022-10-19 格式:DOCX 页数:15 大小:15.23KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》在线作业三答案参考57_第1页
第1页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考57_第2页
第2页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考57_第3页
第3页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考57_第4页
第4页 / 共15页
南开大学21秋《并行程序设计》在线作业三答案参考57_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》在线作业三答案参考57》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》在线作业三答案参考57(15页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计在线作业三答案参考1. 当处理器数量不变时,随着问题规模增大,加速比_。当处理器数量不变时,随着问题规模增大,加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案:C2. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )A.A1 A2 A3 A4B.A2 A1 A4 A3C.A3 A4 A1 A2D.A4 A3 A

2、2 A1参考答案:D3. MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D4. 如果运算对象是独立无关的变量,则在向量运算之前需_。A.将变量拷贝到连续区域B.将变量地址拷贝到连续区域C.将变量逐个传输到向量寄存器D.以上皆错参考答案:A5. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案:A6. OpenMP编译指示中说明私有变量是用_子句。OpenMP编译指示中说明私有变量是用_子句。A.privateB.sharedC.scheduleD.nowait参考答案:A7. SIMD架构

3、未见于_中。SIMD架构未见于_中。A.多媒体扩展B.图形和游戏处理器C.计算机集群D.协处理器参考答案:C8. 在矩阵乘法之前将第二个矩阵转置,其作用不包括_。A.增大访存空间局部性B.减少运算次数C.优化SIMD访存D.以上皆错参考答案:B9. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D10. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码

4、D.线程同步的代码参考答案:C11. 一个Neon寄存器最多存放_个双精度浮点数。一个Neon寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:A12. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案:B13. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行效率E的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行效率E的定义是_。A.T-TB.T/TC.T/pTD.pT-T参考答案:C14. OpenMP中指定单线程执行的指令是( )。A.omp atomicB.omp onl

5、yC.omp staticD.omp single参考答案:D15. 两个矩阵相乘,当矩阵规模大于cache大小时,平凡算法的问题是_。A.第一个矩阵访存时间局部性差B.第一个矩阵访存空间局部性差C.第二个矩阵访存时间局部性差D.第二个矩阵访存空间局部性差参考答案:D16. 关于消息传递编程的特点,以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案:C17. 超级计算机制造越来越关注的一个新的指标是_。超级计算机制造越来越关注的一个新的指标是_。A.计算能力B.存储能力C.占地面积D.功耗参考答案:D18. 全球500强超算在操

6、作系统上越来越体现出_一家独大的趋势。A.UnixB.WindowsC.LinuxD.ios参考答案:C19. 创建线程时,我们通过( )将线程号分别传递给每个线程。A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函数参数”参数参考答案:D20. for(i=0; ifor(i=0; iA.存在B.不存在C.不确定D.以上皆错参考答案:A21. 在使用互斥量之后必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:D22. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp par

7、allel forD.omp master参考答案:C23. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案:D24. 采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好?( )A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG参考答案:D25. OpenMP并行模型是一种_模式。OpenMP并行模型是一种_模式。A.SISDB.SIMDC.MISDD.SPMD

8、参考答案:D26. 任务依赖图中权重之和最长的路径称为( )。A.最大任务B.关键路径C.平均并发度D.最短路径参考答案:B27. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B28. 编写n个数求和的OpenMP程序,最高效的方法是( )。A.多线程直接并发累加到共享变量B.将累加操作设置为临界区C.在累加操作前设置障碍D.采用归约指令参考答案:D29. 使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为( )

9、。A.0B.1C.2D.4参考答案:A30. 对矩阵乘法进行多线程并行化,对矩阵采用_。对矩阵乘法进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:A31. SSE寄存器A和B中元素分别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A,B,0x05)后,C中元素为( )。A.A1 A2 B3 B4B.B1 B2 A3 A4C.A1 B2 A3 B4D.B1 A2 B3 A4参考答案:D32. SSE intrinsics _mm_store_s

10、s命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案:C33. 矩阵每行排序的问题更适合使用MPI的_编程模型。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案:D34. n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法_。n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法_。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案:A35. SIMD并行模式是将多个_运算打包并发执行。A.不同B.相同C.混合D.依赖参考答案:B36.

11、除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A37. OpenMP默认采用_循环划分策略。A.静态B.固定C.动态D.自适应参考答案:A38. 对双精度浮点计算,AVX最高实现( )路并行。A.2B.4C.8D.16参考答案:B39. 以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B40. 在128位的SIMD寄存器中,我们不能保存( )。A.16个8位整数B.8个16位短

12、整型C.4个32位整型D.16个字符的字符串参考答案:D41. 编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:C42. 每个SSE寄存器宽度为_位。每个SSE寄存器宽度为_位。A.32B.64C.128D.256参考答案:C43. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参

13、考答案:B44. SSE intrinsics_mm_store_ps命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案:A45. 对天气预报问题,将大气层划分为5*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )对天气预报问题,将大气层划分为5*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )A.1B.10C.100D.300参考答案:C46. 在MPI中从/向虚拟进程收/发消息的实际效果是_。在MPI中从/向虚拟进程收/发消息的实际效果是_。A.与通信域根进程通信B.与0号进程通信

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号