南开大学21秋《并行程序设计》平时作业二参考答案22

上传人:新** 文档编号:465221330 上传时间:2024-01-02 格式:DOCX 页数:14 大小:14.48KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》平时作业二参考答案22_第1页
第1页 / 共14页
南开大学21秋《并行程序设计》平时作业二参考答案22_第2页
第2页 / 共14页
南开大学21秋《并行程序设计》平时作业二参考答案22_第3页
第3页 / 共14页
南开大学21秋《并行程序设计》平时作业二参考答案22_第4页
第4页 / 共14页
南开大学21秋《并行程序设计》平时作业二参考答案22_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》平时作业二参考答案22》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》平时作业二参考答案22(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计平时作业二参考答案1. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案:A2. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数,后者通过特定APID.前者通过特定API,后者创建线程时传递参数参考答案:D3. 一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案:B4. 对这样的循环f

2、or(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案:C5. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A6. 对矩阵每行排序的程序进行多线程并行化,对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案:C7. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A8. 在128位的

3、SIMD寄存器中,我们不能保存( )。A.16个8位整数B.8个16位短整型C.4个32位整型D.16个字符的字符串参考答案:D9. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是_。A.正确的B.错误的参考答案:B10. 关于消息传递编程的特点,以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案:C11. 关于并行代价,下面描述正确的是_。关于

4、并行代价,下面描述正确的是_。A.总是小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案:D12. SSE intrinsics_mm_load_ss命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数参考答案:C13. 每个SSE寄存器宽度为_位。每个SSE寄存器宽度为_位。A.32B.64C.128D.256参考答案:C14. 四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。四位助教帮助教授批改300份试卷,试卷共16道

5、题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。A.数据并行B.任务并行C.搜索并行D.预测并行参考答案:B15. 对于效率E,下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案:B16. 在分布式内存架构编程中,进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案:D17. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案:C18. 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变

6、量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是( )A.读取x存在数据依赖,不能并发进行B.累加顺序被改变,结果是错误的C.加法操作是简单运算,无需同步D.加法操作不是原子操作,需要同步保证数据依赖参考答案:D19. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D20. OpenMP是_的一个常见替代。OpenMP是_的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C21

7、. 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是( )。A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案:C22. 限制CPU内流水线深度的因素包括( )。A.指令复杂程度B.分支预测性能C.CPU核心数D.CPU cache大小参考答案:B23. MPI基本原语不包括_。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init参考答案:A24. n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法_。n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法_。A.肯定不是代价

8、最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案:A25. 传统科学和工程实验相对于计算机并行仿真的劣势不包括_。传统科学和工程实验相对于计算机并行仿真的劣势不包括_。A.成本太高B.结果不准确C.时间太长D.太危险参考答案:B26. OpenMP中多线程间是一种( )关系。A.主从B.分组C.对等D.竞争参考答案:A27. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案:D28. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128

9、fC._m128dD._m128i参考答案:C29. 编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:B30. MPI默认点对点通信模式是( )。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案:A31. 以下超级计算机中,( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案:D32. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量

10、传输D.缓存传输参考答案:D33. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C34. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C35. OpenMP能实现的是( )。A.避免数据竞争B.提供任务划分策略C.确保加速D.确保降低通信开销参考答案:B36. 当处理器数量不变时,随着问题规模增大,加速比_。当处理器数量不变时,随着问题规模增大,加速比_。A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案:C37. 对于并行程序设计

11、,下面说法错误的是_。对于并行程序设计,下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案:D38. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A39. OpenMP编译指示是以( )开头的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”参考答案:C40. 在使用互斥量之后必须对其进行_。在使用互斥量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:D41. 实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是_。实现任何时刻都只有

12、一个线程进行共享变量更新的OpenMP指令是_。A.omp parallelB.omp barrierC.omp criticalD.omp reduce参考答案:C42. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案:D43. 编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案:A44. for (i=0;iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案:D45. 并行计算还主要用于国防、工程研究等领域,这种说法是_。A.正确的B.错误的参

13、考答案:B46. 当前并行软件面临的主要挑战不包括( )。A.能耗B.伸缩性C.研发周期D.可靠性参考答案:C47. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C48. SSE intrinsics _mm_hadd_ps命令的功能是_。SSE intrinsics _mm_hadd_ps命令的功能是_。A.寄存器间单精度浮点数向量加法B.寄存器间双精度浮点数向量加法C.寄存器内单精度浮点数加法D.寄存器内双精度浮点数加法参考答案:C49. 采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在_。采用划

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号