南开大学21春《并行程序设计》离线作业1辅导答案29

上传人:re****.1 文档编号:498274818 上传时间:2023-03-09 格式:DOCX 页数:12 大小:13.72KB
返回 下载 相关 举报
南开大学21春《并行程序设计》离线作业1辅导答案29_第1页
第1页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案29_第2页
第2页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案29_第3页
第3页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案29_第4页
第4页 / 共12页
南开大学21春《并行程序设计》离线作业1辅导答案29_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》离线作业1辅导答案29》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》离线作业1辅导答案29(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计离线作业1辅导答案1. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行代价的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行代价的定义是_。A.pTB.T+TC.p(T-T)D.pT-T参考答案:A2. 下列哪门课程不是并行程序设计的先导课?下列哪门课程不是并行程序设计的先导课?A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D3. for(i=0; ifor(i=0; iA.存在B.不存在C.不确定D.以上皆错参考答案:A4. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。A._glob

2、al_B._device_C._shared_D._private_参考答案:C5. OpenMP循环并行指令是( )。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C6. 静态线程编程模式的缺点是_。静态线程编程模式的缺点是_。A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高参考答案:B7. 对单精度浮点计算,SSE最高实现_路并行。对单精度浮点计算,SSE最高实现_路并行。A.2B.4C.8D.16参考答案:B8. 加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间_。A.任意一个串

3、行算法B.作为并行算法基础的那个串行算法C.已知最优的串行算法D.所有串行算法的平均时间参考答案:C9. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A10. 为利用cache空间局部性,需满足_。为利用cache空间局部性,需满足_。A.cache空间足够大B.cache line足够大C.程序访问的数据量足够小D.程序访存模式符合空间局部性特点参考答案:D11. 循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的?( )

4、A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案:B12. 动态线程编程模式的缺点是_。动态线程编程模式的缺点是_。A.线程管理开销高B.系统资源利用率低C.线程任务分配困难D.线程通信效率低参考答案:A13. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案:C14. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案:D15. float a64; for(i

5、=0; iA.8B.16C.32D.64参考答案:B16. 将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为( )。A.(1)B.(logt)C.(t)D.(tlogt)参考答案:B17. 编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括( )。A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码参考答案:C18. 静态线程编程模式的缺点是( )。A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高参考答案:B19. 在分布式内存架构编程中,进程间不

6、能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案:D20. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量传输D.缓存传输参考答案:D21. 对于并行程序设计,下面说法错误的是_。对于并行程序设计,下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案:D22. 当前并行软件面临的主要挑战不包括( )。A.能耗B.伸缩性C.研发周期D.可靠性参考答案:C23. 一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有_线程

7、。A.4B.5C.6D.7参考答案:B24. 主线程通过_函数获取特定线程的返回结果。主线程通过_函数获取特定线程的返回结果。A.pthread_createB.pthread_joinC.pthread_cancelD.pthread_get参考答案:B25. MPI基本原语不包括_。A.MPI_BarrierB.MPI_Comm_rankC.MPI_Comm_sizeD.MPI_Init参考答案:A26. CUDA寄存器是由( )。A.Grid中所有线程共享B.一个Block中所有线程共享C.一个Warp中所有线程共享D.每个线程独享参考答案:D27. 关于OpenMP循环并行程序的编写,

8、下列说法中正确的是_。A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度策略代码D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么参考答案:D28. CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案:A29. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B3

9、0. 对划分输入数据的策略,下面说法错误的是_。对划分输入数据的策略,下面说法错误的是_。A.当输出数据很少时,需划分输入数据B.当输出数据存在依赖时,需划分输入数据C.通常最后需要汇总结果D.由于不是直接划分输出数据,性能会很差参考答案:D31. 在下列应用中,SIMD最不适合_。在下列应用中,SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案:D32. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C33. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展的因素?( )

10、A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B34. SSE的blend指令的8位二进制整数参数被用做8个掩码imm807,若imm8j=0则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置0B.将第二个源寄存器的第j个元素放在目标寄存器位置0C.将第一个源寄存器的第j个元素放在目标寄存器位置jD.将第二个源寄存器的第j个元素放在目标寄存器位置j参考答案:C35. 在下面问题中,SIMD并行最不适合( )。A.向量加法B.向量中元素排序C.矩阵向量乘法D.矩阵加法参考答案:B36. 为防止编译器不支持O

11、penMP,应使用_实现OpenMP代码和普通代码的条件编译。为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案:C37. GPU相对于其他众核产品的优势不包括( )。A.平台普及B.有CUDA这样易学的开发工具C.性价比高D.由英伟达公司一家把控参考答案:D38. 在条件不成立时,使用pthread_cond_wait_。在条件不成立时,使用pthread_cond_wait_。A.令线程阻塞B.解锁互斥量C

12、.解锁互斥量然后令线程阻塞D.加锁互斥量参考答案:C39. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D40. 控制流语句进行SIMD并行化很困难的原因是控制流语句导致( )。A.连续数据执行不同指令B.连续数据执行相同指令C.同一数据执行不同指令D.同一数据执行相同指令参考答案:A41. OpenMP是_架构下的一种编程工具。OpenMP是_架构下的一种编程工具。A.SIMDB.MISDC.共享内存D.分布式内存参考答案:C42. Op

13、enMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C43. 华尔街是世界上超级计算机最密集的区域之一,原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案:D44. 执行pthread_rwlock_rdlock时,( )的情况下加锁成功。A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案:C45. 在下面问题中,SIMD并行更适合( )。A.搜索B.排序C.矩阵乘法D.构建二叉排序树参考答案:C46. 并行计算还主要用于国防、工程研究等领域,这种说法是_。A.正确的B.错误的参考答案:B47

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号