南开大学21秋《并行程序设计》平时作业一参考答案12

上传人:pu****.1 文档编号:472153157 上传时间:2023-10-07 格式:DOCX 页数:14 大小:14.78KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》平时作业一参考答案12_第1页
第1页 / 共14页
南开大学21秋《并行程序设计》平时作业一参考答案12_第2页
第2页 / 共14页
南开大学21秋《并行程序设计》平时作业一参考答案12_第3页
第3页 / 共14页
南开大学21秋《并行程序设计》平时作业一参考答案12_第4页
第4页 / 共14页
南开大学21秋《并行程序设计》平时作业一参考答案12_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》平时作业一参考答案12》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》平时作业一参考答案12(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计平时作业一参考答案1. 任务依赖图的平均并发度的定义是( )。A.顶点权重之和B.顶点数C.各层平均顶点数D.顶点权重之和/关键路径长度参考答案:D2. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行代价的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行代价的定义是_。A.pTB.T+TC.p(T-T)D.pT-T参考答案:A3. 从线程检查主线程是否要求它退出应采用_。从线程检查主线程是否要求它退出应采用_。A.pthread_joinB.pthread_cancelC.pthread_testcancelD.pthread_exit参考答案

2、:C4. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A5. 对单精度浮点计算,SSE最高实现_路并行。对单精度浮点计算,SSE最高实现_路并行。A.2B.4C.8D.16参考答案:B6. MMX有( )个专用寄存器。A.4B.8C.16D.32参考答案:B7. 以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B8. SSE intrinsics_mm_store_sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C

3、.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C9. CUDA的优点不包括_。CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A10. 在使用信号量之前必须对其进行_。在使用信号量之前必须对其进行_。A.初始化B.加锁C.加1D.销毁参考答案:A11. n个节点的超立方构造成本为( )。A.OlognB.OsqrtnC.OnD.Onlogn参考答案:D12. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参

4、数B.两者均通过特定APIC.前者创建线程时传递参数,后者通过特定APID.前者通过特定API,后者创建线程时传递参数参考答案:D13. SSE intrinsics_mm_load_ss命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数参考答案:C14. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案:D15. 现代CPU中都具有指令乱序执行功能,其目的不包括_。现代CP

5、U中都具有指令乱序执行功能,其目的不包括_。A.消除指令依赖,更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答案:C16. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案:C17. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B18. 在下列应用中,SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案:D19. 执行pthread_r

6、wlock_rdlock时,( )的情况下加锁成功。A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案:C20. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案:C21. 造成超线性加速比的你原因包括_。造成超线性加速比的你原因包括_。A.进程间大量通信B.并行算法导致额外计算C.并行计算工作量显著小于串行计算D.问题求解包含不可并行化部分参考答案:C22. 一个程序用pthread_create创建了4个线程,此时系

7、统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案:B23. 对于效率E,下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案:B24. 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案:A25. for (i=0;iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案:D26. CUDA寄存器是由( )。A.Grid中所有线程共享B.一个Block中所有线程共享C.一个Warp

8、中所有线程共享D.每个线程独享参考答案:D27. 采用多核、众核技术提升CPU性能,相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案:B28. OpenMP中多线程间是一种( )关系。A.主从B.分组C.对等D.竞争参考答案:A29. SSE intrinsics _mm_store_pd命令的功能是_。SSE intrinsics _mm_store_pd命令的功能是_。A.对齐向量存单精度浮点数B.未对齐标量存单精度浮点数C.对齐向量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C30. 以下哪条不是推动并行计算发展的因

9、素?( )以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案:B31. n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件,导致结果错误参考答案:D32. 当问题规模不变时,随着处理器数量增大,效

10、率降低的性质对_成立。A.部分并行算法B.代价最优并行算法C.所有并行算法D.以上皆错参考答案:C33. 忙等待方法解决竞争条件的思路是( )。A.令CPU一直处于忙碌状态无法产生竞争条件B.令存在数据依赖的内存操作充分并行C.强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化D.以上皆错参考答案:C34. 在分布式内存架构编程中,进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案:D35. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案:D36. FORTRAN语言存储二维数组采取

11、_。FORTRAN语言存储二维数组采取_。A.行主次序存储B.列主次序存储C.交错式存储D.对角线存储参考答案:B37. 为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.#include B.#pragma omp parallelC.#ifdef _OPENMPD.#define _OPENMP参考答案:C38. SSE intrinsics_mm_store_ps命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案:A39. 对这样的循环for(i=0;iA.循环划分B

12、.循环消除C.循环展开D.以上皆错参考答案:C40. 动态任务划分相对于静态任务划分的缺点是_。动态任务划分相对于静态任务划分的缺点是_。A.可能导致负载不均B.通信开销高C.任务粒度粗D.计算复杂度高参考答案:B41. 主线程通过_函数获取特定线程的返回结果。主线程通过_函数获取特定线程的返回结果。A.pthread_createB.pthread_joinC.pthread_cancelD.pthread_get参考答案:B42. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量传输D.缓存传输参考答案:D43. 为了实现向量计算,SIMD

13、架构还需提供_。为了实现向量计算,SIMD架构还需提供_。A.更大的内存容量B.更快的内存传输C.更宽的寄存器D.更快的网络传输参考答案:C44. 将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为( )。A.(1)B.(logt)C.(t)D.(tlogt)参考答案:B45. OpenMP是_的一个常见替代。OpenMP是_的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C46. MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D47. 下面哪种架构最适合数据并行?( )A.SISDB.SIMDC.MISDD.MIMD

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号