南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80

上传人:鲁** 文档编号:469389057 上传时间:2023-02-02 格式:DOCX 页数:12 大小:13.62KB
返回 下载 相关 举报
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80_第1页
第1页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80_第2页
第2页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80_第3页
第3页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80_第4页
第4页 / 共12页
南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80》由会员分享,可在线阅读,更多相关《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计复习考核试题库答案参考1. n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法( )。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案:A2. 一个AVX寄存器最多存放_个单精度浮点数。一个AVX寄存器最多存放_个单精度浮点数。A.2B.4C.8D.16参考答案:C3. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案:D4. OpenMP的缺点不包括_。A.常见并行结构的表达并

2、不总可行B.局部性处理不易C.不易编写多核单核通用程序D.性能控制不易参考答案:C5. CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是_。CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是_。A.可利用cache时间局部性优化性能B.可利用cache空间局部性优化性能C.可通过矩阵分片优化性能D.访存方面无优化可能参考答案:B6. MPI的通信是( )。A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案:C7. 两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是( )。A.先将两个矩阵读入cac

3、he再进行乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案:C8. 当问题规模不变时,随着处理器数量增大,加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案:D9. CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案:A10. 一个Neon寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案:A11. 关于消息传递编程的特点,以下说法正确的是( )。A.与共享

4、内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案:C12. 以下超级计算机中,_是SIMD架构。以下超级计算机中,_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案:A13. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递,性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数D.没有特别用意参考答案:C14. 一个SSE寄存器可容纳( )个短整型数。A.2B.4C.8D.16参考答案:C15. 为防止编译器不支持Op

5、enMP,应使用_实现OpenMP代码和普通代码的条件编译。为防止编译器不支持OpenMP,应使用_实现OpenMP代码和普通代码的条件编译。A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案:C16. 除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A17. 一个程序用pthread_create创建了4个线程,此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案:B18.

6、 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B19. 在对互斥量进行解锁时,还会执行( )操作。A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案:C20. 在使用条件变量之前必须对其进行_。在使用条件变量之前必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:A21. 并行计算还主要用于国防、工程研究等领域,这种说法是_。A.正确的B.错误的参考答案:B22. 采用MPI主从模型解决矩阵每行排序问题,主进程每

7、次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B23. 在分布式内存架构编程中,进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案:D24. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参考答案:C25. OpenMP中指定多线程中只有主线程执行代码块的指令是_。A.omp single

8、B.omp masterC.omp slaveD.omp parallel参考答案:B26. OpenMP默认采用_循环划分策略。A.静态B.固定C.动态D.自适应参考答案:A27. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D28. 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案:A29. 循环需满足特

9、定条件才能进行OpenMP并行化,下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案:B30. 在矩阵乘法之前将第二个矩阵转置,其作用不包括_。A.增大访存空间局部性B.减少运算次数C.优化SIMD访存D.以上皆错参考答案:B31. 对于效率E,下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案:B32. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取

10、单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:B33. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数,后者通过特定APID.前者通过特定API,后者创建线程时传递参数参考答案:D34. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量传输D.缓存传输参考答案:D35. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp

11、 parallelB.omp singleC.omp parallel forD.omp master参考答案:C36. 对天气预报问题,将大气层划分为5*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )对天气预报问题,将大气层划分为5*108个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?( )A.1B.10C.100D.300参考答案:C37. 超立方中相邻节点二进制编号_。A.至少差1位B.

12、至多差1位C.恰好差1位D.差异不固定参考答案:C38. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B39. 利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是( )。A.降低了访存延迟B.隐藏了访存延迟C.利用了cache空间局部性D.利用了cache时间局部性参考答案:C40. 记并行时间为T,串行时间为T&39;,处理器数量为p,并行代价的定义是_。记并行时间为T,串行时间为T,处理器数量为p,并行代价的定义是_。A.pTB.T+TC.p(T-T

13、)D.pT-T参考答案:A41. 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是( )。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案:D42. float a64; for(i=0; iA.8B.16C.32D.64参考答案:B43. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案:D44. 在条件成立时使用pthread_cond_signal( )。A.唤醒等待线程B.解锁互斥量C.加锁互斥量D.唤醒等待线程,该线程重新加锁互斥量参考答案:D45. R*=1.3; G+=1.8; B+=1.2; X*=1.1,此程序片段可进行SIMD并行化吗?( )A.不可以B.可以C.不确定D.以上皆错参考答案:A46. MMX有_个专用

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号