南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80

资源描述

《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80》由会员分享，可在线阅读，更多相关《南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80（12页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋并行程序设计复习考核试题库答案参考1. n个数求和的问题，使用n个处理器的并行算法达到了logn的运行时间，则算法( )。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案：A2. 一个AVX寄存器最多存放_个单精度浮点数。一个AVX寄存器最多存放_个单精度浮点数。A.2B.4C.8D.16参考答案：C3. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案：D4. OpenMP的缺点不包括_。A.常见并行结构的表达并

2、不总可行B.局部性处理不易C.不易编写多核单核通用程序D.性能控制不易参考答案：C5. CPU cache大小为32KB，64*64的两个矩阵进行加法计算，下面说法正确的是_。CPU cache大小为32KB，64*64的两个矩阵进行加法计算，下面说法正确的是_。A.可利用cache时间局部性优化性能B.可利用cache空间局部性优化性能C.可通过矩阵分片优化性能D.访存方面无优化可能参考答案：B6. MPI的通信是( )。A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案：C7. 两个矩阵相乘，若矩阵规模大于cache大小，则优化访存的可行方法是( )。A.先将两个矩阵读入cac

3、he再进行乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案：C8. 当问题规模不变时，随着处理器数量增大，加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案：D9. CPU时钟频率1GHz，每个时钟周期两个计算单元可执行4条指令，内存延迟125ns，进行向量点积运算，无cache情况下，计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案：A10. 一个Neon寄存器最多存放_个双精度浮点数。A.2B.4C.8D.16参考答案：A11. 关于消息传递编程的特点，以下说法正确的是( )。A.与共享

4、内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案：C12. 以下超级计算机中，_是SIMD架构。以下超级计算机中，_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案：A13. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递，性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用，只能采用这种方式由系统代为传递参数D.没有特别用意参考答案：C14. 一个SSE寄存器可容纳( )个短整型数。A.2B.4C.8D.16参考答案：C15. 为防止编译器不支持Op

5、enMP，应使用_实现OpenMP代码和普通代码的条件编译。为防止编译器不支持OpenMP，应使用_实现OpenMP代码和普通代码的条件编译。A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案：C16. 除了用于解决竞争条件外，互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案：A17. 一个程序用pthread_create创建了4个线程，此时系统中属于这个程序的共有_线程。A.4B.5C.6D.7参考答案：B18.

6、采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B19. 在对互斥量进行解锁时，还会执行( )操作。A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案：C20. 在使用条件变量之前必须对其进行_。在使用条件变量之前必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：A21. 并行计算还主要用于国防、工程研究等领域，这种说法是_。A.正确的B.错误的参考答案：B22. 采用MPI主从模型解决矩阵每行排序问题，主进程每

7、次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是_。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B23. 在分布式内存架构编程中，进程间不能( )。A.进行通信B.进行同步C.发送和接收消息D.通过读写变量交换数据参考答案：D24. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参考答案：C25. OpenMP中指定多线程中只有主线程执行代码块的指令是_。A.omp single

8、B.omp masterC.omp slaveD.omp parallel参考答案：B26. OpenMP默认采用_循环划分策略。A.静态B.固定C.动态D.自适应参考答案：A27. SIMD并行化时遇到对齐问题，高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界，然后进行SIMD对齐访存参考答案：D28. 两个矩阵相乘，将矩阵划分为固定大小的子矩阵，变元素运算为子矩阵运算，是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案：A29. 循环需满足特

9、定条件才能进行OpenMP并行化，下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案：B30. 在矩阵乘法之前将第二个矩阵转置，其作用不包括_。A.增大访存空间局部性B.减少运算次数C.优化SIMD访存D.以上皆错参考答案：B31. 对于效率E，下面描述错误的是( )。A.理想并行E=1B.总是在01之间C.可能1D.可能随着处理器数量增大趋向于0参考答案：B32. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取

10、单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案：B33. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数，后者通过特定APID.前者通过特定API，后者创建线程时传递参数参考答案：D34. SSE数据移动指令分类不包括_。SSE数据移动指令分类不包括_。A.对齐传输B.未对齐传输C.标量传输D.缓存传输参考答案：D35. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp

11、 parallelB.omp singleC.omp parallel forD.omp master参考答案：C36. 对天气预报问题，将大气层划分为5*108个网格单元，每个时间步每个网格需200个浮点运算，时间间隔设置为10分钟，计算10天内大气运动，100MFlops计算能力的计算机需要多少天?( )对天气预报问题，将大气层划分为5*108个网格单元，每个时间步每个网格需200个浮点运算，时间间隔设置为10分钟，计算10天内大气运动，100MFlops计算能力的计算机需要多少天?( )A.1B.10C.100D.300参考答案：C37. 超立方中相邻节点二进制编号_。A.至少差1位B.

12、至多差1位C.恰好差1位D.差异不固定参考答案：C38. 单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案：B39. 利用cache line一次读取多个数据字的机制优化程序访存性能，其机理是( )。A.降低了访存延迟B.隐藏了访存延迟C.利用了cache空间局部性D.利用了cache时间局部性参考答案：C40. 记并行时间为T，串行时间为T&39;，处理器数量为p，并行代价的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行代价的定义是_。A.pTB.T+TC.p(T-T

13、)D.pT-T参考答案：A41. 将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是( )。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案：D42. float a64; for(i=0; iA.8B.16C.32D.64参考答案：B43. 记并行时间为T，串行时间为T&39;，处理器数量为p，则额外开销应如何计算?( )A.T-TB.T-TC.pTD.pT-T参考答案：D44. 在条件成立时使用pthread_cond_signal( )。A.唤醒等待线程B.解锁互斥量C.加锁互斥量D.唤醒等待线程，该线程重新加锁互斥量参考答案：D45. R*=1.3; G+=1.8; B+=1.2; X*=1.1，此程序片段可进行SIMD并行化吗?( )A.不可以B.可以C.不确定D.以上皆错参考答案：A46. MMX有_个专用

展开阅读全文

南开大学21秋《并行程序设计》复习考核试题库答案参考套卷80

最新文档