南开大学22春《并行程序设计》离线作业1答案参考94

资源描述

《南开大学22春《并行程序设计》离线作业1答案参考94》由会员分享，可在线阅读，更多相关《南开大学22春《并行程序设计》离线作业1答案参考94（12页珍藏版）》请在金锄头文库上搜索。

1、南开大学22春并行程序设计离线作业1答案参考1. 对于并行程序设计，下面说法错误的是_。对于并行程序设计，下面说法错误的是_。A.天然具有复杂性B.算法移植困难C.软件开发标准环境发展相对之后D.不应发展这个方向参考答案：D2. OpenMP不会自动地在_位置设置barrier。OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案：C3. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案：C4. 关于并行代价，下面描述正确的是_。A.总是

2、小于串行时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案：D5. 一个SSE寄存器可容纳( )个短整型数。A.2B.4C.8D.16参考答案：C6. 当条件判断_时，控制流语句SIMD并行化可能达到较好效果。A.绝大部分结果为真B.绝大部分结果为假C.全部结果都一样D.绝大部分结果都一样参考答案：D7. MPI原址收发各一条消息的API是_。A.MPI_SendrecvB.MPI_SendC.MPI_RecvD.MPI_Sendrecv_Replace参考答案：D8. 循环需满足特定条件才能进行OpenMP并行化，下列哪个条件是错误的?( )A.循环变量应为带符号整数B.

3、终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案：B9. 采用划分子矩阵方法实现矩阵乘法，在进行SSE并行化时，是对(由外至内数)第_层循环进行循环展开然后向量化。采用划分子矩阵方法实现矩阵乘法，在进行SSE并行化时，是对(由外至内数)第_层循环进行循环展开然后向量化。A.3B.4C.5D.6参考答案：D10. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案：D11. SIMD并行化时遇到对齐问题，高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷

4、贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界，然后进行SIMD对齐访存参考答案：D12. Pthread支持_。A.线程间同步B.发现数据依赖C.自动线程化D.自动任务分配参考答案：A13. CPU cache大小为32KB，64*64的两个矩阵进行加法计算，下面说法正确的是_。CPU cache大小为32KB，64*64的两个矩阵进行加法计算，下面说法正确的是_。A.可利用cache时间局部性优化性能B.可利用cache空间局部性优化性能C.可通过矩阵分片优化性能D.访存方面无优化可能参考答案：B14. SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制

5、整数imm803，若imm81=j则表示( )。A.将第一个源寄存器的第j个元素放在目标寄存器位置1B.将第二个源寄存器的第j个元素放在目标寄存器位置1C.将第一个源寄存器的第1个元素放在目标寄存器位置1D.将第二个源寄存器的第1个元素放在目标寄存器位置1参考答案：A15. 现代CPU中都具有指令乱序执行功能，其目的不包括_。现代CPU中都具有指令乱序执行功能，其目的不包括_。A.消除指令依赖，更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答案：C16. 两个矩阵相乘，若矩阵规模大于cache大小，则优化访存的可行方法是( )。A.先将两个矩阵读入cache再进行

6、乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案：C17. OpenMP的缺点不包括_。A.常见并行结构的表达并不总可行B.局部性处理不易C.不易编写多核单核通用程序D.性能控制不易参考答案：C18. OpenMP中指定多线程中只有主线程执行代码块的指令是_。A.omp singleB.omp masterC.omp slaveD.omp parallel参考答案：B19. 在超市的顾客购买商品记录中统计一些商品组合的购买频率，将购买频率(商品组合)划分给不同进程，这是一种划分( )的数据并行策略。A.输入数据B.中间结果C.输出数据D.临时数据参考答案：C

7、20. 关于障碍机制，下面说法错误的是_。关于障碍机制，下面说法错误的是_。A.会导致快速线程阻塞，不应使用B.在需要强制线程步调一致时，应使用C.可用互斥量机制实现D.属于一种组通信参考答案：A21. 以下( )是MPI基本原语。A.MPI_barrierB.MPI_Comm_numprocsC.MPI_Comm_rankD.MPI_Comm_Send参考答案：C22. n个数求和的串行程序，通过一个循环将每个数累加到全局变量sum中，其多线程版本简单将循环范围改变为每个线程负载的范围，存在的问题是_。n个数求和的串行程序，通过一个循环将每个数累加到全局变量sum中，其多线程版本简单将循环范

8、围改变为每个线程负载的范围，存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件，导致结果错误参考答案：D23. 对于多线程各自进行本地运算，然后由主线程汇总结果的模式，下面说法正确的是( )。A.在同构核心上，线程运行速度一样，主线程无需等待，直接汇总结果即可B.线程运行速度可能不一致，必须采用同步保证主线程汇总正确结果C.太多本地运算，不能体现并行效果，不是好的模式D.主线程汇总结果在性能上必然不如多线程并行汇总结果参考答案：B24. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的Neon

9、程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B25. 关于消息传递编程的特点，以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案：C26. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化，则该循环执行完毕后，就计算出了结果矩阵的一个元素，这种说法是_。A.正确的B.错误的参考答案：B27. SSE intrinsics _mm_store_s

10、s命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案：C28. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案：A29. CUDA寄存器是由( )。A.Grid中所有线程共享B.一个Block中所有线程共享C.一个Warp中所有线程共享D.每个线程独享参考答案：D30. OpenMP是_的一个常见替代。OpenMP是_的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案：C31. 对天气预报问题，将大气层划分为5*108个网格单元，每个时间步每个网格需200个

11、浮点运算，时间间隔设置为10分钟，计算10天内大气运动，100MFlops计算能力的计算机需要多少天?( )对天气预报问题，将大气层划分为5*108个网格单元，每个时间步每个网格需200个浮点运算，时间间隔设置为10分钟，计算10天内大气运动，100MFlops计算能力的计算机需要多少天?( )A.1B.10C.100D.300参考答案：C32. 两个n*n的矩阵相乘，将所有n2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案：B33. OpenMP中多线程间是一种( )关系。A.

12、主从B.分组C.对等D.竞争参考答案：A34. 采用多核、众核技术提升CPU性能，相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案：B35. 采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案：B36. 除了用于解决竞争条件外，互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案：A37. pthread_jo

13、in的作用是( )。A.强制终止指定线程B.检测指定线程是否结束C.等待指定线程结束才返回D.向指定线程发送数据参考答案：C38. 为缓解存储和CPU之间的性能差距，常见的技术手段不包括_。A.利用cache降低访存延迟B.利用多线程隐藏访存延迟C.利用预取隐藏访存延迟D.采用大容量内存提高访问速度参考答案：D39. SSE intrinsics _mm_store_pd命令的功能是_。SSE intrinsics _mm_store_pd命令的功能是_。A.对齐向量存单精度浮点数B.未对齐标量存单精度浮点数C.对齐向量存双精度浮点数D.未对齐标量存双精度浮点数参考答案：C40. OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。OpenMP程序和Pthread程序中线程获得自身编号的方式分别是_。A.两者均为创建线程时传递参数B.两者均通过特定APIC.前者创建线程时传递参数，后者通过特定APID.前者通过特定API，后者创建线程时传递参数参考答案：D41. 若SIMD并行化时遇到对齐问题，下列说法正确的是( )。A.只能使用不对齐访存指令B.不能进行SIMD并行化C.对齐开销可能

展开阅读全文

南开大学22春《并行程序设计》离线作业1答案参考94

最新文档