南开大学22春《并行程序设计》离线作业一及答案参考62

上传人:pu****.1 文档编号:493487780 上传时间:2022-10-05 格式:DOCX 页数:14 大小:14.61KB
返回 下载 相关 举报
南开大学22春《并行程序设计》离线作业一及答案参考62_第1页
第1页 / 共14页
南开大学22春《并行程序设计》离线作业一及答案参考62_第2页
第2页 / 共14页
南开大学22春《并行程序设计》离线作业一及答案参考62_第3页
第3页 / 共14页
南开大学22春《并行程序设计》离线作业一及答案参考62_第4页
第4页 / 共14页
南开大学22春《并行程序设计》离线作业一及答案参考62_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《南开大学22春《并行程序设计》离线作业一及答案参考62》由会员分享,可在线阅读,更多相关《南开大学22春《并行程序设计》离线作业一及答案参考62(14页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春并行程序设计离线作业一及答案参考1. SSE intrinsics_mm_store_sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C2. n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法( )。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案:A3. n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。n个数求和的串行程序,通过一个循环将每个数累

2、加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是_。A.负载不均B.通信开销大C.CPU空闲等待严重D.sum累加产生竞争条件,导致结果错误参考答案:D4. 下列哪门课程不是并行程序设计的先导课?下列哪门课程不是并行程序设计的先导课?A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D5. SIMD并行化时遇到对齐问题,高效的处理方法是( )。A.直接使用SIMD不对齐访存指令B.将数据拷贝到对齐的内存地址C.重写算法保证对齐访问D.串行处理到对齐边界,然后进行SIMD对齐访存参考答案:D6. 每个AVX寄存器宽度为_位。A.32

3、B.64C.128D.256参考答案:D7. 我国最早夺得全球超级计算机计算能力冠军的是( )。A.天河1号B.天河1AC.天河2号D.神威.太湖之光参考答案:B8. 下面哪个问题相对而言更不适合进行数据并行_。下面哪个问题相对而言更不适合进行数据并行_。A.求和B.排序C.向量加法D.矩阵乘法参考答案:B9. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128fC._m128dD._m128i参考答案:C10. _执行pthread_sem_post操作,当前线程会唤醒阻塞线程。_执行pth

4、read_sem_post操作,当前线程会唤醒阻塞线程。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案:B11. 1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X0*1.3;G=X1*1.8;B=X2*1.1;这两个程序片段哪个进行向量化效率更高?( )A.1B.2C.不确定D.以上皆错参考答案:B12. 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则

5、应对矩阵乘加计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案:B13. 采用多核、众核技术提升CPU性能,相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案:B14. OpenMP编译指示的作用范围是( )。A.其后一个语句B.其后连续语句C.其后直到函数结束D.整个函数参考答案:A15. pthread_rwlock_rdlock是对读写锁进行_操作。A.加锁B.解锁C.加读琐D.加写锁参考答案:C16. 在共享内存架构编程中,线程间不能通过_进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量参考答案:

6、B17. 使用( )无法直接实现“主线程唤醒4个从线程去执行任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案:C18. 单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案:B19. 我国最近一次夺得全球超级计算机计算能力冠军的是_。A.天河1号B.天河1AC.天河2号D.神威太湖之光参考答案:D20. OpenMP是( )的一个常见替代。A.SSEB.MPIC.PthreadD.CUDA参考答案:C21. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.3

7、2B.64C.128D.256参考答案:D22. 关于障碍机制,下面说法错误的是_。关于障碍机制,下面说法错误的是_。A.会导致快速线程阻塞,不应使用B.在需要强制线程步调一致时,应使用C.可用互斥量机制实现D.属于一种组通信参考答案:A23. Pthread不支持( )。A.创建并发执行线程B.同步C.非显式通信D.自动并行化参考答案:D24. 对这样的循环for(i=0;iA.循环划分B.循环消除C.循环展开D.以上皆错参考答案:C25. 将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是( )。A.外层存在,内层不存在B.外层不存在,内层存在C.两层都不存

8、在D.两层都存在参考答案:A26. 在条件成立时使用pthread_cond_signal( )。A.唤醒等待线程B.解锁互斥量C.加锁互斥量D.唤醒等待线程,该线程重新加锁互斥量参考答案:D27. 两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是( )。A.先将两个矩阵读入cache再进行乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案:C28. 当问题规模不变时,随着处理器数量增大,加速比_。A.必然增大B.必然减小C.必然不变D.以上皆错参考答案:D29. 以下( )是MPI基本原语。A.MPI_barrierB.MPI_Comm_n

9、umprocsC.MPI_Comm_rankD.MPI_Comm_Send参考答案:C30. 传统科学和工程实验相对于计算机并行仿真的劣势不包括_。传统科学和工程实验相对于计算机并行仿真的劣势不包括_。A.成本太高B.结果不准确C.时间太长D.太危险参考答案:B31. 在使用条件变量时,还需配套使用一个( )。A.互斥量B.信号量C.障碍D.自旋锁参考答案:A32. 控制流语句进行SIMD并行化很困难的原因是控制流语句导致( )。A.连续数据执行不同指令B.连续数据执行相同指令C.同一数据执行不同指令D.同一数据执行相同指令参考答案:A33. 和一对多广播对应的组通信操作是( )。A.多对一收

10、集B.多对多收集C.多对一归约D.多对多归约参考答案:C34. OpenMP循环并行指令是( )。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C35. for (i=2; iA.存在B.不存在C.不确定D.以上皆错参考答案:A36. OpenMP默认采用_循环划分策略。A.静态B.固定C.动态D.自适应参考答案:A37. 对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是_。对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算

11、出了结果矩阵的一个元素,这种说法是_。A.正确的B.错误的参考答案:B38. 并行计算的新兴应用领域不包括_。A.制药B.数字媒体C.国防D.游戏参考答案:C39. pthread_create函数中线程函数指针的正确类型是( )。A.void(void*)B.void*(void*)C.int(void)D.void*(*)(void*)参考答案:D40. FORTRAN语言存储二维数组采取_。FORTRAN语言存储二维数组采取_。A.行主次序存储B.列主次序存储C.交错式存储D.对角线存储参考答案:B41. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任

12、务相对于每次发送1行的优点是( )。A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲参考答案:B42. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参考答案:C43. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_。A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案:D44. 采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A45. OpenMP中指定多线

13、程中只有主线程执行代码块的指令是_。A.omp singleB.omp masterC.omp slaveD.omp parallel参考答案:B46. 关于OpenMP循环并行程序的编写,下列说法中正确的是_。A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度策略代码D.程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么参考答案:D47. 对单精度浮点计算,SSE最高实现_路并行。对单精度浮点计算,SSE最高实现_路并行。A.2B.4C.8D.16参考答案:B48. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D49. SSE intrinsics_mm_load_ss命令的功能是( )。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号