南开大学21春《并行程序设计》在线作业三满分答案54

上传人:pu****.1 文档编号:508511966 上传时间:2023-09-19 格式:DOCX 页数:15 大小:15.22KB
返回 下载 相关 举报
南开大学21春《并行程序设计》在线作业三满分答案54_第1页
第1页 / 共15页
南开大学21春《并行程序设计》在线作业三满分答案54_第2页
第2页 / 共15页
南开大学21春《并行程序设计》在线作业三满分答案54_第3页
第3页 / 共15页
南开大学21春《并行程序设计》在线作业三满分答案54_第4页
第4页 / 共15页
南开大学21春《并行程序设计》在线作业三满分答案54_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《南开大学21春《并行程序设计》在线作业三满分答案54》由会员分享,可在线阅读,更多相关《南开大学21春《并行程序设计》在线作业三满分答案54(15页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春并行程序设计在线作业三满分答案1. 在使用条件变量之后必须对其进行_。在使用条件变量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案:D2. 记并行时间为T,串行时间为T&39;,处理器数量为p,效率为E,则代价最优的定义是( )。A.pT=TB.E=(1)C.E=pT/TD.E=T/pT参考答案:B3. SSE intrinsics_mm_store_sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C4. CPU cache大小为32KB,64*64的两个矩阵进行加法计算

2、,下面说法正确的是_。CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是_。A.可利用cache时间局部性优化性能B.可利用cache空间局部性优化性能C.可通过矩阵分片优化性能D.访存方面无优化可能参考答案:B5. CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A6. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B

3、)后,C中元素为( )A.A1 A2 A3 A4B.A2 A1 A4 A3C.A3 A4 A1 A2D.A4 A3 A2 A1参考答案:D7. 并行计算的新兴应用领域不包括_。A.制药B.数字媒体C.国防D.游戏参考答案:C8. Pthread不支持( )。A.创建并发执行线程B.同步C.非显式通信D.自动并行化参考答案:D9. 以下超级计算机中,_是SIMD架构。以下超级计算机中,_是SIMD架构。A.CRAY-1B.天河1AC.天河2号D.神威太湖之光参考答案:A10. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_前缀。采用划分子矩阵技术优化矩阵乘法CUDA程序,子

4、矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案:C11. 对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案:C12. 在下列应用中,SIMD最不适合_。在下列应用中,SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案:D13. SSE指令移动单精度浮点数,不能实现_。SSE指令移动单精度浮点数,不能实现_。A.将64位数据移动到SSE寄存

5、器高位B.将64位数据移动到SSE寄存器低位C.将32位数据移动到SSE寄存器指定位置D.在两个SSE寄存器高/低64位间移动参考答案:C14. MPI不包括的通信类别是_。MPI不包括的通信类别是_。A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案:D15. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案:C16. 在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分( )的数据并行策略。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:C17. 大型医

6、院每天的X光片、CT等医学图像的分析需要_。大型医院每天的X光片、CT等医学图像的分析需要_。A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案:B18. CUDA的优点不包括_。CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A19. MPI_Send和MPI_recv是通过( )区分消息。A.端口号B.消息名C.消息标签D.消息哈希参考答案:C20. 两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部

7、性参考答案:A21. GPU相对于其他众核产品的优势不包括( )。A.平台普及B.有CUDA这样易学的开发工具C.性价比高D.由英伟达公司一家把控参考答案:D22. 华尔街是世界上超级计算机最密集的区域之一,原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案:D23. 现代CPU中都具有指令乱序执行功能,其目的不包括_。现代CPU中都具有指令乱序执行功能,其目的不包括_。A.消除指令依赖,更充分利用多流水线B.提高cache效率C.改变计算结果D.消除资源冲突参考答案:C24. 采用MPI主从模型解决矩阵每行排序问题,主进

8、程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是_。A.更不利于负载均衡B.增大了通信开销C.提高了计算次数D.增加了从进程空闲参考答案:A25. 两个n*n的矩阵相乘,将所有n2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分的数据并行。A.输入数据B.中间结果C.输出数据D.临时数据参考答案:B26. SIMD并行模式是将多个_运算打包并发执行。A.不同B.相同C.混合D.依赖参考答案:B27. 下列哪门课程不是并行程序设计的先导课?下列哪门课程不是并行程序设计的先导课?A.计算机概论B.高级语言程序设计C.计算机体系结构D.

9、数据库系统参考答案:D28. 超级计算机制造越来越关注的一个新的指标是_。超级计算机制造越来越关注的一个新的指标是_。A.计算能力B.存储能力C.占地面积D.功耗参考答案:D29. 单程序多数据流模式是针对_架构的。A.SISDB.SIMDC.MISDD.MIMD参考答案:D30. 编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘加计算的循环进行( )路循环展开。A.2B.4C.8D.16参考答案:B31. pthread_create函数中设置一个参数为“线程函数参数”的原因是_。A.它调用线程函数时可直接传递,性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户

10、程序调用,只能采用这种方式由系统代为传递参数D.没有特别用意参考答案:C32. 和一对多广播对应的组通信操作是( )。A.多对一收集B.多对多收集C.多对一归约D.多对多归约参考答案:C33. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D34. 采用多核、众核技术提升CPU性能,相对于单核的优势不包括_。A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案:B35. 在对互斥量进行解锁时,还会执行( )操作。A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案:C36.

11、 创建线程时,我们通过( )将线程号分别传递给每个线程。A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函数参数”参数参考答案:D37. MPI组通信操作不包括哪类_。MPI组通信操作不包括哪类_。A.通信B.同步C.点对点D.计算参考答案:C38. 在共享内存架构编程中,线程间不能通过_进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量参考答案:B39. 除了用于解决竞争条件外,互斥量还可用于( )。A.解决共享资源竞争的问题B.解决并发度低的问题C.解决通信开销大的问题D.解决负载不均的问题参考答案:A40. 传统科学和工程实验相对于计算机并行仿真

12、的劣势不包括_。传统科学和工程实验相对于计算机并行仿真的劣势不包括_。A.成本太高B.结果不准确C.时间太长D.太危险参考答案:B41. 在使用互斥量之前必须对其进行( )。A.初始化B.加锁C.解锁D.销毁参考答案:A42. 在使用条件变量时,还需配套使用一个( )。A.互斥量B.信号量C.障碍D.自旋锁参考答案:A43. 为缓解存储和CPU之间的性能差距,常见的技术手段不包括_。A.利用cache降低访存延迟B.利用多线程隐藏访存延迟C.利用预取隐藏访存延迟D.采用大容量内存提高访问速度参考答案:D44. 关于并行代价,下面描述正确的是_。关于并行代价,下面描述正确的是_。A.总是小于串行

13、时间B.总是大于并行时间C.总是与并行时间渐进相等D.以上皆错参考答案:D45. 将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为( )。A.(1)B.(logt)C.(t)D.(tlogt)参考答案:B46. SSE intrinsics_mm_loadu_ps命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:B47. 四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷的4道题,这是一种_任务划分方法。A.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号