南开大学22春《并行程序设计》在线作业1答案参考17

文档格式：DOCX| 12 页|大小 14.08KB|积分 10|2022-04-15 发布|文档ID：75541269

下载文档

下载文档到电脑，查找使用更方便还剩页未读，继续阅读>>

侵权申诉举报

1 / 12

此文档下载收益归作者所有下载文档

版权提示

文本预览

常见问题

南开大学22春《并行程序设计》在线作业1答案参考1. 为了实现向量计算，SIMD架构还需提供____为了实现向量计算，SIMD架构还需提供____A.更大的内存容量B.更快的内存传输C.更宽的寄存器D.更快的网络传输参考答案：C2. n个元素排序问题，如果只能通过元素比较交换构造算法，则n个处理器的并行排序算法达到( )的运行时间才是代价最优的A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案：A3. SSE是_____平台的SIMD架构A.x86B.POWERC.SPARCD.ARM参考答案：A4. 关于OpenMP循环并行程序的编写，下列说法中正确的是_____A.程序员需要编写线程创建和管理代码B.程序员需要编写循环划分代码C.程序员需要编写调度策略代码D.程序员只需指出对哪个循环进行并行，循环划分和调度策略是什么参考答案：D5. 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术，则多线程版本_____串行版本A.肯定快于B.肯定慢于C.可能快于D.以上皆错参考答案：B6. GPU相对于其他众核产品的优势不包括( )A.平台普及B.有CUDA这样易学的开发工具C.性价比高D.由英伟达公司一家把控参考答案：D7. 华尔街是世界上超级计算机最密集的区域之一，原因是( )。

A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案：D8. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D9. 循环需满足特定条件才能进行OpenMP并行化，下列哪个条件是错误的?( )A.循环变量应为带符号整数B.终止检测必须是与循环不变量的比较C.循环变量每步递增/递减一个循环不变量D.循环体无进/出控制流参考答案：B10. ____执行pthread_sem_post操作，当前线程会唤醒阻塞线程执行pthread_sem_post操作，当前线程会唤醒阻塞线程A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案：B11. 对于加速比S和处理器数量p，下列说法正确的是_____。

A.有可能S>pB.必然S＜pC.不可能S=pD.两者无关联参考答案：A12. 下列指令集中( )不是SIMD指令集A.SSEB.NeonC.AVXD.EMT64参考答案：D13. pthread_create函数中设置一个参数为“线程函数参数”的原因是_____A.它调用线程函数时可直接传递，性能更优B.它需要预处理之后传递给线程函数C.线程函数不是用户程序调用，只能采用这种方式由系统代为传递参数D.没有特别用意参考答案：C14. 当问题规模不变时，随着处理器数量增大，效率降低的性质对_____成立A.部分并行算法B.代价最优并行算法C.所有并行算法D.以上皆错参考答案：C15. CUDA寄存器是由( )A.Grid中所有线程共享B.一个Block中所有线程共享C.一个Warp中所有线程共享D.每个线程独享参考答案：D16. 为防止编译器不支持OpenMP，应使用____实现OpenMP代码和普通代码的条件编译为防止编译器不支持OpenMP，应使用____实现OpenMP代码和普通代码的条件编译A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案：C17. OpenMP归约指令采用的是一种_____算法。

A.分治B.贪心C.动态规划D.排序参考答案：A18. 以下超级计算机中，____是SIMD架构以下超级计算机中，____是SIMD架构A.CRAY-1B.天河1AC.天河2号D.神威·太湖之光参考答案：A19. 从线程检查主线程是否要求它退出应采用____从线程检查主线程是否要求它退出应采用____A.pthread_joinB.pthread_cancelC.pthread_testcancelD.pthread_exit参考答案：C20. 当前CPU性能提升已从依赖时钟频率提升转为更多依赖____当前CPU性能提升已从依赖时钟频率提升转为更多依赖____A.多核和众核技术B.突破物理局限C.改善散热D.采用新材料参考答案：A21. SSE intrinsics_mm_store_ps命令的功能是( )A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数参考答案：A22. 在下列应用中，SIMD最不适合_____A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D23. 采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在____。

采用划分子矩阵技术优化矩阵乘法CUDA程序，主要思想是访存更多在____A.CPU内存B.GPU显存C.GPU共享内存D.GPU寄存器参考答案：C24. 每个AVX寄存器宽度为____位每个AVX寄存器宽度为____位A.32B.64C.128D.256参考答案：D25. 大型医院每天的X光片、CT等医学图像的分析需要____大型医院每天的X光片、CT等医学图像的分析需要____A.串行计算即可B.高吞吐率计算C.高性能计算D.以上皆错参考答案：B26. 互斥量mutex机制，在任何时刻_____进入它保护的区域A.允许任意数量任意类型的线程B.允许一个读线程任意个写线程C.允许一个写线程任意个读线程D.只允许一个线程参考答案：D27. 两个矩阵相乘，若矩阵规模大于cache大小，则优化访存的可行方法是( )A.先将两个矩阵读入cache再进行乘法B.先转置第一个矩阵再进行乘法C.先转置第二个矩阵再进行乘法D.以上皆错参考答案：C28. 四位助教帮助教授批改300份试卷，试卷共16道题，每位助教负责批改所有试卷的4道题，这是一种____任务划分方法四位助教帮助教授批改300份试卷，试卷共16道题，每位助教负责批改所有试卷的4道题，这是一种____任务划分方法。

A.数据并行B.任务并行C.搜索并行D.预测并行参考答案：B29. OpenMP编译指示的作用范围是( )A.其后一个语句B.其后连续语句C.其后直到函数结束D.整个函数参考答案：A30. 对于效率E，下面描述错误的是( )A.理想并行E=1B.总是在0～1之间C.可能1D.可能随着处理器数量增大趋向于0参考答案：B31. MPI不包括的通信类别是____MPI不包括的通信类别是____A.点对点通信B.数据传输组通信C.计算和数据传输组通信D.加锁解锁通信参考答案：D32. 在使用信号量之前必须对其进行____在使用信号量之前必须对其进行____A.初始化B.加锁C.加1D.销毁参考答案：A33. 当处理器数量不变时，随着问题规模增大，加速比____当处理器数量不变时，随着问题规模增大，加速比____A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案：C34. 在对互斥量进行解锁时，还会执行( )操作A.互斥量初始化B.互斥量销毁C.唤醒阻塞线程D.以上皆错参考答案：C35. 两个n*n的矩阵相乘，将所有n^2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分____的数据并行。

两个n*n的矩阵相乘，将所有n^2个乘法计算划分给不同进程，再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素，这是一种划分____的数据并行A.输入数据B.中间结果C.输出数据D.临时数据参考答案：B36. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案：D37. 采用MPI主从模型解决矩阵每行排序问题，主进程不断向每个从进程发送任务、接收结果，则它从从进程接收结果时，以下哪种方式更好?( )A.按编号顺序依次从从进程接收结果B.按编号逆序依次从从进程接收结果C.按编号顺序、逆序交替从从进程接收结果D.使用MPI_ANY_SOURCE和MPI_ANY_TAG参考答案：D38. MPI的通信是( )A.无类型传输B.弱类型传输C.强类型传输D.以上皆错参考答案：C39. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D40. 矩阵每行排序的问题更适合使用MPI的_____编程模型。

A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：D41. 对奇偶转置排序进行OpenMP并行化，第一种策略是直接对内层循环使用omp parallel for指令，第二种策略是对外层循环使用omp parallel指令，对内层循环使用omp for指令，后者相对于前者的优点是_____A.保持了数据依赖B.消除了大量线程创建、销毁开销C.有利于负载均衡D.减少了线程间交互参考答案：B42. 任务依赖图中权重之和最长的路径称为( )A.最大任务B.关键路径C.平均并发度D.最短路径参考答案：B43. OpenMP是___的一个常见替代OpenMP是___的一个常见替代A.SSEB.MPIC.PthreadD.CUDA参考答案：C44. 第一款桌面多核CPU是( )发布的A.IntelB.AMDC.IBMD.SUN参考答案：A45. 下面哪个问题相对而言更不适合进行数据并行____下面哪个问题相对而言更不适合进行数据并行____A.求和B.排序C.向量加法D.矩阵乘法参考答案：B46. Pthread不支持( )A.创建并发执行线程B.同步C.非显式通信D.自动并行化参考答案：D47. SSE数据移动指令分类不包括____。

SSE数据移动指令分类不包括____A.对齐传输B.未对齐传输C.标量传输D.缓存传输参考答案：D48. for (i=0;iA.可完全向量化B.不可向量化C.不确定D.可部分向量化参考答案：D49. 并行计算的新兴应用领域不包括_____A.制药B.数字媒体C.国防D.游戏参考答案：C50. 每个SSE寄存器宽度为____位每个SSE寄存器宽度为____位A.32B.64C.128D.256参考答案：C。

点击阅读更多内容