答案来源:雅宝题库交流网(www.ybaotk.com)-[南开大学]20秋学期(1109、1803、1809、1903、1909、2003、2009 )《并行程序设计》在线作业拿答案加微信:1144766066
试卷总分 拿答案加微信:100 得分 拿答案加微信:100
第1题,SSE intrinsics _mm_store_ps命令的功能是____。
A、对齐向量存单精度浮点数
B、未对齐向量存单精度浮点数
C、对齐标量存单精度浮点数
D、未对齐标量存单精度浮点数
正确答案:
第2题,for (i=0; i1 ; i+=1) { L = A[i+0] - B[i+0]; D = D + abs(L); },此循环____。
A、可完全向量化
B、不可向量化
C、不确定
D、可部分 拿答案加微信向量化
正确答案:
第3题,对这样的循环for (i=0; i100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是____。
A、循环划分 拿答案加微信
B、循环消除
C、循环展开
D、以上皆错
正确答案:
第4题,MMX有____个专用寄存器。
A、4
B、8
C、1
D、32
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A、创建和管理线程代码
B、循环划分 拿答案加微信给线程的代码
C、找出数据依赖的代码
D、线程同步的代码
正确答案:
第 题,创建线程时,我们通过____将线程号分 拿答案加微信别传递给每个线程。
A、全局变量
B、局部变量
C、动态分 拿答案加微信配变量
D、pthread_create的& uot;线程函数参数& uot;参数
正确答案:
第1题,下列哪项不是这门课程的目标?
A、学会肯定能优化程序性能的方法
B、学会用并行思维思考问题
C、学会常用的并行编程工具
D、理解软件到并行架构的映射
正确答案:
第8题,编写n个数求和的OpenMP程序,最高效的方法是____。
A、多线程直接并发累加到共享变量
B、将累加操作设置为临界区
C、在累加操作前设置障碍
D、采用归约指令
正确答案:
第9题,静态线程编程模式的缺点是____。
A、线程管理开销高
B、系统资源利用率低
C、线程负载不均
D、线程通信开销高
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是____。
A、更有利于负载均衡
B、减少了通信开销
C、降低了计算次数
D、减少了从进程空闲
正确答案:
第11题,MPI收发各一条消息的API是_____。
A、MPI_Sendrecv
B、MPI_Send
C、MPI_Recv
D、MPI_Replace
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),两个矩阵相乘,若矩阵规模大于cache大小,则优化访存的可行方法是____。
A、先将两个矩阵读入cache再进行乘法
B、先转置第一个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错
正确答案:
第13题,多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
A、读取x存在数据依赖,不能并发进行
B、累加顺序被改变,结果是错误的
C、加法操作是简单运算,雅需同步
D、加法操作不是原子操作,需要同步保证数据依赖
正确答案:
第14题,记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
A、T'-T
B、T-T'
C、pT
D、pT-T'
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。
A、2
B、4
C、8
D、1
正确答案:
第1 题,在下面问题中,SIMD并行更适合____。
A、搜索
B、排序
C、矩阵乘法
D、构建二叉排序树
正确答案:
第11题,记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A、pT'=T
B、E=Θ(1)
C、E=pT/T'
D、E=T'/pT
正确答案:
第18题,对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,还需进行SIMD寄存器中几个元素的___操作才能得到结果矩阵的一个元素。
A、排列
B、交换
C、广播
D、归约
正确答案:
第19题,对于条件变量,下列说法错误的是____。
A、可以用互斥量实现相同功能
B、不能用互斥量实现相同功能
C、较之互斥量方案节省资源
D、较之互斥量方案代码更简洁
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),pthread_join的作用是____。
A、强制终止指定线程
B、检测指定线程是否结束
C、等待指定线程结束才返回
D、向指定线程发送数据
正确答案:
第21题,以下____是MPI基本原语。
A、MPI_barrier
B、MPI_Comm_numprocs
C、MPI_Comm_rank
D、MPI_Comm_Send
正确答案:
第22题,n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A、O(logn)
B、O(n)
C、O(nlogn)
D、O(n^2)
正确答案:
第23题,以下超级计算机中,____不是SIMD架构。
A、CDCSTAR-100
B、151
C、银河
D、天河1号
正确答案:
第24题,下面哪种架构最适合数据并行____。
A、SISD
B、SIMD
C、MISD
D、MIMD
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。
A、循环变量应为带符号整数
B、终止检测必须是与循环不变量的比较
C、循环变量每步递增/递减一个循环不变量
D、循环体雅进/出控制流
正确答案:
第2 题,使用____雅法直接实现& uot;主线程唤醒4个从线程去执行任务& uot;。
A、1个信号量
B、障碍
C、1个互斥量
D、4个互斥量
正确答案:
第21题,OpenMP编译指示的作用范围是____。
A、其后一个语句
B、其后连续语句
C、其后直到函数结束
D、整个函数
正确答案:
第28题,OpenMP不能实现的是____。
A、负责创建和管理线程
B、隐藏栈管理
C、提供同步机制
D、自动并行化
正确答案:
第29题,采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A、按编号顺序依次从从进程接收结果
B、按编号逆序依次从从进程接收结果
C、按编号顺序、逆序交替从从进程接收结果
D、使用MPI_ANY_SOURCE和MPI_ANY_TAG
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),对双精度浮点计算,AVX最高实现____路并行。
A、2
B、4
C、8
D、1
正确答案:
第31题,对于效率E,下面描述错误的是____。
A、理想并行E=1
B、总是在0~1之间
C、可能1
D、可能随着处理器数量增大趋向于0
正确答案:
第32题,对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
A、它最后执行
B、外层循环中没有计算操作
C、是随意选择的
D、它的连续循环步是对不同元素进行相同运算
正确答案:
第33题,在分 拿答案加微信布式内存架构编程中,进程间不能____。
A、进行通信
B、进行同步
C、发送和接收消息
D、通过读写变量交换数据
正确答案:
第34题,新一代GPU重点提供的新特性不包括____。
A、新型高速显存
B、GPU间直接高速互联
C、自动并行化
D、人工智能计算专门优化
正确答案:
第35题,在矩阵乘法的串行程序中,对____部分 拿答案加微信进行向量化收益最大。
A、初始化
B、第二个矩阵转置循环
C、矩阵元素乘-加计算的循环
D、结果输出
正确答案:
第3 题,采用划分 拿答案加微信子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘-加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
A、n
B、t
C、n-t
D、n/t
正确答案:
第31题,关于消息传递编程的特点,以下说法正确的是____。
A、与共享内存一样有竞争条件
B、编程简单
C、需程序员考虑局部性
D、雅需考虑进程间通信
正确答案:
第38题,华尔街是世界上超级计算机最密集的区域之一,原因是____。
A、金融巨头支付得起
B、与超算制造商有良好合作
C、海量交易需要很高安全性
D、海量交易处理需要并行计算
正确答案:
第39题,pthread_create函数中线程函数指针的正确类型是____。
A、void (void *)
B、void * (void *)
C、int (void)
D、void * (*)(void *)
正确答案:
第40题,多线程是____架构下的并行模式。
A、MIMD
B、共享内存
C、分 拿答案加微信布式内存
D、分 拿答案加微信离式地址空间
正确答案:
第41题,OpenMP主要是通过____来更高层抽象的多线程编程。
A、设计实现新的语言
B、为现有语言提供大量库函数
C、为现有语言扩展编译指示
D、新编译器实现自动并行化
正确答案:
第42题,执行pthread_rwlock_rdlock时,____的情况下加锁成功。
A、已有一个线程上了写锁
B、已有多个线程上了写锁
C、已有多个线程上了读锁
D、已有多个线程上了读锁和写锁
正确答案:
第43题,有大量分 拿答案加微信支指令的程序不适合下面哪种体系结构上进行并行化?
A、SISD
B、SIMD
C、SPMD
D、MIMD
正确答案:
第44题,任务依赖图的平均并发度的定义是____。
A、顶点权重之和
B、顶点数
C、各层平均顶点数
D、顶点权重之和/关键路径长度
正确答案:
第45题,一个AVX寄存器最多存放____个整型数。
A、2
B、4
C、8
D、1
正确答案:
第4 题,n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
A、肯定不是代价最优
B、肯定是代价最优
C、不确定是否代价最优
D、以上皆错
正确答案:
第41题,适合进行SIMD并行化的串行程序特点不包括____。
A、大数据对象
B、数据项连续存储
C、流式计算
D、算术计算密集
正确答案:
第48题,我国最早夺得全球超级计算机计算能力冠军的是____。
A、天河1号
B、天河1A
C、天河2号
D、神威.太湖之光
正确答案:
第49题,对单精度浮点计算,MMX最高实现____路并行。
A、2
B、4
C、8
D、1
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。
A、_mm_set_ps
B、_mm_set1_ss
C、_mm_setzero_ss
D、_mm_setzero_ps
正确答案: |