答案来源:雅宝题库交流网(www.ybaotk.com)-[南开大学(本部)]20秋学期(1109、1803、1809、1903、1909、2003、2009 )《并行程序设计》在线作业拿答案加微信:1144766066
试卷总分 拿答案加微信:100 得分 拿答案加微信:100
第1题,SSE指令移动单精度浮点数,不能实现____。
A、将 4位数据移动到SSE寄存器高位
B、将 4位数据移动到SSE寄存器低位
C、将32位数据移动到SSE寄存器指定位置
D、在两个SSE寄存器高/低 4位间移动
正确答案:
第2题,以下超级计算机中,____不是SIMD架构。
A、CDCSTAR-100
B、151
C、银河
D、天河1号
正确答案:
第3题,下列指令集中___不是SIMD指令集。
A、SSE
B、Neon
C、AVX
D、EMT 4
正确答案:
第4题,SSE寄存器A和B中元素分 拿答案加微信别为A1 A2 A3 A4和B1 B2 B3 B4(均为由低到高),则执行C=blend(A, B, 0x05)后,C中元素为
A、A1 A2 B3 B4
B、B1 B2 A3 A4
C、A1 B2 A3 B4
D、B1 A2 B3 A4
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),以下哪条不是推动并行计算发展的因素?
A、存储是系统瓶颈
B、单CPU发展已能满足应用需求
C、利用标准硬件构造并行机令升级容易
D、编程环境标准化逐步发展
正确答案:
第 题,在使用互斥量之前必须对其进行____。
A、初始化
B、加锁
C、解锁
D、销毁
正确答案:
第1题,全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
A、特殊硬件
B、通用硬件
C、非公开硬件
D、廉价硬件
正确答案:
第8题,有大量分 拿答案加微信支指令的程序不适合下面哪种体系结构上进行并行化?
A、SISD
B、SIMD
C、SPMD
D、MIMD
正确答案:
第9题,Pthread不支持____。
A、创建并发执行线程
B、同步
C、非显式通信
D、自动并行化
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分 拿答案加微信给不同进程,这是一种划分 拿答案加微信____的数据并行策略。
A、输入数据
B、中间结果
C、输出数据
D、临时数据
正确答案:
第11题,当处理器数量不变时,随着问题规模增大,加速比____。
A、所有算法都增大
B、所有算法都减小
C、代价最优算法都增大
D、代价最优算法都减小
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。
A、先将两个矩阵读入cache再进行乘法
B、先转置第一个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错
正确答案:
第13题,关于消息传递编程的特点,以下说法正确的是____。
A、与共享内存一样有竞争条件
B、编程简单
C、需程序员考虑局部性
D、雅需考虑进程间通信
正确答案:
第14题,编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A、创建和管理线程代码
B、循环划分 拿答案加微信给线程的代码
C、找出数据依赖的代码
D、线程同步的代码
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
A、肯定不是代价最优
B、肯定是代价最优
C、不确定是否代价最优
D、以上皆错
正确答案:
第1 题,任务依赖图中权重之和最长的路径称为____。
A、最大任务
B、关键路径
C、平均并发度
D、最短路径
正确答案:
第11题,将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是____。
A、外层存在,内层不存在
B、外层不存在,内层存在
C、两层都不存在
D、两层都存在
正确答案:
第18题,在下面问题中,SIMD并行最不适合____。
A、向量加法
B、向量中元素排序
C、矩阵向量乘法
D、矩阵加法
正确答案:
第19题,OpenMP编译指示是以____开头的。
A、& uot;#include& uot;
B、& uot;#ifdef& uot;
C、& uot;#pragam& uot;
D、& uot;#else& uot;
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),一个SSE寄存器可容纳____个短整型数。
A、2
B、4
C、8
D、1
正确答案:
第21题,当前并行软件面临的主要挑战不包括____。
A、能耗
B、伸缩性
C、研发周期
D、可靠性
正确答案:
第22题,创建线程时,我们通过____将线程号分 拿答案加微信别传递给每个线程。
A、全局变量
B、局部变量
C、动态分 拿答案加微信配变量
D、pthread_create的& uot;线程函数参数& uot;参数
正确答案:
第23题,利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A、降低了访存延迟
B、隐藏了访存延迟
C、利用了cache空间局部性
D、利用了cache时间局部性
正确答案:
第24题,R*=1.3;G+=1.8;B+=1.2;X*=1.1,此程序片段可进行SIMD并行化吗?
A、不可以
B、可以
C、不确定
D、以上皆错
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),SSE intrinsics _mm_loadu_ps命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐向量读取双精度浮点数
D、未对齐向量读取双精度浮点数
正确答案:
第2 题,互斥量是一种____同步机制。
A、一元状态
B、二元状态
C、多元状态
D、以上皆错
正确答案:
第21题,AVX是____平台的SIMD架构。
A、x8
B、POWER
C、SPARC
D、ARM
正确答案:
第28题,除了用于解决竞争条件外,互斥量还可用于____。
A、解决共享资源竞争的问题
B、解决并发度低的问题
C、解决通信开销大的问题
D、解决负载不均的问题
正确答案:
第29题,在分 拿答案加微信布式内存架构编程中,进程间不能____。
A、进行通信
B、进行同步
C、发送和接收消息
D、通过读写变量交换数据
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),关于OpenMP循环并行程序的编写,下列说法中不正确的是____。
A、程序员雅需编写线程创建和管理代码
B、程序员雅需编写循环划分 拿答案加微信代码
C、程序员需指出哪个循环应并行
D、程序员需编写线程同步代码
正确答案:
第31题,限制CPU内流水线深度的因素包括_____。
A、指令复杂程度
B、分 拿答案加微信支预测性能
C、CPU核心数
D、CPU cache大小
正确答案:
第32题,SSE数据移动指令分 拿答案加微信类不包括____。
A、对齐传输
B、未对齐传输
C、标量传输
D、缓存传输
正确答案:
第33题,将t个线程的局部结果汇总,可采用递归分 拿答案加微信解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。
A、Θ(1)
B、Θ(logt)
C、Θ(t)
D、Θ(tlogt)
正确答案:
第34题,一个SSE寄存器可容纳____个双精度浮点数。
A、2
B、4
C、8
D、1
正确答案:
第35题,对这样的循环for (i=0; i100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是____。
A、循环划分 拿答案加微信
B、循环消除
C、循环展开
D、以上皆错
正确答案:
第3 题,在128位的SIMD寄存器中,我们不能保存____。
A、1 个8位整数
B、8个1 位短整型
C、4个32位整型
D、1 个字符的字符串
正确答案:
第31题,float a[ 4]; for (i=0; i 0; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按1 字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。
A、1
B、2
C、3
D、4
正确答案:
第38题,两个n*n的矩阵相乘,将所有n^2个乘法计算划分 拿答案加微信给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分 拿答案加微信____的数据并行。
A、输入数据
B、中间结果
C、输出数据
D、临时数据
正确答案:
第39题,忙等待方法解决竞争条件的思路是____。
A、令CPU一直处于忙碌状态雅法产生竞争条件
B、令存在数据依赖的内存操作充分 拿答案加微信并行
C、强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化
D、以上皆错
正确答案:
第40题,SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:1],若imm8[j]=0则表示___。
A、将第一个源寄存器的第j个元素放在目标寄存器位置0
B、将第二个源寄存器的第j个元素放在目标寄存器位置0
C、将第一个源寄存器的第j个元素放在目标寄存器位置j
D、将第二个源寄存器的第j个元素放在目标寄存器位置j
正确答案:
第41题,CUDA线程层次中不包括____。
A、Kernel
B、Grid
C、Block
D、Thread
正确答案:
第42题,将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。
A、_mm_set_ps
B、_mm_set1_ss
C、_mm_setzero_ss
D、_mm_setzero_ps
正确答案:
第43题,float a[ 4]; for (i=0; i 4; i+=4) Va = a[i:i+3]; 此向量化程序内存访问完全对齐,每个循环步恰好是一次对齐的内存访问,则该系统向量化访存是按____字节对齐。
A、8
B、1
C、32
D、 4
正确答案:
第44题,对单精度浮点计算,AVX最高实现____路并行。
A、2
B、4
C、8
D、1
正确答案:
第45题,MPI默认点对点通信模式是____。
A、阻塞的
B、非阻塞的
C、对等的
D、主从的
正确答案:
第4 题,以下____是MPI基本原语。
A、MPI_barrier
B、MPI_Comm_numprocs
C、MPI_Comm_rank
D、MPI_Comm_Send
正确答案:
第41题,在SSE intrinsics程序中双精度浮点数数据类型是____。
A、__m128
B、__m128f
C、__m128d
D、__m128i
正确答案:
第48题,在对互斥量进行解锁时,还会执行____操作。
A、互斥量初始化
B、互斥量销毁
C、唤醒阻塞线程
D、以上皆错
正确答案:
第49题,SSE intrinsics _mm_load_ss命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐标量读取单精度浮点数
D、未对齐标量读取单精度浮点数
正确答案:
答案来源:雅宝题库交流网(www.ybaotk.com),求解同一个问题的4个并行算法的等效率函数分 拿答案加微信析结果如下,其中____的可扩展性最优。
A、Θ(plogp)
B、Θ(p^2)
C、Θ(p^2logp)
D、Θ(p^3)
正确答案: |