奥鹏南开大学22春学期《并行程序设计》在线作业答案-2

1144766066 · 发表于 2022-5-5 22:25:56

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）并行程序设计-[奥鹏南开大学]22春学期（高起本1709、全层次1803-2103）《并行程序设计》在线作业答案
试卷总分:100 得分:100
第1题,对单精度浮点计算MMX最高实现路并行
A、2
B、4
C、8
D、16
正确答案:

第2题,从线程检查主线程是否要求它退出应采用
A、pthread_join
B、pthread_cancel
C、pthread_testcancel
D、pthread_exit
正确答案:

第3题,条件变量相对于互斥量的优点是
A、是多源状态
B、加锁解锁开销低
C、条件不成立时阻塞线程并自动解锁加锁
D、以上皆错
正确答案:

第4题,编写矩阵乘法的SSE程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开
A、2
B、4
C、8
D、16
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,floata[64]fori=0i60i+=4Va=a[i+2i+5]系统向量化访存是按16字节对齐的则此向量化程序每个循环步产生个内存访问操作
A、1
B、2
C、3
D、4
正确答案:

第6题,全球500强超算在CPU、网络等硬件上越来越体现出采用的趋势
A、特殊硬件
B、通用硬件
C、非公开硬件
D、廉价硬件
正确答案:

第7题,并行算法设计所做的事情不包括
A、分解计算工作分配给多个处理器
B、保持数据依赖保证结果正确
C、确保不能产生重复计算
D、尽量降低通信等额外开销
正确答案:

第8题,CPUcache大小为32KB64*64的两个矩阵进行加法计算下面说法正确的是
A、可利用cache时间局部性优化性能
B、可利用cache空间局部性优化性能
C、可通过矩阵分片优化性能
D、访存方面雅优化可能
正确答案:

第9题,pthreadjoin的作用是
A、强制终止指定线程
B、检测指定线程是否结束
C、等待指定线程结束才返回
D、向指定线程发送数据
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,使用雅法直接实现"主线程等待4个从线程完成任务"
A、1个信号量
B、障碍
C、1个互斥量
D、4个互斥量
正确答案:

第11题,OpenMP并行模型是一种编程模型
A、静态线程
B、动态线程
C、混合线程
D、众核
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,关于MPIrecv对消息的区分下列说法正确的是
A、只能使用消息标签
B、可以使用MPI_ANY_TAG
C、可以使用消息名
D、可以使用端口号
正确答案:

第13题,推动GPU应用于通用高性能计算爆发式增长的开发工具是
A、OpenGL
B、OpenCL
C、DirectX
D、CUDA
正确答案:

第14题,OpenMP是的一个常见替代
A、SSE
B、MPI
C、Pthread
D、CUDA
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,一个AVX寄存器最多存放个整型数
A、2
B、4
C、8
D、16
正确答案:

第16题,一个Neon寄存器最多存放个整型数
A、2
B、4
C、8
D、16
正确答案:

第17题,每个AVX寄存器宽度为位
A、64
B、128
C、256
D、512
正确答案:

第18题,以下是MPI基本原语
A、MPI_barrier
B、MPI_Comm_numprocs
C、MPI_Comm_rank
D、MPI_Comm_Send
正确答案:

第19题,天河1号、天河2号、神威太湖之光总体上都是架构
A、单核
B、多核
C、众核
D、集群
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,编写矩阵乘法的Neon程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开
A、2
B、4
C、8
D、16
正确答案:

第21题,执行pthreadrwlockrdlock时的情况下加锁成功
A、已有一个线程上了写锁
B、已有多个线程上了写锁
C、已有多个线程上了读锁
D、已有多个线程上了读锁和写锁
正确答案:

第22题,AVX是平台的SIMD架构
A、x86
B、POWER
C、SPARC
D、ARM
正确答案:

第23题,和一对多广播对应的组通信操作是
A、多对一收集
B、多对多收集
C、多对一归约
D、多对多归约
正确答案:

第24题,两个n*n的矩阵相乘将所有n^2个乘法计算划分给不同进程再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素这是一种划分的数据并行
A、输入数据
B、中间结果
C、输出数据
D、临时数据
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,为防止编译器不支持OpenMP应使用实现OpenMP代码和普通代码的条件编译
A、"#include "
B、"#pragma omp parallel"
C、"#ifdef _OPENMP"
D、"#define _OPENMP"
正确答案:

第26题,对矩阵每行排序的程序进行多线程并行化对矩阵采用
A、简单均匀块划分即可保证负载均衡
B、循环划分才能实现负载均衡
C、动态划分才能实现负载均衡
D、随机划分才能实现负载均衡
正确答案:

第27题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间
A、任意一个串行算法
B、作为并行算法基础的那个串行算法
C、已知最优的串行算法
D、所有串行算法的平均时间
正确答案:

第28题,当处理器数量不变时随着问题规模增大效率增大对成立
A、部分并行算法
B、所有并行算法
C、所有并行算法都不
D、以上皆错
正确答案:

第29题,使用一个信号量实现"主线程等待4个从线程完成任务"信号量初始值应设置为
A、0
B、1
C、2
D、4
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,OpenMP循环划分策略不包括
A、static
B、fixed
C、dynamic
D、guided
正确答案:

第31题,矩阵乘法问题更适合使用MPI的编程模型
A、阻塞的
B、非阻塞的
C、对等的
D、主从的
正确答案:

第32题,将寄存器设置为4个给定单精度浮点数的SSEintrinsics指令是
A、_mm_set_ps
B、_mm_set1_ss
C、_mm_setzero_ss
D、_mm_setzero_ps
正确答案:

第33题,控制流语句进行SIMD并行化很困难的原因是控制流语句导致
A、连续数据执行不同指令
B、连续数据执行相同指令
C、同一数据执行不同指令
D、同一数据执行相同指令
正确答案:

第34题,n个节点的超立方构造成本为
A、O(logn)
B、O(sqrt(n))
C、O(n)
D、O(nlogn)
正确答案:

第35题,MMX有个专用寄存器
A、4
B、8
C、16
D、32
正确答案:

第36题,pthreadrwlockrdlock是对读写锁进行操作
A、加锁
B、解锁
C、加读琐
D、加写锁
正确答案:

第37题,对下面程序说法正确的是
pragmaompparallelfornumthreadsthreadcountreduction+sum
fork=1k=nk++{sum+=factor/2*k1factor=factor
}
A、破坏了数据依赖
B、未破坏数据依赖
C、取决于变量声明
D、比临界区方式性能差
正确答案:

第38题,以下说法正确的是
A、多对多广播的高效算法基于一对多广播的高效算法
B、多对多归约的高效算法基于多对一归约的高效算法
C、多对多广播的高效算法基于串行的一对多广播算法
D、以上皆错
正确答案:,C,D

第39题,为了实现向量计算SIMD架构还需提供
A、更大的内存容量
B、更快的内存传输
C、更宽的寄存器
D、更快的网络传输
正确答案:

第40题,Pthread不支持
A、创建并发执行线程
B、同步
C、非显式通信
D、自动并行化
正确答案:

第41题,一个AVX寄存器最多存放个单精度浮点数
A、2
B、4
C、8
D、16
正确答案:

第42题,SSEintrinsicsmmstoreupd命令的功能是
A、对齐标量存单精度浮点数
B、未对齐标量存单精度浮点数
C、对齐向量存双精度浮点数
D、未对齐向量存双精度浮点数
正确答案:

第43题,一个Neon寄存器最多存放个单精度浮点数
A、2
B、4
C、8
D、16
正确答案:

第44题,在用pthreadmutexlock对互斥量进行加锁时若其已上锁则线程进入状态
A、初始化
B、阻塞
C、继续执行
D、销毁
正确答案:

第45题,对单精度浮点计算SSE最高实现路并行
A、2
B、4
C、8
D、16
正确答案:

第46题,SSEintrinsicsmmhaddps命令的功能是
A、寄存器间单精度浮点数向量加法
B、寄存器间双精度浮点数向量加法
C、寄存器内单精度浮点数加法
D、寄存器内双精度浮点数加法
正确答案:

第47题,有大量分支指令的程序不适合下面哪种体系结构上进行并行化
A、SISD
B、SIMD
C、SPMD
D、MIMD
正确答案:

第48题,对于加速比S和处理器数量p下列说法正确的是
A、有可能Sp
B、必然Sp
C、不可能S=p
D、两者雅关联
正确答案:

第49题,在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术则多线程版本串行版本
A、肯定快于
B、肯定慢于
C、可能快于
D、以上皆错
正确答案:

答案来源：雅宝题库QV同步1144766066网（www.ybaotk.com）,两个矩阵相乘若矩阵总规模小于cache大小则优化访存的最佳方法是
A、先将两个矩阵读入cache再进行乘法
B、先转置第一个矩阵再进行乘法
C、先转置第二个矩阵再进行乘法
D、以上皆错
正确答案:

奥鹏南开大学22春学期《并行程序设计》在线作业答案-2

天涯海角也要找到Ni：奥鹏南开大学22春学期《并行程序设计》在线作业答案-2

相关帖子

QQ微信同步：1144766066。

服务

网站

战略合作