|

楼主 |
发表于 2023-8-25 09:22:26
|
显示全部楼层
pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.破坏了数据依赖
B.未破坏数据依赖
C.取决于变量声明
D.比临界区方式性能差
答案:
13.使用____无法直接实现"主线程等待4个从线程完成任务"。
A.1个信号量
B.障碍
C.1个互斥量
D.4个互斥量
答案:
14.神威.太湖之光采用的申威26010处理器是一种____架构。
A.单核
B.多核
C.众核
D.多CPU
答案:
15.SIMD并行模式是将多个____运算打包并发执行。
A.不同
B.相同
C.混合
D.依赖
答案:B
16.超级计算机制造越来越关注的一个新的指标是____。
A.计算能力
B.存储能力
C.占地面积
D.功耗
答案:
17.为了实现向量计算,SIMD架构还需提供____。
A.更大的内存容量
B.更快的内存传输
C.更宽的寄存器
D.更快的网络传输
答案:
18.超立方中相邻节点二进制编号____。
A.至少差1位
B.至多差1位
C.恰好差1位
D.差异不固定
答案:
19.pthread_join通过____指定要等待的线程。
A.pthread_create返回的线程句柄
B.线程的系统ID
C.创建线程时设置的线程号
D.创建线程时设置的线程名
答案:
20.每个MMX寄存器宽度为____位。
A.32
B.64
C.128
D.256
答案:B
21.一个Neon寄存器最多存放____个短整型数。
A.2
B.4
C.8
D.16
答案:
22.对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A.声明语句
B.条件分支语句
C.循环语句
D.输入输出语句
答案:
23.n*n的两个矩阵相乘,问题规模为____。
A.n
B.n^2
C.2n^2
D.n^3
答案:
24.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
A.初始化
B.第二个矩阵转置循环
C.矩阵元素乘-加计算的循环
D.结果输出
答案:
25.关于MPI是什么,以下说法错误的是____。
A.一种消息传递编程模型标准
B.一种共享内存编程模型标准
C.编程角度看是C++/Fortran等的库
D.基于SPMD模型
答案:B
26.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
答案:
27.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A.按编号顺序依次从从进程接收结果
B.按编号逆序依次从从进程接收结果
C.按编号顺序、逆序交替从从进程接收结果
D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
答案:
28.以下____是MPI基本原语。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
答案:
29.对于效率E,下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能>1
D.可能随着处理器数量增大趋向于0
答案:B
30.n个节点的二维mesh构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答案:
31.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
答案:
32.对于加速比S和处理器数量p,下列说法正确的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.两者无关联
答案:
33."提升时钟频率"方式提高CPU性能的限制因素不包括____。
A.物理制造局限
B.功耗问题
C.散热问题
D.软件设计问题
答案:
34.OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
答案:
35.全球500强超算越来越体现出依赖____提供强大计算能力的趋势。
A.单核CPU
B.多核CPU
C.FPGA
D.众核协处理器
答案:
36.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法
B.寄存器间双精度浮点数向量加法
C.寄存器内单精度浮点数加法
D.寄存器内双精度浮点数加法
答案:
37.OpenMP不能实现的是____。
A.负责创建和管理线程
B.隐藏栈管理
C.提供同步机制
D.自动并行化
答案:
38.两个矩阵相乘,将矩阵划分为固定大小的子矩阵,变元素运算为子矩阵运算,是使用利用数据访问的_____达到更高的cache命中率。
A.时间局部性
B.空间局部性
C.计算局部性
D.混合局部性
答案:
39.SSE运算指令中未提供____指令。
A.算术运算
B.矩阵运算
C.逻辑运算
D.比较运算
答案:B
40.C/C++语言存储二维数组采取____。
A.行主次序存储
B.列主次序存储
C.交错式存储
D.对角线存储
答案:
41.SSE intrinsics _mm_store_ss命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存双精度浮点数
C.对齐标量存单精度浮点数
D.未对齐标量存双精度浮点数
答案:
42.n个节点的线性阵列构造成本为____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
答案:
43.定期评选全球计算能力最强的超级计算机的国际组织是____。
A.top500
B.green500
C.graph500
D.super500
答案:
44.对于搜索分解,下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
答案:
45.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
答案:B
46.主线程通过____函数获取特定线程的返回结果。
A.pthread_create
B.pthread_join
C.pthread_cancel
D.pthread_get
答案:B
47.静态任务划分相对于动态任务划分的缺点是____。
A.可能导致负载不均
B.通信开销高
C.计算复复杂度高
D.任务粒度粗
答案:
48.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是
A.读取x存在数据依赖,不能并发进行
B.累加顺序被改变,结果是错误的
C.加法操作是简单运算,无需同步
D.加法操作不是原子操作,需要同步保证数据依赖
答案:
49.GPU相对于其他众核产品的优势不包括____。
A.平台普及
B.有CUDA这样易学的开发工具
C.性价比高
D.由英伟达公司一家把控
答案:
50.SSE数据移动指令分类不包括____。
A.对齐传输
B.未对齐传输
C.标量传输
D.缓存传输
答案:
答案来源:www.ybaotk.com
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|